热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

爬取6874条数据,告诉你数据分析师的薪资待遇~!

公众号:中国统计网01报告背景随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基

公众号:中国统计网

01 报告背景

随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基于此,对前程无忧关于数据分析师岗位招聘的数据进行系统的分析。
02 分析目的
本分析报告解决以下三个问题:
1. 数据分析师岗位在哪些城市需求量较大?
2. 数据分析师岗位的薪资待遇情况是如何?
3. 数据分析师岗位薪资待遇的发展趋势如何?
03 分析报告

1. 准备数据源
利用爬虫工具对前程无忧进行数据分析岗搜索结果进行爬虫,提取分析字段:职位名称、公司名称、工作城市、薪资待遇、学历要求、工作经验以及公司规模。
640?wx_fmt=jpeg
2. 数据清洗
2.1. 清洗学历要求字段
因前程无忧学历项不是必填项,在爬虫过程中会抓取错误数据,需要清洗掉。结果如下。
处理过程:将包含“招”的单元格直接替换为“无要求”
640?wx_fmt=jpeg
2.2. 清洗工作城市
将类似于“广州-天河区”调整为“广州”,便于后期统计城市数据。
处理过程:利用数据分列直接调整。
640?wx_fmt=jpeg
2.3. 删除数据重复项
职位ID是唯一识别码,所以对职位ID进行排重。
处理过程:利用删除重复项功能进行删除。

640?wx_fmt=jpeg
2.4. 清洗薪资待遇
  • 将日薪直接删除,日薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将年薪直接删除,年薪234个数据均为同一家公司发布的招聘信息,对整体数据会存在一定的干扰性。

  • 将月薪的区间范围调整为最低值和最高值。

处理过程:
最低薪资:利用FIND函数求得“-”从左开始第几位,然后利用LEFT函数从左开始取值,取值范围比“-”位数少1即可;加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
最高薪资:利用LEN函数求得单元格字符总长度,再减去利用FIND函数求得“-”的位数,即可求得“-”以后的字符总长度。利用MID函数取值“-”以后的字符再减去3(3即为千/月)。加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
平均薪资:利用AVERAGE函数直接求平均值。
删除【薪资待遇】列
640?wx_fmt=jpeg
2.5. 清洗异常值
将不包含“数据分析”、“数据运营”和“分析师”等字符的职位删除掉。

处理过程:利用FIND函数查找特殊字符并返回结果值,利用COUNT函数计数,利用IF函数判定,如果计数成功则为“是”,表示符合数据分析师岗位;如果计数失败则为“否”,表示不符合,可以删除。
剩余2293条数据。
640?wx_fmt=jpeg
3. 数据结果可视化
3.1. 数据分析师岗位在哪些城市需求量较大?

640?wx_fmt=jpeg
640?wx_fmt=jpeg

  • 依据柱形图所示,数据分析师岗位在上海、广州、深圳和北京需求是偏多的。

  • 依据饼形图所示,数据分析师在上海、广州、深圳和北京的需求量接近总数的67%。

小结,如果从事数据分析师岗位,在北上广深可以提升成功的概率。
3.2. 数据分析师岗位的薪资待遇情况是如何?

640?wx_fmt=jpeg

依据柱形图所示,数据分析师岗位大部分集中在1-3年和3-5年,属于年轻化和朝阳化的行业。5-10年的岗位急剧下降,也就是意味着如果5年后没有能力的提升,那么你的就业竞争就会很大。

640?wx_fmt=jpeg

依据柱形图所示,数据分析师薪资待遇深圳和北京最高,其次是上海和杭州。追求高薪可以去这些城市发展。
3.3. 数据分析师岗位薪资待遇的发展趋势如何?
640?wx_fmt=jpeg
依据折线图所示,随着工作年限的逐步增加,薪资待遇也会逐步增加。

报告总结

1)从就业需求来讲,大量的工作机会集中在北上广深和新一线城市。如果想从事数据分析工 作,去这些城市将提升你成功的条件概率。

2)从薪资待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年和3-5年。对于数据分析师来说,5年的就业岗位数量急剧下降,如果在5年之内没有提升自己的能力,以后的竞争压力会比较大。

4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。


注:因特殊原因,数据图表均未标识数据来源以及爬虫工具名称,请忽略此点。

请扫码关注:

640?wx_fmt=other



推荐阅读
  • 本文详细介绍了Python编程语言的学习路径,涵盖基础语法、常用组件、开发工具、数据库管理、Web服务开发、大数据分析、人工智能、爬虫开发及办公自动化等多个方向。通过系统化的学习计划,帮助初学者快速掌握Python的核心技能。 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 本文详细探讨了网站流量统计中常用的三个关键指标:页面浏览量(PV)、独立访客数(UV)和独立IP数(IP)。通过分析这些指标的定义、计算方法及其应用场景,帮助网站运营者更好地理解用户行为,优化网站内容与用户体验。 ... [详细]
  • 云计算的优势与应用场景
    本文详细探讨了云计算为企业和个人带来的多种优势,包括成本节约、安全性提升、灵活性增强等。同时介绍了云计算的五大核心特点,并结合实际案例进行分析。 ... [详细]
  • 在PHP后端开发中遇到一个难题:通过第三方类文件发送短信功能返回的JSON字符串无法解析。本文将探讨可能的原因并提供解决方案。 ... [详细]
  • 本文详细介绍了头条搜索引擎对网站内容的抓取、解析及索引过程,探讨了收录量与索引量的区别,并提供了实用工具和技巧来监控网站的收录情况。通过这些信息,网站管理员可以更好地理解搜索引擎的工作机制,优化网站内容以提高其在搜索结果中的可见性。 ... [详细]
  • 智能投顾机器人:创业者如何应对新挑战?
    随着智能投顾技术在二级市场的兴起,针对一级市场的智能投顾也逐渐崭露头角。近日,一款名为阿尔妮塔的人工智能创投机器人正式发布,它将如何改变投资人的工作方式和创业者的融资策略? ... [详细]
  • Python3 中使用 lxml 模块解析 XPath 数据详解
    XPath 是一种用于在 XML 文档中查找信息的路径语言,同样适用于 HTML 文件的搜索。本文将详细介绍如何利用 Python 的 lxml 模块通过 XPath 技术高效地解析和抓取网页数据。 ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 本文详细介绍了HTML中标签的使用方法和作用。通过具体示例,解释了如何利用标签为网页中的缩写和简称提供完整解释,并探讨了其在提高可读性和搜索引擎优化方面的优势。 ... [详细]
  • 本文介绍了如何在最新版本的Visual Studio Code中配置中文语言包,使用户能够更便捷地使用中文界面。文章详细描述了安装和配置步骤,并提供了相关补充说明。 ... [详细]
  • CATSearch是一个针对CATIA V5和3DEXPERIENCE平台的开源二次开发项目,由硬核小青年发起并维护。该项目旨在解决3DE搜索功能不稳定的问题,通过API调用提供更快速、准确的搜索体验。本文将详细介绍该插件的功能及使用方法。 ... [详细]
  • Codeforces Round #566 (Div. 2) A~F个人题解
    Dashboard-CodeforcesRound#566(Div.2)-CodeforcesA.FillingShapes题意:给你一个的表格,你 ... [详细]
author-avatar
家有吃货_魏ranran
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有