随着互联网大数据的日益火热,各大企业对于数据的需求逐日增加。大数据浪潮的袭来,带来了数据分析师岗位的就业。基于此,对前程无忧关于数据分析师岗位招聘的数据进行系统的分析。
本分析报告解决以下三个问题:
1. 数据分析师岗位在哪些城市需求量较大?
2. 数据分析师岗位的薪资待遇情况是如何?
3. 数据分析师岗位薪资待遇的发展趋势如何?
1. 准备数据源
利用爬虫工具对前程无忧进行数据分析岗搜索结果进行爬虫,提取分析字段:职位名称、公司名称、工作城市、薪资待遇、学历要求、工作经验以及公司规模。
2. 数据清洗
2.1. 清洗学历要求字段
因前程无忧学历项不是必填项,在爬虫过程中会抓取错误数据,需要清洗掉。结果如下。
处理过程:将包含“招”的单元格直接替换为“无要求”
2.2. 清洗工作城市
将类似于“广州-天河区”调整为“广州”,便于后期统计城市数据。
处理过程:利用数据分列直接调整。
2.3. 删除数据重复项
职位ID是唯一识别码,所以对职位ID进行排重。
处理过程:利用删除重复项功能进行删除。
2.4. 清洗薪资待遇
处理过程:
最低薪资:利用FIND函数求得“-”从左开始第几位,然后利用LEFT函数从左开始取值,取值范围比“-”位数少1即可;加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
最高薪资:利用LEN函数求得单元格字符总长度,再减去利用FIND函数求得“-”的位数,即可求得“-”以后的字符总长度。利用MID函数取值“-”以后的字符再减去3(3即为千/月)。加入IF函数和ISNUMBER函数,判定如果薪资待遇包含“万”,那么计算需要乘以10。
平均薪资:利用AVERAGE函数直接求平均值。
删除【薪资待遇】列
2.5. 清洗异常值
将不包含“数据分析”、“数据运营”和“分析师”等字符的职位删除掉。
处理过程:利用FIND函数查找特殊字符并返回结果值,利用COUNT函数计数,利用IF函数判定,如果计数成功则为“是”,表示符合数据分析师岗位;如果计数失败则为“否”,表示不符合,可以删除。
剩余2293条数据。
3. 数据结果可视化
3.1. 数据分析师岗位在哪些城市需求量较大?
小结,如果从事数据分析师岗位,在北上广深可以提升成功的概率。
3.2. 数据分析师岗位的薪资待遇情况是如何?
依据柱形图所示,数据分析师岗位大部分集中在1-3年和3-5年,属于年轻化和朝阳化的行业。5-10年的岗位急剧下降,也就是意味着如果5年后没有能力的提升,那么你的就业竞争就会很大。
依据柱形图所示,数据分析师薪资待遇深圳和北京最高,其次是上海和杭州。追求高薪可以去这些城市发展。
3.3. 数据分析师岗位薪资待遇的发展趋势如何?
依据折线图所示,随着工作年限的逐步增加,薪资待遇也会逐步增加。
1)从就业需求来讲,大量的工作机会集中在北上广深和新一线城市。如果想从事数据分析工 作,去这些城市将提升你成功的条件概率。
2)从薪资待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。
3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-3年和3-5年。对于数据分析师来说,5年的就业岗位数量急剧下降,如果在5年之内没有提升自己的能力,以后的竞争压力会比较大。
4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。
注:因特殊原因,数据图表均未标识数据来源以及爬虫工具名称,请忽略此点。
请扫码关注: