热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

大数据告诉你要不要当公务员?

大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我要准备国考了。”没错,这就是最近学姐和我之间的主要话题。什么考公务员考

大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我要准备国考了。”

没错,这就是最近学姐和我之间的主要话题。什么考公务员考到哪里啦,公务员工资高不高啦,工作是不是很轻松啦。其实我觉得这些都不是什么重要因素。收入?轻松?还要考虑这些事?难道当一名光荣的公务员的主要原因不应当是希望自己能够鞠躬尽瘁死而后已地致力于为人民服务的伟大事业吗?

当然,这些话我并未出口,大清早的我实在不想再被学姐打了。但为了结束这个絮絮叨叨的话题,我还是决定帮助她研究这么一个小问题:

学姐啊,公务员收入什么的我实在搞不清楚,但我们不妨来看看:当一名光荣的公务员,到底有多辛苦呢?

假如只是四处打听一下的话,会发现关于公务员的消息往往都是两极分化的。城市公共部门工作的小伙伴们总是有的忙碌有的闲。毫无疑问,个体的遭遇总是剧情离奇且难以预料的。但是总体情况如何呢?

就全国而言太过复杂,还是以魔都为例吧。我们登录上海市人民政府的官方网站,可以看到魔都政府已经非常贴心地把各级各类的城市公共部门信息都公布在了网站上,另加基层一线的上海所有镇级人民政府,我们把这些部门(共计704个)整理下来,按照类型和级别把它们放在地图上,可以看到下图:

那么,我们可以简单地将在这700多个公共部门工作的人,视为上海的主要公务员群体。那么,他们总体工作状态怎样呢?

事实上,我们没有办法去查看每个部门的打卡机,通过精确的出勤信息做出精准的分析。但非常恰巧的是,我的电脑正好放着一组来自某互联网公司(见注1)的关于上海的移动设备源大样本数据(约300万个源吧)。太好了,让我们用这组数据作为一个抽样,来挖掘一下魔都公共部门的工作状况吧。

第一步,我们需要定义这些公共部门在法定时间内的工作状态

假设,这些公共部门的公务员们会认真地且相对固定地于8:00至18:00期间在办公室上班,那么,我们则需要找到每个办公地点里在以上时段内高频度出现的移动设备源即可。而这些移动源的集聚状况在某种意义上代表了该部门的法定时间工作状况((根据地址频度显著性、分时段地址差异性等各项指标,从300万个样本中共筛出来质量较高的约2万个样本是落在704栋办公楼的空间范围内的)。我们将移动源按位置汇总到各个单位,画出图来后大概长这样。

从上图中我们可以看到,工作人员规模最大的公共部门均分布在内环线以内,其中浦东新区和徐汇区的若干公共部门在工作人员总数量上遥遥领先,甚至超过了人民广场。而这些只是白天法定时段内的工作状况。

第二步,我们需要定义这些公共部门在法定时间之外的工作状态


假如某单位工作异常繁重,而领导的爱好则是快下班时过来说,“小团啊,这个文件你写一下我明天早上要。”为了满足领导的爱好,可怜的公务员下了班之后往往不能直接回家,经常还得在18:00到22:00这个期间仍然继续鞠躬尽瘁地在办公室里加班。

基于以上假设,为了描绘出公共部门在法定时间之外的工作状态(其实就是加班状况),我们需要从以上数据中再一次筛选出以上时段内(18:00至22:00)仍然在工作地点高频出现的移动源。筛选完这些数据(差不多剩下8000个样本),将其汇总到部门后,画出图来大概长这样:

可以看到,加班总人数的分布和工作总人数分布基本相符。浦东与徐汇仍然领先,而人民广场附近也逐渐追赶上来。具体观察的话,在法定工作时间之外高频度移动源聚集量最大的部门是(冠军来了):

浦东新区地方税务局

看,我们纳税纳得连收税的都得加班加点了。

但是,我们需要注意到的是,加班人员总量(法定时间之外的)并不能完全反应该部门的忙碌程度,也许这个部门本来就人多呢。因此,相对真实地反应该部门的加班状况,我们还需要第三步。

好的,第三步来了,我们来计算不同公共部门的加班人员占比


很简单,我们将第一步和第二步的分别筛选出的两组数据相除,就可以得到每个部门的加班人员占比,汇总到各部门可以画出下图:

可以看到,市中心高高的红色柱子消失了,它们在郊区零零星星地长了出来。

的确,虽然郊区公共部门的加班工作人员总量与市中心不可比拟,但是其加班人员的比例还是相当高的,而市中心某些地区甚至出现了塌陷。这是怎么回事呢?

这时候,学姐打断我的分析和思考,问道:“会不会是这些郊区的工作人员下了班之后赖在办公室不走喝茶聊天打牌呢?反正我们老家的公务员很多都是这样的,都是五点下班但赖到七八点才回家或者去外面吃饭。”

的确,以我们所能掌握的数据是无法完全排除这个可能的。但是,魔都与一般小城市的差别在于上下班回家的通勤时间天壤之别,以魔都平均通勤时间来计算的话,假如赖到七八点才走,那晚饭就很难指望,估计回到家洗洗弄弄就只能吃宵夜了。
因此,本着关怀的精神,让我们再增加一个步骤。

第四步,验证一下看看,这些加班的公务员们,他们都住得离家远吗?


假设,在领导第二天要看文件的强烈需求下,公务员们虽然很努力地加班,但是不至于总是干通宵啊,一个礼拜也得有个三五天回家睡觉吧,当然睡觉时间可能不会很长,差不多也就是24:00至6:00期间吧。

基于这个假设,我们需要找到步骤二中筛选出的那些移动源在以上时段(24:00至6:00)内高频出现的地点,并将之视为该工作人员的居住点。然后将这些点与工作部门所在地进行连线,便可以画出一张加班人员通勤图:

上图中的红点,标示相应的公共部门所在地;而绿线,则表示加班的公务员回家的通勤方向与通勤距离。

可以看到,分布在远郊的红点们,其中很多的通勤连线都紧紧地联系着市中心,有些甚至是长途跋涉,比如金山、临港等地区。可以这么理解:对于某些在郊区工作的公务员来说,假如一不小心在办公室赖了以后,那他们这天其实也不太用考虑回家这件事了。

学姐忍不住问道:“郊区的公务员真的都住的那么远吗?还是这只是个别现象? ”

我们可以将以上结论做一个分区的统计,请看下图:

从通勤角度来看,的确,大部分市区的加班公务员通勤距离差异不大,保持在8公里左右。但是郊区加班公务员的通勤则差异极大。比如,嘉定、松江、青浦和奉贤,在这四个传统区县里,加班公务员的通勤距离非常短,仅有5公里,估计很多都是本地解决。但对于金山和崇明而言,则达到了12公里以上。

但从加班指数(加班人员占比)上看,每个区也均有不同。可以看到,公务员加班指数排名最高的三个区分别为静安、崇明、和杨浦。加班比例达到了35%(崇明又加班路又远到底是有多惨)。而相对比较轻松的则是金山、嘉定和普陀,其加班比例略低,但也有20%以上。

我愉快地做完了这个分析,试图结束这个话题。但学姐又发话了,“考公务员的话,貌似不是按片考的吧,是按部门吧。”

啊,好像真的是这样(我真的应该认真去看一下公务员考试指南了)。那么好的,让我们按照公共部门的类型整理一下分析结果吧(只包括了按照官网分类标准能够准确分类的,无法准确分类的被我无情地剔除了,对的我就是这么任性),请看下图:

可以看到,加班指数最高的公共部门分别是城市规划部门、其次是人民政府和公安系统。依次排序下来,则是税务、财政、发改。

以上六类虽然通勤距离各有差异,但是加班指数均达到了30%。而相对较为舒适的公共部门看起来是交通系统啊,加班指数最低(约25%),而通勤距离也最短(3公里)。

我若有所思地自言自语道:看来我要劝告那些学城市规划的弟弟妹妹们,赶紧转行学城市交通了才对啊。

这时,学姐第三次发话了,“我觉得你这么分析还是不科学啊。难道区规划局和市规划局、区政府和市政府的加班、国税局和地税局的工作模式一样吗?同一个部门内部可是差异极大的啊。”

学姐真是难缠啊。好吧,让我再次将这些公共部门按照等级分类,分级到市、区、镇三级(魔都基本上没有国家级部门,有少数几个被我无情地剔除掉了,对的我就是这么任性)。请看下图:

额。这个规律也有点过于明显了吧。

我赶紧指着屏幕说道,“喂,学姐你看。市级部门的公务员平均加班比率最低,不到30%,通勤距离也比较短;而镇级加班率最高,通勤更是达到了9.5公里。。。哎,学姐你看啊。”

学姐没有搭腔,我转过头来,发现她已经把手机贴到了耳边,并对我做了一个嘘的手势,我赶紧闭上了嘴。隐隐听到她手机听筒里嘟了两声之后传来接通的声音,然后她赶忙急匆匆地问道:

“喂,妈,你在市里面有人吗?”


本文作者:佚名

来源:51CTO



推荐阅读
  • 三星W799在2011年的表现堪称经典,以其独特的双屏设计和强大的功能引领了双模手机的潮流。本文详细介绍其配置、功能及锁屏设置。 ... [详细]
  • 本文探讨了在地理信息系统中,如何通过图层数据获取任意两条道路的交叉点坐标及其名称。文中详细介绍了实现方法和相关技术细节。 ... [详细]
  • 深入解析TCP/IP五层协议
    本文详细介绍了TCP/IP五层协议模型,包括物理层、数据链路层、网络层、传输层和应用层。每层的功能及其相互关系将被逐一解释,帮助读者理解互联网通信的原理。此外,还特别讨论了UDP和TCP协议的特点以及三次握手、四次挥手的过程。 ... [详细]
  • 本文探讨了 Swapper 工具对系统内存和存储设备(如 SD 卡)的潜在影响,解释其工作原理及使用时需要注意的问题。 ... [详细]
  • 本文介绍了ArcXML配置文件的分类及其在不同服务中的应用,详细解释了地图配置文件的结构和功能,包括其在Image Service、Feature Service以及ArcMap Server中的使用方法。 ... [详细]
  • 在API测试中,我们常常需要通过大量不同的数据集(包括正常和异常情况)来验证同一个接口。如果为每种场景单独编写测试用例,不仅繁琐而且效率低下。采用数据驱动的方式可以有效简化这一过程。本文将详细介绍如何利用CSV文件进行数据驱动的API测试。 ... [详细]
  • 本文详细介绍了如何解决Uploadify插件在Internet Explorer(IE)9和10版本中遇到的点击失效及JQuery运行时错误问题。通过修改相关JavaScript代码,确保上传功能在不同浏览器环境中的一致性和稳定性。 ... [详细]
  • 本文将介绍如何使用 Go 语言编写和运行一个简单的“Hello, World!”程序。内容涵盖开发环境配置、代码结构解析及执行步骤。 ... [详细]
  • Linux 系统启动故障排除指南:MBR 和 GRUB 问题
    本文详细介绍了 Linux 系统启动过程中常见的 MBR 扇区和 GRUB 引导程序故障及其解决方案,涵盖从备份、模拟故障到恢复的具体步骤。 ... [详细]
  • 本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射,详细解释了两者的创建、加载及删除操作,并提供了查看表详细信息的方法。通过对比这两种表类型,帮助读者理解如何更好地管理和保护数据。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 本文详细介绍了如何在Linux系统上安装和配置Smokeping,以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装,确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]
  • 深入理解Tornado模板系统
    本文详细介绍了Tornado框架中模板系统的使用方法。Tornado自带的轻量级、高效且灵活的模板语言位于tornado.template模块,支持嵌入Python代码片段,帮助开发者快速构建动态网页。 ... [详细]
  • PHP 5.2.5 安装与配置指南
    本文详细介绍了 PHP 5.2.5 的安装和配置步骤,帮助开发者解决常见的环境配置问题,特别是上传图片时遇到的错误。通过本教程,您可以顺利搭建并优化 PHP 运行环境。 ... [详细]
  • 本文探讨了卷积神经网络(CNN)中感受野的概念及其与锚框(anchor box)的关系。感受野定义了特征图上每个像素点对应的输入图像区域大小,而锚框则是在每个像素中心生成的多个不同尺寸和宽高比的边界框。两者在目标检测任务中起到关键作用。 ... [详细]
author-avatar
疯子zls_565
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有