使用Python分析北京积分落户数据,分析完我陷入了深思
这是学习笔记的第 2183 篇文章
读完需要
9
分钟速读仅需5分钟
北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献、专业技能、在京时间等指标为考核项,计算非京籍人才的“积分”,积分达标即可落户北京。也给了我们一众北漂希望,毕竟随着时间的增长,有些不太明显的问题会逐步摆在我们面前,从幼儿园开始到走入社会的教育,是让我们尤其关注的层面,积分落户算是开了一个口子,在现在大多数城市完全开放户籍政策,相比算是开放中的高冷了。
2016年8月11日,北京市积分落户管理办法(试行)发布。本市积分落户自2017年1月1日起施行,每年申请一次。
2018年4月11日,发布《北京市积分落户操作管理细则》,4月16日将正式开放在线系统,接受社会申报。
2018年将为首批通过积分获得落户资格的申请人办理落户手续。2018年8月1日,北京市首批积分落户数据核查阶段已结束。用人单位和申请人可登录积分落户在线申报系统查看申报数据初核结果。
10月23日起,正式开办北京市常住户口积分落户手续。2019年5月16日,市人力社保局发布消息,北京市2019年积分落户申报工作将于5月22日正式启动,申报期60天。
目前官方公布的数据为2018年的积分落户数据,通过对数据的分析,可以了解整体的比例和分布情况。
今天使用Python实现做了下数据分析,结合pandas, numpy, matplotlib, pyecharts等插件通过可视化的方式进行数据统计分析,以柱状图,饼图,地图,表格等形式展示数据的分布情况。
直接给出测试过程。
1 环境配置
Python |
版本:3.8 |
插件 |
pandas |
numpy | |
matplotlib | |
pyecharts |
2 分数分布
2.1 分数按照5分为粒度进行统计
2.2 分数整体饼图统计
绝大多数的比例集中在90-95分,95~100分的区段次之,如果想得到更细粒度的数据,可以使用饼图查看。
其中,
90~95分的比例占到了55.6%
95~100分的比例占到了29.2%
100~105分的比例占到了10.8%
105分以上的比例占用不到5%
2.3 分数按照1分为粒度统计
在此基础上进行信息下钻,积分粒度按照1分来计算,可以看到90~91分的区段人数最多,90分压线的有300人左右。
3 年龄分布
3.1 细分年龄层次饼图
从饼图分布来看,
40~45岁的落户比例较高,为50.5%
35~40岁的落户比例次之,为42.2%
30~35岁的落户比例极低,为2.7%左右
45~50岁的落户比例较低,为4.3%
55~60岁的落户比例更低,为0.2%左右
3.2 细分年龄层次按照1岁为粒度进行统计
其中37~44岁为积分落户人数覆盖范围最多的年龄段,30~35岁的区段还是极少的比例。
4 公司分布
4.1 按照公司进行统计
公司情况如下:
北京华为数字技术有限公司 |
137 |
中央电视台 |
73 |
北京首钢建设集团有限公司 |
57 |
百度在线网络技术(北京)有限公司 |
55 |
联想(北京)有限公司 |
48 |
中国民生银行股份有限公司 |
40 |
北京外企人力资源服务有限公司 |
40 |
国际商业机器(中国)投资有限公司 |
39 |
中国国际技术智力合作有限公司 |
29 |
华为技术有限公司北京研究所 |
27 |
爱立信(中国)通信有限公司 |
26 |
腾讯科技(北京)有限公司 |
24 |
北京阿里巴巴云计算技术有限公司 |
23 |
中国石油天然气股份有限公司管道北京输油气分公司 |
20 |
用友软件股份有限公司 |
20 |
中铁建工集团有限公司 |
19 |
微软(中国)有限公司 |
17 |
中信银行股份有限公司 |
17 |
中煤建设集团工程有限公司 |
17 |
甲骨文(中国)软件系统有限公司 |
16 |
西门子(中国)有限公司 |
16 |
北京市京才实业开发总公司 |
16 |
中国光大银行股份有限公司 |
16 |
中铁电气化局集团有限公司 |
15 |
中铁三局集团第四工程有限公司 |
15 |
行业集中在华为,百度,爱立信,联想等公司,包括一些大型央企。
5 省份分布
5.1省份分布如下表所示:
河北 |
894 |
辽宁 |
484 |
山东 |
445 |
黑龙江 |
444 |
内蒙古 |
340 |
山西 |
316 |
吉林 |
309 |
河南 |
309 |
湖北 |
290 |
天津 |
239 |
四川 |
225 |
湖南 |
210 |
江苏 |
210 |
陕西 |
207 |
江西 |
191 |
安徽 |
184 |
甘肃 |
109 |
北京 |
97 |
浙江 |
90 |
新疆 |
80 |
福建 |
79 |
宁夏 |
51 |
广西 |
44 |
贵州 |
40 |
广东 |
37 |
青海 |
34 |
云南 |
31 |
上海 |
18 |
海南 |
10 |
西藏 |
1 |
重庆 |
1 |
其中河北,辽宁,山东,黑龙江占据较高比例,地域和北京有直接联系,而重庆,西藏,海南,云南的比例较低,上海主观猜测因为城市自身竞争力原因也处于末尾。
而且让我有些奇怪的是有些已经是北京户口了,怎么还要申请北京户口?
5.2 省份数据地图分布
QQ群号:763628645
QQ群二维码如下, 添加请注明:姓名+地区+职位,否则不予通过
订阅我的微信公众号“杨建荣的学习笔记”,第一时间免费收到文章更新。别忘了加星标,以免错过新推送提示。
7
近期热文
你可能也会对以下话题感兴趣。点击链接就可以查看。
8
转载热文
你可能也会对以下话题感兴趣,文章来源于转载,点击链接就可以查看。