Python 边做边学 N.1 成果展示--用户区域统计
原文连接:http://blog.****.net/tomorrow13210073213/article/category/6931287
数据采集部分还没有整理,但代码已经写完,也采集到了部分数据,下面我们简单展示一下成果:
图片看不清请右键图片,选择“在新标签页中查看”;
省份统计
各省用户数量
各省用户数量(前十)
各省用户数量分布(百分比)
前十省份-各城市统计
北京
广东
上海
江苏
浙江
四川
湖北
山东
陕西
河南
(1)近50%(46.57%)用户来自于“北、上、广”,其中北京最多(21.99%);
(2)东部用户多余西部,南方用户多余北方;
(3)各省份大部分用户集中在一到两个城市(区),尤其是省会城市;
(4)“西藏”“青海”仍能看到程序员的身影,虽然数量不多;
以上统计基于189133条用户数据,地区来源于用户个人信息中选择的地址;鉴于大部分用户未公开自己所在的地区,仅清洗出189133条可用数据;覆盖率不够广,但也具有一定代表性,仅供参考;
图表绘制来自matlab;