Pandas基础学习(下) Task01:缺失数据(知识梳理脑图+全部资源教程)
Pandas基础学习(下)
之前跟随Pandas(上)学习,收获良多,这次开了下的组队学习,迫不及待的加入了。Datawhale是一个很好的开源组织,会组织很多免费的知识学习。
附上本次组队学习的计划和教程资料,即使没有当时加入组队学习,有兴趣的话从现在开始学习也不晚哦~
现在学习喜欢用脑图的方式,知识点清晰明了,易于查找和复习,希望也可以帮助大家梳理知识脉络。
一、Task01:缺失数据
链接:https://pan.baidu.com/s/1ONkiRXBqvl3nz6bjDk837g
提取码:z59c
二、问题与练习
1、问题
【问题一】 如何删除缺失值占比超过25%的列?
【问题二】 什么是Nullable类型?请谈谈为什么要引入这个设计?
【问题三】 对于一份有缺失值的数据,可以采取哪些策略或方法深化对它的了解?
2、练习
【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:
(a)请以列类型读入数据,并选出C为缺失值的行。
(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。
【练习二】 现有一份缺失的数据集,记录了36个人来自的地区、身高、体重、年龄和工资,请解决如下问题:
(a)统计各列缺失的比例并选出在后三列中至少有两个非缺失值的行。
(b)请结合身高列和地区列中的数据,对体重进行合理插值。