Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)

Pandas基础学习

本次跟随Datawhale组队学习Pandas基础,希望能有所收获。Datawhale是一个很好的开源组织,会组织很多免费的知识学习。

附上本次组队学习的计划和教程资料,即使没有当时加入组队学习,有兴趣的话从现在开始学习也不晚哦~

现在学习喜欢用脑图的方式,知识点清晰明了,易于查找和复习,希望也可以帮助大家梳理知识脉络。

一、Task03:分组

Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
链接:https://pan.baidu.com/s/1UXBvnXNGDbxiVYfTCt5hZA
提取码:xu44

二、问题与练习

1、问题

【问题一】 什么是fillna的前向/后向填充,如何实现?
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
【问题二】 下面的代码实现了什么功能?请仿照设计一个它的groupby版本。
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)

【问题三】 如何计算组内0.25分位数与0.75分位数?要求显示在同一张表上。
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)

【问题四】 既然索引已经能够选出某些符合条件的子集,那么filter函数的设计有什么意义?

索引可以在组内筛选,filter函数是用来筛选某些组的

【问题五】 整合、变换、过滤三者在输入输出和功能上有何异同?

  • 相同点
    在输入输出上,都是输入输出分组
    功能上,都是分别对每一个组内的元素进行操作
  • 不同点
    聚合,和字面一样,主要用于将组内元素聚合,作为整体来操作,输出的也是某一个组的整体情况
    变换,主要是对组内的每一个元素进行变换操作
    过滤,主要是用来筛选组的

【问题六】 在带参数的多函数聚合时,有办法能够绕过wrap技巧实现同样功能吗?
这还真不知道。。。

2、练习

【练习一】: 现有一份关于diamonds的数据集,列分别记录了克拉数、颜色、开采深度、价格,请解决下列问题:
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)

Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)

【练习二】:有一份关于美国10年至17年的非法药物数据集,列分别记录了年份、州(5个)、县、药物类型、报告数量,请解决下列问题:
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)
Pandas基础学习 Task03:分组 (知识梳理脑图+全部资源教程)