Pandas 之groupby操作

pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其他分组分析。

  • pandas能利用groupby进行更加复杂的分组运算

  • 分组运算过程:split->apply->combine

    • 拆分:进行分组的根据

    • 应用:每个分组运行的计算规则

    • 合并:把每个分组的计算结果合并起来

Pandas 之groupby操作