Pandas(6)——分组、透视表与其他
一、分组数据准备:
结果:
1. 分组 df.groupby("key") #按照key进行分组。
例: 结果:
输出的是一个对象,并没有输出内容。这是因为分组的一个“延迟计算”的功能,其实已经分好组了。要等到处理的时候,才返回值。
2. 求每组的统计值 df.groupby("key").sum() #【例1】。 df.groupby("key").mean()
例1:
结果:
分成四组,然后每组求和。
3.分组之后,求某一列的统计值 df.groupby("key")["data1"].sum() #按key分组,然后看看data1这一列的和。
二、数据透视表
三、其他(1) 向量化字符串操作 (2)处理时间序列 (3)多级索引:用于多维数据,比如三维数据 (4)高性能函数eval()、query()
|