python中DataFrame多重索引问题
在Python数据处理中如果实现excel透视表中的功能,则多重索引问题就比较突出了。近来为实现Python自动邮件,需要对数据进行透视表功能,遇到多重索引和多表头问题,下面总结下用法。
一、多重索引
常规的单索引这里就不多赘述了,主要来看下多索引的问题。
pd.pivot_table产生的多重索引问题。大概数据结构如下图所示:
当我们要选中其中的某一行时,可以通过一下集中方法实现:
(1)根据外层索引取数,可以使用ix[]和xs([])取数:
data.ix[3]:
(2)xs取外层索引
(3)根据外层以及内层索引取数
可以应用result_data2.loc[(3,‘2019-01’)]这种方式选取多个索行
2、对于多列名可以采用
result_data2[(‘M2注册数’,‘小短产品’)]这种方式选定特定列
xd_5.loc[2,(‘注册数’,‘小短产品’)]可以选取index=2,复合列名(‘注册数’,‘小短产品’)的cell数据。