190417-Rearranging and reshaping data
1. Pivoting DataFrames
如果不指定value那么多个column会被计算
2.Stacking & unstacking DataFrames
- unstacking dataframes
df.unstack(level="")
level=1是指第二级
- stacking dataframes
- swapping levels of index
df.swaplevel(0,1),注意这里0,1仍然代表第一、二级别
- sorting index
df.sort_index()
sort之后的数据能够更好地slicing
- print(dfA.equals(dfB))
如果结果为True说明dfA与dfB相同.
3. Melting dataframes
pd.melt(id_vars='',value_vars='',value_name='',var_name='')
pd.melt( ,col_level=0)
- pivot table
默认是算平均值
- aggfunc='count' aggfunc=len 结果一样
- margins=True 相当于透视表里的grand total: