python日记Day16——Pandas之数据特征分析
python日记——Pandas之数据特征分析
-
Pandas库的数据排序
1、.sort_index()方法在指定轴上根据索引进行排序,默认升序:
.sort_index(axis=0, ascending=True)
2、.sort_values()方法在指定轴上根据数值进行排序,默认升序:
Series.sort_values(axis=0, ascending=True)
DataFrame.sort_values(by(axis轴上的某个索引或索引列表), axis=0, ascending=True)
3、NaN统一放到排序末尾 -
数据的基本统计分析
1、基本的统计分析函数
适用于Series和DataFrame:
适用于Series:
适用于Series和DataFrame:
.describe()函数可以一次性产生几乎所有的统计分析值 -
数据的累计统计分析
1、累计统计分析函数:
适用于Series和DataFrame类型,累计计算:
适用于Series和DataFrame类型,滚动计算(窗口计算): -
数据的相关分析
1、两个事务的相关性:正相关、负相关、不相关
2、常用协方差判断相关性:协方差>0为正相关,协方差<0为负相关,协方差=0为独立不相关
3、相关分析函数:
适用于Series和DataFrame类型:
本文内容参考于北京理工大学嵩天老师相关课程