python日记Day16——Pandas之数据特征分析

python日记——Pandas之数据特征分析

  • Pandas库的数据排序
    1、.sort_index()方法在指定轴上根据索引进行排序,默认升序:
    .sort_index(axis=0, ascending=True)
    2、.sort_values()方法在指定轴上根据数值进行排序,默认升序:
    Series.sort_values(axis=0, ascending=True)
    DataFrame.sort_values(by(axis轴上的某个索引或索引列表), axis=0, ascending=True)
    3、NaN统一放到排序末尾

  • 数据的基本统计分析
    1、基本的统计分析函数
    适用于Series和DataFrame:
    python日记Day16——Pandas之数据特征分析
    适用于Series:python日记Day16——Pandas之数据特征分析
    适用于Series和DataFrame:
    .describe()函数可以一次性产生几乎所有的统计分析值python日记Day16——Pandas之数据特征分析

  • 数据的累计统计分析
    1、累计统计分析函数:
    适用于Series和DataFrame类型,累计计算:
    python日记Day16——Pandas之数据特征分析python日记Day16——Pandas之数据特征分析
    适用于Series和DataFrame类型,滚动计算(窗口计算):
    python日记Day16——Pandas之数据特征分析
    python日记Day16——Pandas之数据特征分析

  • 数据的相关分析
    1、两个事务的相关性:正相关、负相关、不相关
    2、常用协方差判断相关性:协方差>0为正相关,协方差<0为负相关,协方差=0为独立不相关
    3、相关分析函数:
    适用于Series和DataFrame类型:
    python日记Day16——Pandas之数据特征分析
    python日记Day16——Pandas之数据特征分析
    本文内容参考于北京理工大学嵩天老师相关课程