pandas 时间日期 数据可视化
时间日期 数据可视化
时间日期
时间戳 tiimestamp:固定的时刻 -> pd.Timestamp
固定时期 period:比如 2016年3月份,再如2015年销售额 -> pd.Period
时间间隔 interval:由起始时间和结束时间来表示,固定时期是时间间隔的一个特殊
时间日期在 Pandas 里的作用:
1.分析金融数据,如股票交易数据
2.分析服务器日志
Python datetime
python 标准库里提供了时间日期的处理。这个是时间日期的基础。
时间差
字符串和 datetime 转换
Pandas 里的时间序列
Pandas 里使用 Timestamp 来表达时间
日期范围
生成日期范围
时间频率
时期及算术运算
pd.Period 表示时期,比如几日,月或几个月等。比如用来统计每个月的销售额,就可以用时期作为单位。
时期序列
时期的频率转换
asfreq
A-DEC: 以 12 月份作为结束的年时期
A-NOV: 以 11 月份作为结束的年时期
Q-DEC: 以 12 月份作为结束的季度时期
季度时间频率
Pandas 支持 12 种季度型频率,从 Q-JAN 到 Q-DEC
Timestamp 和 Period 相互转换
重采样
高频率 -> 低频率 -> 降采样:5 分钟股票交易数据转换为日交易数据
低频率 -> 高频率 -> 升采样
其他重采样:每周三 (W-WED) 转换为每周五 (W-FRI)
label =‘right’时显示为结束时间
OHLC 重采样
金融数据专用:Open/High/Low/Close
通过 groupby 重采样
ts = pd.Series(np.random.randint(0, 50, 100), index=pd.date_range(‘2016-03-01’, periods=100, freq=‘D’))
升采样和插值
时期重采样
从文件中读取日期序列
自定义时间日期解析函数
数据可视化
Pandas 的数据可视化使用 matplotlib 为基础组件。
线型图
Series 和 DataFrame 都提供了一个 plot 的函数。可以直接画出线形图
柱状图
直方图
直方图是一种对值频率进行离散化的柱状图。数据点被分到离散的,间隔均匀的区间中,绘制各个区间中数据点的数据。