DW数据挖掘学习(二)
1.时间序列规则
1.1为什么重视规则
简单、高效、可解释性强
1.2中位数、临近数据等简单统计量
- 中位数:稳健
- 均值:当分布较符合正态分布时
- 临近数据:临待预测数据较近的数据
1.3 基于周期因子的时间序列预测
1.3.1获得周期因子
- 除以周均值 ,然后按列取中位数
- 季节指数的计算方式;获得每日(工作日或周末)均值,再除以整体均值
1.3.2预测
- 1.3.1中的中位数乘以base(最后一周的平均客流)
- 中位数乘以base(去周期后的平均客流)
- 如何预测下个月每一天的情况
步骤一:获得每日1-31号的均值
步骤二:统计每日为周1-7的频次
步骤三:基于星期周期因子获得加权均值
步骤三:根据因子和每日均值预测
2.基于时间序列规则的资金流入流出预测
2.1以星期为周期的中位数预测
- 选取时段
- 按星期重新组织数据
- 提取中位数,并做预测
2.2 基于周期因子(以星期为周期)的预测
- 方法一
- 方法二
2.3 基于周期因子(以月份为周期)的预测
2.4 效果对比
- 窗宽h的意义与设置