DW数据挖掘学习(二)

1.时间序列规则

1.1为什么重视规则

    简单、高效、可解释性强

1.2中位数、临近数据等简单统计量

  • 中位数:稳健
  • 均值:当分布较符合正态分布时
  • 临近数据:临待预测数据较近的数据

1.3 基于周期因子的时间序列预测

1.3.1获得周期因子

  • 除以周均值 ,然后按列取中位数 

    DW数据挖掘学习(二)

  • 季节指数的计算方式;获得每日(工作日或周末)均值,再除以整体均值 

    DW数据挖掘学习(二)

1.3.2预测

  • 1.3.1中的中位数乘以base(最后一周的平均客流) 

DW数据挖掘学习(二)

  • 中位数乘以base(去周期后的平均客流) 

DW数据挖掘学习(二)

  •  如何预测下个月每一天的情况   

         步骤一:获得每日1-31号的均值

         步骤二:统计每日为周1-7的频次

DW数据挖掘学习(二)

        步骤三:基于星期周期因子获得加权均值

DW数据挖掘学习(二)

        步骤三:根据因子和每日均值预测

2.基于时间序列规则的资金流入流出预测

2.1以星期为周期的中位数预测

  • 选取时段DW数据挖掘学习(二)
  • 按星期重新组织数据 

DW数据挖掘学习(二)

DW数据挖掘学习(二)

  • 提取中位数,并做预测 

DW数据挖掘学习(二)

2.2 基于周期因子(以星期为周期)的预测 

  • 方法一

DW数据挖掘学习(二)

  • 方法二 DW数据挖掘学习(二)

2.3 基于周期因子(以月份为周期)的预测 DW数据挖掘学习(二)

2.4 效果对比

  • 窗宽h的意义与设置DW数据挖掘学习(二)