数据挖掘——时间序列算法之平稳性检验

平稳时间序列定义

对于随机变量X,可以计算其均值μ\mu、方差σ2\sigma^{2};对于两个随机变量X和Y。可以计算X,Y的协方差cov(X,Y)=E[(XμX)(YμY)]cov(X,Y)=E[(X-\mu_{X})(Y-\mu_{Y})]和相关系数ρ(X,Y)=cov(X,Y)σXσY\rho(X,Y)=\frac{cov(X,Y)}{\sigma_{X}\sigma_{Y}},他们度量了两个不同时间之间的相互影响程度。

对于时间序列Xt,tT{X_{t},t\in T},任意时刻的序列值XtX_{t}都是一个随机变量,每一个随机变量都会有均值和方差,记XtX_{t}的均值为μt\mu_{t},方差为σt\sigma_{t};任取t,sTt,s \in T,定义序列XtX_{t}的自协方差函数γ(t,s)=E[(Xtμt)(Xsμs)]\gamma(t,s)=E[(X_{t}-\mu_{t})(X_{s}-\mu_{s})]和自相关系数ρ(t,s)=conv(Xt,Xs)σtσs\rho(t,s)=\frac{conv(X_{t},X_{s})}{\sigma_{t} \sigma_{s}}。之所以称他们为自协方差函数和自相关系数,是因为他们衡量的是同一个事件在两个不同时期(时刻t和s)之间的相关程度,形象的讲就是度量自己过去的行为对自己现在的影响。

由此得到平稳性检验的根本思想:如果时间序列{Xt,TT}\{X_{t},T \in T\}在某一常数附近波动且波动范围有限,即有常数方差,并且延迟k期的序列变量的自协方差和自相关系数是相等的或者说延迟k期的序列变量之间的影响程度是一样的,则称{Xt,tT}\{X_{t},t\in T\}为平稳序列。

时间序列平稳性检验

数据挖掘——时间序列算法之平稳性检验
但是图检验方法的主观臆断成分大,目前常用的是单位根检验。

针对平稳和不平稳序列,目前的主要算法

数据挖掘——时间序列算法之平稳性检验