Deep learning II - II Optimization algorithms - Exponentially weighted averages 指数加权平均

Exponentially weighted averages 指数加权平均


指数加权平均指的是通过综合当前点之前的数据和该点数据,通过调整加权值,来得到需要的值的技术。
Deep learning II - II Optimization algorithms - Exponentially weighted averages 指数加权平均

Vt=βVt1+(1β)θt

  • β接近于1时(0.98),当前点的值Vt更加依赖于之前的数值Vt1而不是θt,因此曲线会更光滑,并产生延迟(如绿色曲线)
  • β远小于1时,当前点的值Vt更加依赖于θt而不是之前的数值Vt1,因此曲线会震荡的厉害,接近于原图像(如黄色曲线)
  • 上述公式可以看成是Vt是其之前11βdays的均值(当β=0.9时,通过展开式V100=0.1θ100+0.1×0.9θ99+0.1×0.92θ98+0.1×0.93θ97++0.1×0.999θ1,当βx1e时,认为到了临界值。所以当β=0.98时,相当于50天的均值。

Deep learning II - II Optimization algorithms - Exponentially weighted averages 指数加权平均
Deep learning II - II Optimization algorithms - Exponentially weighted averages 指数加权平均

  • 当使用上述公式Vt=βVt1+(1β)θt时,我们得到曲线并不是与绿色曲线完全一样,会得到如下图紫色曲线。为了消除这种变差,可以使用Vt1βt代替Vt
    Deep learning II - II Optimization algorithms - Exponentially weighted averages 指数加权平均