caffe:debug之参数更新过程(接上篇反向传播)
随后便要根据后向传播中得到得diff更新权重和偏置
ApplyUpdate(位于sgd_solver.cpp)
上图便为update函数,可见,参数学习得步骤为:得到学习率,正则化梯度后
归一化,正则化,然后更新数据。
首先来看GetLearningRate() (sgd_solver.cpp)
函数封装了各种样式的学习率衰减方式
继续往下
笔者猜测本例为是否使用L2正则化梯度,本例中不需正则化,所以直接return
随后便是Normalize
然后进入Regularize,此处是L2
随后便是计算更新的参数