反向传播的工作过程以及公式推导

作者:陈唯源

链接:https://www.zhihu.com/question/24827633/answer/91489990
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

一般都是用链式法则解释
比如如下的神经网络
反向传播的工作过程以及公式推导
  • 前向传播
对于节点反向传播的工作过程以及公式推导来说,反向传播的工作过程以及公式推导的净输入反向传播的工作过程以及公式推导如下:
反向传播的工作过程以及公式推导
接着对反向传播的工作过程以及公式推导做一个sigmoid函数得到节点反向传播的工作过程以及公式推导的输出:
反向传播的工作过程以及公式推导
类似的,我们能得到节点反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导的输出反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导

  • 误差
得到结果后,整个神经网络的输出误差可以表示为:
反向传播的工作过程以及公式推导
其中反向传播的工作过程以及公式推导就是刚刚通过前向传播算出来的反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导是节点反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导的目标值。反向传播的工作过程以及公式推导用来衡量二者的误差。
这个反向传播的工作过程以及公式推导也可以认为是cost function,不过这里省略了防止overfit的regularization term(反向传播的工作过程以及公式推导
展开得到
反向传播的工作过程以及公式推导

  • 后向传播
对输出层的反向传播的工作过程以及公式推导
通过梯度下降调整反向传播的工作过程以及公式推导,需要求反向传播的工作过程以及公式推导,由链式法则:
反向传播的工作过程以及公式推导
如下图所示:
反向传播的工作过程以及公式推导
反向传播的工作过程以及公式推导
反向传播的工作过程以及公式推导
反向传播的工作过程以及公式推导
以上3个相乘得到梯度反向传播的工作过程以及公式推导,之后就可以用这个梯度训练了:
反向传播的工作过程以及公式推导
很多教材比如Stanford的课程,会把中间结果反向传播的工作过程以及公式推导记做反向传播的工作过程以及公式推导,表示这个节点对最终的误差需要负多少责任。。所以有反向传播的工作过程以及公式推导



对隐藏层的反向传播的工作过程以及公式推导
通过梯度下降调整反向传播的工作过程以及公式推导,需要求反向传播的工作过程以及公式推导,由链式法则:
反向传播的工作过程以及公式推导
如下图所示:
反向传播的工作过程以及公式推导
参数反向传播的工作过程以及公式推导影响了反向传播的工作过程以及公式推导,进而影响了反向传播的工作过程以及公式推导,之后又影响到反向传播的工作过程以及公式推导反向传播的工作过程以及公式推导
求解每个部分:
反向传播的工作过程以及公式推导
其中反向传播的工作过程以及公式推导,这里反向传播的工作过程以及公式推导之前计算过。
反向传播的工作过程以及公式推导的计算也类似,所以得到
反向传播的工作过程以及公式推导
反向传播的工作过程以及公式推导的链式中其他两项如下:
反向传播的工作过程以及公式推导
反向传播的工作过程以及公式推导
相乘得到
反向传播的工作过程以及公式推导
得到梯度后,就可以对反向传播的工作过程以及公式推导迭代了:
反向传播的工作过程以及公式推导
在前一个式子里同样可以对反向传播的工作过程以及公式推导进行定义,反向传播的工作过程以及公式推导,所以整个梯度可以写成反向传播的工作过程以及公式推导

=======================
上述反向传播的工作过程以及公式推导就是教程Unsupervised Feature Learning and Deep Learning Tutorial 中第三步计算的由来。。

<img src="https://pic1.zhimg.com/50/2d29c11b1c9da7652c63f01d5e31284e_hd.jpg" data-rawwidth="822" data-rawheight="428" class="origin_image zh-lightbox-thumb" width="822" data-original="https://pic1.zhimg.com/2d29c11b1c9da7652c63f01d5e31284e_r.jpg">反向传播的工作过程以及公式推导

所谓的后向传播,其实就是『将来在宣传传播上出了偏差,你们要负责的!』,每一个节点负责的量用反向传播的工作过程以及公式推导表示,那么,隐藏节点需要负责的量,就由输出节点负责的量一层层往前传导。

参考:
【1】A Step by Step Backpropagation Example
【2】Unsupervised Feature Learning and Deep Learning Tutorial