【weekly-sharing】反向传播算法在神经网络的应用

反向传播算法在神经网络的应用

当通过神经网络输入x，得到输出y^时，这些信息通过神经网络向前流动，这称之为前向传播（forward propagation）。

在网络得到输出时会得到一个代价函数，允许来自代价函数的信息通过网络向后流动，来计算梯度的过程叫反向传播（back propagation）

反向传播算法主要用于计算梯度

导数
描述函数变化率
方向导数
某个方向上的导数
梯度
梯度的方向是方向导数中取最大值的方向，值是方向导数的最大值。如在二维中，梯度计算：
$\nabla θ = (\partial θ \partial x, \partial θ \partial x)$
对矩阵的梯度计算如下图：
代价函数（损失函数）
代价函数（cost function）即损失函数（loss function）。如在机器学习中，真实值为y，而预测值为y^。代价函数就是来度量预测错误的程度。常写作C或L。
链式法则
链式法则（chain rule）求复合函数导数的一个法则，如：

(f(g(x)))′=f′(g(x))g′(x)

dydx=dydz⋅dzdx
- 假设x∈Rm,y∈Rn，g是从Rm到Rn的映射，f是从Rn到R的映射。如果y=g(x)且z=f(y)，那么有如下：
  $\partial z \partial x i = \sum j \partial z \partial y j \cdot \partial y i \partial x i$
计算图
计算图（computational graph）。将计算形式化为图形，形式有很多如下图：