深度学习之神经网络概述、BP算法

深度学习是由机器学习的神经网络发展而来的一个新的领域，模仿人脑的机制来解释数据（图像、声音和文本），结构是含多隐层的多层感知器。深度学习可以用无监督或半监督的特征学习和分层特征提取算法来高效地替代手工获取特征，通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

一、神经元

人的大脑是由大约深度学习之神经网络概述、BP算法个神经元（neuron）相互连接组成的密集网络，平均每一个神经元与其他个神经元相连。神经元的树突接受其他神经元轴突传递过来的神经递质后，它自己细胞体的活性被**或抑制；**时细胞体内部的电位超过阈值threshold，就会通过很长的轴突向与它相连的其他神经元的树突发送神经递质。

深度学习之神经网络概述、BP算法

M-P神经元模型如下：

深度学习之神经网络概述、BP算法

可以将神经元视为一个单独的决策单元，一个神经元接收到来自n个其他神经元传递过来的输入信号深度学习之神经网络概述、BP算法，这些输入信号通过带权重的连接进行传递，神经元接收到的总输入值与神经元的阈值θ进行比较，然后通过**函数f处理以产生神经元的输出y。

为了统一书写格式经常将阈值写成输入中的一个偏置项bias unit：深度学习之神经网络概述、BP算法，它的权重为（）。**函数的作用是将线性映射转换为非线性映射，常用的**函数有sigmoid、softmax、tanh、relu、leaky relu等。

神经元可以完成各种逻辑运算，这里只举几个例子：

1、逻辑与 AND

深度学习之神经网络概述、BP算法，

深度学习之神经网络概述、BP算法，由sigmoid图像可知在(-4,4)以外的区间上它的值分别趋近于0或1：

深度学习之神经网络概述、BP算法

2、逻辑或 OR

深度学习之神经网络概述、BP算法，

深度学习之神经网络概述、BP算法

3、逻辑非 NOT

深度学习之神经网络概述、BP算法，

深度学习之神经网络概述、BP算法 ¬

深度学习之神经网络概述、BP算法

4、逻辑同或/异或非 XNOR

对线性分类器的与或非等组合，即使用多层神经元可以解决非线性可分的问题。

深度学习之神经网络概述、BP算法，，

深度学习之神经网络概述、BP算法，；

深度学习之神经网络概述、BP算法

二、神经网络

神经网络是具有适应性的神经元组成的广泛并行互联的网络，能够模拟生物神经系统对真实世界物体所作出的交互反映。深度神经网络DNN可理解为有很多隐藏层的神经网络，也可称为多层感知机MLP（Multi-Layer Perceptron），按层次可分为输入层input layer、任意数量的隐藏层hidden layer和输出层output layer。

1、正向传播Forward Propagation

深度学习之神经网络概述、BP算法

令图中深度学习之神经网络概述、BP算法表示第层的第k个神经元，表示从第层的第j个神经元映射到第层的第i个神经元的权重，可得：

深度学习之神经网络概述、BP算法

正向传播的计算过程可写为：

（1）初始化深度学习之神经网络概述、BP算法

（2）for 深度学习之神经网络概述、BP算法 to 总层数L：

深度学习之神经网络概述、BP算法

（3）return 深度学习之神经网络概述、BP算法

2、反向传播算法 Back Propagation

BP算法是有监督学习（深度学习之神经网络概述、BP算法给定）的多层前馈神经网络用来校正模型权重矩阵的算法，由正向、反向传播两个环节组成：正向传播时x由输入层进入，正向逐层经过隐藏层传向输出层；如果输出值不满足期望，则取输出值与真实值误差的平方和作为目标函数，转入反向传播算法，反向逐层使用梯度下降更新各个神经元的权重。这两个环节反复迭代，当误差最终达到期望时，循环结束。