深度学习各种normalization

各种Normalization层出不穷，现做一下总结，以供大家学习参考

深度学习各种normalization

1. BN：Batch Normalization

这是大家最熟悉的了，结合上图

针对每一批，正规化，减少前一层对后层的影响

针对一批中的每一个 feature进行 normalization（也即每一个 feature采用不同的规范化操作），而 normal后是一个向量，向量的维度是 feature的个数，故而又可以称其纵向规范化

2. BR: Batch Renormalization

通过渐进式的移动平均来接近全局正规化来修复在训练和预测时参数（b &W）的不一致问题(在每次计算时，均会包括上一次的normalization params),实际是对BN的改进

3.LN: layer normalization

对比BN

它是一种横向规范化，他综合考虑一层所有维度的输入，计算该层的平均输入值和输入方差，然后用、同一个规范化操作来转换各个维度的输入，LN 针对单个训练样本，不依赖其它数据，因此可以避免BN中受mini-batch的数据分布影响的问题，可以用于小mini-batch, 动态网络和RNN,此外 LN不需要存储mini-batch的均值和方差

深度学习各种normalization