cnn系列文章四 --池化层和简单卷积网络示例

cnn系列文章三 –padding和strides详解
出去吃了个饭，突然感觉好没胃口，好落寞。。。。
哎，继续吧
一句歌词继续中:

《霜雪千年》
苔绿青石板街
斑驳了流水般岁月
小酌三盏两杯
理不清缠绕的情结

典型的卷积神经网络

简单的说就是使用过滤器对图像进行区域分割，然后输出每个区域的最大值。

比如下图使用 $2 \times 2$ 的过滤器，选择步长为2，则然后输出 $\frac{4 - 2}{2} + 1 = 2$ 即 $2 \times 2$ 的图像，每个像素点的值为原图像中过滤器覆盖区域的最大值
cnn系列文章四 --池化层和简单卷积网络示例

最大池化的直观理解：

还记得垂直边缘检测的例子吗，在边缘处，输出图像的值很大。也就是说，当输出图像的值很大时，意味着提取了某些特征。

而最大池化的操作就是，只要在任何一个象限中提取到某个特征，就都会保留到最大池化的输出结果中。如果提取到某个特征，则保留其最大值，比如上图中左上角的9，而如果为提取到特征，则最大池化后的输出仍很小，比如右上角的2.

在实际工作中，加入最大池化后，通常网络表现的会很好。

注意当有多个通道时：是对每一通道分别进行最大池化操作，不会改变图像的通道数目。
cnn系列文章四 --池化层和简单卷积网络示例

顾名思义，就是在每个区域上求平均值，作为平均池化的输出值
cnn系列文章四 --池化层和简单卷积网络示例

平均池化用的很少

池化操作不需要训练参数，只有两个超参数：
- $f : f i l t e r s i z e$
- $s : s t r i d e$
常见的超参数有：

$f = 2, s = 2$ 将图像的高度和宽度减半

$f = 3, s = 2$
很少用padding,即 $p = 0$
input: $n_{H} \times n_{W} \times n_{C}$

output: $⌊ \frac{n_{H} - f}{s} + 1 ⌋ \times ⌊ \frac{n_{W} - f}{s} + 1 ⌋ \times n_{C}$