机器学习07-卷积神经网络(CNN)

东阳的学习记录,坚持就是胜利!

为什么CNN用来做影像处理

因为很多时候我们不需要看整张图,就能获得图片的相关信息。我们在训练时不需要将整张图都送入神经网络进行训练,只需将一部分输入神经网络。对于不同的特征,我们可以使用不同的Fillter来对特征进行提取。
机器学习07-卷积神经网络(CNN)
机器学习07-卷积神经网络(CNN)

CNN的基础架构

  1. 一些特征要比整张图小的多;(Convolution)
  2. 一些特征出现在图像的不同区域;(Convolution)
  3. 对图片像素进行二次采样不会影响我们对图片的辨别。(Max Pooling)
    机器学习07-卷积神经网络(CNN)

Convolution(卷积)

Fillter

fillter做的工作就是当扫描到的部分和fillter具有相同的结构时,它的响应值最大。filtter最终会得到一个featuremap。

机器学习07-卷积神经网络(CNN)
对于多通道图片,一个fillter同时考虑了多个channel当图片为3通道时,即为filter核。

为什么说卷积就是全连接拿掉一些weight的结果

一个filter/一个神经元 只连接到了9个input(不需要看整张image)。不同filter的参数是共享的。
机器学习07-卷积神经网络(CNN)

Maxpool(最大池化)

Maxpool就是在做重采样
机器学习07-卷积神经网络(CNN)

一次卷积和池化的结果

每一个filter都代表了一个channel。得到一个更小的fearturemap。然后套娃
机器学习07-卷积神经网络(CNN)
输出channel的大小等于filter的个数
机器学习07-卷积神经网络(CNN)

一个卷积网络的例子

机器学习07-卷积神经网络(CNN)
机器学习07-卷积神经网络(CNN)
机器学习07-卷积神经网络(CNN)