机器学习07-卷积神经网络(CNN)
东阳的学习记录,坚持就是胜利!
文章目录
为什么CNN用来做影像处理
因为很多时候我们不需要看整张图,就能获得图片的相关信息。我们在训练时不需要将整张图都送入神经网络进行训练,只需将一部分输入神经网络。对于不同的特征,我们可以使用不同的Fillter来对特征进行提取。
CNN的基础架构
- 一些特征要比整张图小的多;(Convolution)
- 一些特征出现在图像的不同区域;(Convolution)
- 对图片像素进行二次采样不会影响我们对图片的辨别。(Max Pooling)
Convolution(卷积)
Fillter
fillter做的工作就是当扫描到的部分和fillter具有相同的结构时,它的响应值最大。filtter最终会得到一个featuremap。
对于多通道图片,一个fillter同时考虑了多个channel当图片为3通道时,即为filter核。
为什么说卷积就是全连接拿掉一些weight的结果
一个filter/一个神经元 只连接到了9个input(不需要看整张image)。不同filter的参数是共享的。
Maxpool(最大池化)
Maxpool就是在做重采样
一次卷积和池化的结果
每一个filter都代表了一个channel。得到一个更小的fearturemap。然后套娃
输出channel的大小等于filter的个数