图像识别中的卷积操作(Convolution in Image Identification )

初入卷积

1. 为什么学它

  我们做事,无论做啥,都一定要有问为什么的好奇心。卷积作为图像识别中的最基本操作,我们一定要把它吃个透,要想做道好菜,没有扎实的刀功哪能了得。

2. 千万不要“未入觉难”

  听到卷积,可能刚入门的朋友都会有一点怕,以为是什么高深摸不透的东西,更怕自己数学不好学不会这个。但如果你看到这里,那么请现在开始打消这个念头。它,不难。

3.废话少说,开始学习

先放张图给大家瞅瞅(二维卷积)
图像识别中的卷积操作(Convolution in Image Identification )
看完这张GIF图,想必这个概念不再那么抽象了吧。

卷积三要素

卷积
卷积核
待卷图像层
卷积输出

通俗定义(比喻卷积操作,方便理解,非正式定义)

用一张小拓纸在一张大画上面临摹

正式定义(从数学角度理解)

图像识别中的卷积操作(Convolution in Image Identification )
深蓝色方块:待卷图像
3x3灰色移动方块:卷积核
深绿色方块:卷积输出

该图中,卷积核
[012220012] \left[ \begin{matrix} 0 & 1 & 2 \\ 2 & 2 & 0 \\ 0 & 1 & 2 \end{matrix} \right]
待卷图像
[3321000131312232002220001] \left[ \begin{matrix} 3 & 3 & 2 & 1 & 0\\ 0 & 0 & 1 & 3 & 1 \\ 3 & 1 & 2 & 2 & 3 \\ 2 & 0 & 0 & 2 & 2 \\ 2 & 0 & 0 & 0 & 1 \end{matrix} \right]
接下来对红色区域进行计算
图像识别中的卷积操作(Convolution in Image Identification )
计算方式为:卷积核与红色区域矩阵一一对应相乘,最后将所有乘得的数相加作为输出
0x3 1x3 2x2
2x0 2x0 0x1
0x3 1x1 2x2
最后相加即得12

图像识别中的卷积操作(Convolution in Image Identification )
  然后保持卷积核不变,将其按从左往右,从上到下的顺序进行移动,重复上述操作,得到最终的3x3卷积输出。
  至此,最简单易懂的卷积教程到此结束。这里只是很基础的单通道二维卷积操作,不涉及实现代码及其他专业知识。懂的都懂。

最后

希望这篇教程能对刚入门或有意向入门图像识别的你有所帮助(当然这只是很很很很简单很浅的入门,求大佬别喷我)。

如有错误,请各位少侠不吝指正!!!本人感激不尽

本文章两张GIF图均为转载他人,如有侵权请联系我删除。