图像识别中的卷积操作(Convolution in Image Identification )
初入卷积
1. 为什么学它
我们做事,无论做啥,都一定要有问为什么的好奇心。卷积
作为图像识别中的最基本操作,我们一定要把它吃个透,要想做道好菜,没有扎实的刀功哪能了得。
2. 千万不要“未入觉难”
听到卷积
,可能刚入门的朋友都会有一点怕,以为是什么高深摸不透的东西,更怕自己数学不好学不会这个。但如果你看到这里,那么请现在开始打消这个念头。它,不难。
3.废话少说,开始学习
先放张图给大家瞅瞅(二维卷积)
看完这张GIF图,想必这个概念不再那么抽象了吧。
卷积三要素
通俗定义(比喻卷积操作,方便理解,非正式定义)
用一张小拓纸在一张大画上面临摹
正式定义(从数学角度理解)
深蓝色方块
:待卷图像3x3灰色移动方块
:卷积核深绿色方块
:卷积输出
该图中,卷积核为
待卷图像为
接下来对红色区域进行计算
计算方式为:卷积核与红色区域矩阵一一对应相乘,最后将所有乘得的数相加作为输出
0x3 1x3 2x2
2x0 2x0 0x1
0x3 1x1 2x2
最后相加即得12
然后保持卷积核不变,将其按从左往右,从上到下的顺序进行移动,重复上述操作,得到最终的3x3卷积输出。
至此,最简单易懂的卷积教程到此结束。这里只是很基础的单通道二维卷积操作,不涉及实现代码及其他专业知识。懂的都懂。
最后
希望这篇教程能对刚入门或有意向入门图像识别的你有所帮助(当然这只是很很很很简单很浅的入门,求大佬别喷我)。
如有错误,请各位少侠不吝指正!!!本人感激不尽
本文章两张GIF图均为转载他人,如有侵权请联系我删除。