1.6卷积神经网络笔记—三维RGB图像卷积
1.三维立体图像(RGB三通道)的卷积运算
6*6*3分别代表RGB图像的 高、宽、通道数;3*3*3分别代表滤波器矩阵 高、宽、通道数。图像和滤波器通道数必须相等(匹配)
将3*3*3滤波器转换成立方体,一共3^3=27个数值,(按照前面章节介绍的卷积运算计算)。分别乘与滤波器对应的RGB图像三个通道的数值,再相加得到4*4输出矩阵的值。
2.3*3*3滤波器作用
检测某一通道的边缘特征:将3*3*3滤波器矩阵的R通道设为垂直边缘检测矩阵,G B通道设为0,即可检测R通道的垂直边缘。(滤波器只关注一个通道是可行的)
不区分通道检查边缘特征:将RGB三个通道都设为垂直边缘检测,可以不区分通道检查垂直边缘情况。
3.如何同时检测到垂直水平或者任意角度的边缘?
将图像矩阵分别与2个检测不同角度边缘的滤波器矩阵卷积,得到2个4*4输出矩阵,输出结果即对应不同边缘检测结果。(将2个4*4矩阵放在一起组成立方体矩阵)
4.总结
nc是通道数(文献中常叫通道数或者深度,通道数较好理解),图像和滤波器矩阵通道数必须相等,为检测多个边缘特征,可以设置多个滤波器,滤波器数量为nc’。(这里不考虑padding和strided情况)
卷积得到矩阵的第三个维度=nc'。