第十一讲--课时24
计算机视觉任务:
semantic segmentation 是对图像中所有像素做分类,只要是一类的都不加区分,如下,两只奶牛都被标记的一样
semantic segmentation方案一 sliding windows
对每个小区域去做分类,且有重叠,计算量太大。
方案二 Fully convolutional
卷积过程中保持尺寸不变,改变深度。最后一层深度为C(类别数目),然后在channel上做argmax即可分类
上图计算量还是大,改进如下
down sampling: pooling ,strided conv
up sampling: unpooling ,transpose conv
####upsampling应与downsampling对称,比如downsampling采用maxpooling,upsampling就要对应max位置去做un_maxpooling
unpooling: nearest neighbor,bed of nails
卷积:
反卷积:
卷积操作可以写成矩阵乘法
[x,y,z]是卷积核,去卷积[a,b,c,d] zero_padding=1 stride=1
可以写作下图左边的矩阵乘法
而反卷积也可以看做矩阵乘法,而且X变为了X.T(transpose),反卷积乘法过程中a不再填充。
stride = 1时,反卷积可以看做卷积,即用[x,y,z]卷积核去卷积[a,b,c,d],zero_padding=2,stride=1
stride = 2时,反卷积不能再看作卷积