第十一讲--课时24

计算机视觉任务：

第十一讲--课时24

semantic segmentation 是对图像中所有像素做分类，只要是一类的都不加区分，如下，两只奶牛都被标记的一样

第十一讲--课时24

semantic segmentation方案一 sliding windows

对每个小区域去做分类，且有重叠，计算量太大。

第十一讲--课时24

方案二 Fully convolutional

卷积过程中保持尺寸不变，改变深度。最后一层深度为C（类别数目），然后在channel上做argmax即可分类

第十一讲--课时24

上图计算量还是大，改进如下

第十一讲--课时24

down sampling: pooling ，strided conv

up sampling: unpooling ，transpose conv

####upsampling应与downsampling对称，比如downsampling采用maxpooling，upsampling就要对应max位置去做un_maxpooling

unpooling: nearest neighbor,bed of nails

第十一讲--课时24

卷积：

第十一讲--课时24

反卷积：

第十一讲--课时24

卷积操作可以写成矩阵乘法

[x,y,z]是卷积核，去卷积[a,b,c,d] zero_padding=1 stride=1

可以写作下图左边的矩阵乘法

而反卷积也可以看做矩阵乘法，而且X变为了X.T（transpose），反卷积乘法过程中a不再填充。

stride = 1时，反卷积可以看做卷积，即用[x,y,z]卷积核去卷积[a,b,c,d]，zero_padding=2，stride=1

第十一讲--课时24

stride = 2时，反卷积不能再看作卷积

第十一讲--课时24