目标分割-U-net
1.网络结构
U-Net提出了一种新的网络结构和训练方法,依靠数据增强将有效的标注数据更为有效地使用。
-
网络由收缩路径和扩张路径组成,收缩路径用于获取上下文信息,扩张路径用于精确定位,两条路径相互对称;
-
网络运行速度快
结构:
一个contracting path即收缩路径(左侧)和一个expansive path即扩展路径(右侧)组成。1、收缩路径遵循卷积网络的典型架构。它包括重复使用两个3x3卷积(无填充卷积),每个卷积后跟一个线性修正单元(ReLU)和一个2x2最大池化操作,步长为2的下采样。
在每个下采样步骤中,我们将特征通道的数量加倍。
2、扩展路径中的每一步都包括特征映射的上采样- 1、进行2x2卷积(“反卷积”),将特征通道数量减半,与来自收缩路径的相应裁剪特征映射串联
- 2、然后是两个3x3卷积,每个卷积后面接ReLU。
由于每一次卷积都会丢失边界像素,因此裁剪是必要的。在最后一层,使用1x1卷积将每个64分量特征向量映射到所需数量的类别上。
3、网络采样细节
UNet的encoder下采样4次,一共下采样16倍,对称地,其decoder也相应上采样4次,将encoder得到的高级语义特征图恢复到原图片的分辨率。网络较小运行速度快
为什么效果好
1、底层(深层)信息:经过多次下采样后的低分辨率信息。能够提供分割目标在整个图像中上下文语义信息,可理解为反应目标和它的环境之间关系的特征。这个特征有助于物体的类别判断(所以分类问题通常只需要低分辨率/深层信息,不涉及多尺度融合)
2、高层(浅层)信息:经过concatenate操作从encoder直接传递到同高度decoder上的高分辨率信息。能够为分割提供更加精细的特征。