RefineNet论文理解
RefineNet block的作用是把不同分辨率的特征图融合。
除了RefineNet-4是单输入,其他全是二输入。主要组成部分是Residual convolution uint(RCU)、Multi-resolution fusion、Chained residual pooling、Output convolutions.
RCU:是从残差网络中提取出来的单元结构
Multi-resolution fusion:是先对多输入的特征图都用一个卷积层进行自适应(都化到最小的特征图的尺寸大小),再上采样,最后做element-wise 的相加。如果是像RefineNet-4 的单输入block 这一部分就不用了。
Chained residual pooling:卷积层作为之后加权求和的权重,relu 对接下来池化的有效性很重要,而且使得模型对学习率的变化没这么敏感。这个链式结构能从很大范围区域上获取背景context。另外,这个结构中大量使用了identity mapping 这样的连接,无论长距离或者短距离的,这样的结构允许梯度从一个block 直接向其他任一block 传播。
Output convolutions:输出前再加一个RCU。