[深度学习从入门到女装]Scale-Aware Trident Networks for Object Detection
论文地址:Scale-Aware Trident Networks for Object Detection
这篇文章是使用改变网络的感受野来提高目标检测的能力,其实感觉就是感觉把deeplab中的block用到目标检测中
文章对比了两种主流的结构,
第一种就是最原始图像金字塔,把原始图像缩放成不同尺寸,然后对这些不同尺寸的图像进行特征提取,在分别使用这些不同scale的特征进行predict
第二种是目前最流行的特征金字塔FPN,类似于一个U-Net的结构,对特征进行金字塔的构建,最后再从最小尺寸的特征再恢复到大尺寸的特征
第三种,也就是本文提出的方法,舍弃了金字塔的结构,使用空洞卷积来控制不同branch的感受野,对不同感受野的特征图进行predict
整体流程如上图所示,对backbone得到的特征图使用不同大小的空洞卷积进行处理,得到不同感受野的branch,然后对这些branch分别预测之后,使用NMS进行处理
本章中也对感受野对目标检测的影响做了实验
实验表明,大感受野会降低小目标的精度,提高大目标的精度