论文笔记-DetNet: A Backbone network for Object Detection

1. 介绍

目标检测是计算机视觉领域最基础的问题。目前的目标检测网络主要分为一级网络,YOLO’,SSD,RetinaNet等;二级网络,Fast R-CNN,Faster R-CNN,Mask R-CNN,R-FCN等。但是这些网络使用的骨架网络都是在ImageNet分类任务上预训练的网络,因此作者想提出一种基于目标检测任务预训练的骨架网络,名为DetNet。

2. DetNet

2.1 设计动机

现在目标检测网络的骨架结构都是在ImageNet上预训练的分类网络,而检测任务与分类任务有很大的不同。分类任务输出特征的空间分辨率很小,感受野很大,不利于对小的目标进行检测。因此作者提出了专门针对目标检测的骨架网络-DetNet,DetNet可以解决上述的问题。

2.2 DetNet设计

作者采用ResNet-50作为DetNet的基础,为了方便与ResNet进行比较,DetNet的1-4 stage与原始的ResNet完全相同。
论文笔记-DetNet: A Backbone network for Object Detection
设计要点主要为:
1. 相对ResNet,引入了额外的stage 6。在stage 4后,feature map的尺寸就不再减小,保持在原尺寸的1/16。
2. 在stage 4后的每一个stage,包含一个Figure 2 B和两个Figure 2 A。
3. stage 5和stage 6都在用256通道。

3. 实验

训练和推断的细节与MaskR-CNN完全一样。
论文笔记-DetNet: A Backbone network for Object Detection
论文笔记-DetNet: A Backbone network for Object Detection
论文笔记-DetNet: A Backbone network for Object Detection
论文笔记-DetNet: A Backbone network for Object Detection
论文笔记-DetNet: A Backbone network for Object Detection
论文笔记-DetNet: A Backbone network for Object Detection