极简笔记 DetNet: A Backbone network for Object Detection

极简笔记 DetNet: A Backbone network for Object Detection

文章的核心提出了一种专用于detection任务的backbone network:DetNet。目前检测网络的主流方法是基于classification网络加FPN和RPN结构进行定位。大部分分类网络通过减小深层的spatial size 来加大像素的感受野,较小的resolution一定程度影响了大物体定位的准确性。文章提出的DetNet在网络深层使用rate=2的空洞卷积替代原有bottleneck的3x3卷积,在不缩小spatial size,小幅增加计算量的同时增加像素感受野,以增加检测的准确性。为了减小计算量,深层部分的channel数停留在256没有增加。
极简笔记 DetNet: A Backbone network for Object Detection

文章的主要对比实验室ResNet50-FPN结构,因此构造了对应的DetNet59结构,大致结构对比如上图。DetNet是对骨架网络进行改造,因此可以同理加上FPN结构。因为DetNet59的计算量(FLOPs-4.8G)还是会比ResNet50的计算量(FLOPs-3.8G),有人可能会说提高的性能是由于更大的计算量带来的,于是文章又加了ResNet101(FLOPs-7.6G)的对比实验,显示在det任务上DetNet以更少的计算量取得了更高的检测结果。
极简笔记 DetNet: A Backbone network for Object Detection

但是接下来文章就偷懒了,剩下的分析就只剩和ResNet50的对比了。在对比average precision(AP)和average recall(AR)时大中小三种尺度的物体DetNet59都超过了ResNet50,一定程度上说明提高深层高resolution真的很有用。当然要是这部分做个ResNet101的对比就更具有说服力了。
极简笔记 DetNet: A Backbone network for Object Detection
极简笔记 DetNet: A Backbone network for Object Detection

文章用的dilated res-block,在cut部分使用了1x1卷积替换identity map。关于这点也做了一个对比实验来说明这样确实有用。
极简笔记 DetNet: A Backbone network for Object Detection
极简笔记 DetNet: A Backbone network for Object Detection

因为DetNet只是一个骨架网络,而且可以扩展到其他类型网络,文章最后还把DetNet59放到MaskRCNN框架里,显示性能确有提高。
极简笔记 DetNet: A Backbone network for Object Detection

个人以为该文章的缺陷在于DRN结构使用了同样的rate,并没有覆盖到所有像素,可以利用一些现有方法例如rate=1,2,5交错的方式使用空洞卷积来覆盖feature map,也许会更好。