[论文笔记]DSSD : Deconvolutional Single Shot Detector
论文”DSSD : Deconvolutional Single Shot Detector”是对目标检测方法SSD
(“SSD: Single Shot MultiBox Detector”)的改进版,都是同一作者团队发表的。
论文链接:https://arxiv.org/pdf/1701.06659
SSD的缺点:
虽然SSD利用了浅层的特征来检测小目标,(浅层 small receptive field 和 dense feature map),但是浅层比较缺乏语义信息(semantic information),所以检测小目标的效果还是不太好。
因此在SSD的网络结构中加上去卷积使得去卷积层既有丰富的特征信息又有丰富的语义信息,网络结构如下:
主要改进如下:
一、VGG 改为Residual-101
二、添加deconvolution层
三、aspect ratio 增加一项1.6 (2,3,1.6)
四、预测模型添加卷积和skip connection
去卷积模块是对上一层的卷积map进行去卷积操作并且加上前面对称卷积层的信息:
最后目标预测层的结构如下图(c)
SSD使用的是(a),直接使用3*3的卷积预测位置和类别,(c)增加了skip connection和几层卷积,效果要比(a)好一些,再增加一层skip 结构(d),效果不会提升多少,还会增加计算量,所以选用(c)
对于分辨率比较小的图像来讲(300*300),检测结果VGG与Residual-101效果差不多,(小的图像不需要太深的网络)
论文统计了训练数据中的长宽比,大部分位于[1,3],添加1.6
最后和各个检测方法的比较结果
可以看出mAP确实提高了一些,不过也就差不过1%,而速度却下降了很多。
下面是SSD和DSSD的检测效果图,从图上看,DSSD效果还是不错的: