目标检测方法——SSD
SSD论文阅读
(Wei Liu——【ECCV2016】SSD Single Shot MultiBox Detector)
方法概括
文章的方法介绍
1.SSD主要用来解决目标检测的问题(定位+分类),即输入一张待测图像,输出多个box的位置信息和类别信息
2.测试时,输入一张图像到SSD中,网络输出一个下图最右边的tensor(多维矩阵),对该矩阵进行非极大值抑制(NMS)就能得到每个目标的位置和label信息
Figure2的最右图的1th-20th Channel表示类别,每一个Channel上的map对应原图,last 4 channel的每一个map分别对应x,y,w,h的偏移量。最后4个通道可以确定一个box的位置信息,前20个通道确定类别信息。
方法的pipeline和关键点
方法细节
模型结构:
多尺度特征图:
用来预测的卷积滤波器:
defaul box:
groundTruth的标定,损失函数:
default box和尺度的选择:
SSD的训练——Hard negative mining:
SSD的训练——数据扩增:
相关背景补充:
Atrous算法(hole算法):
FPS/SPF, Jaccard overlap:
二类分类/检测常用的评价标准 (recall, precision, f-measure, accuracy, error, PR曲线和ROC曲线,AP,AUC):
ImageNet多类分类的评价标准:
ImageNet单目标检测的评价标准:
ImageNet(多)目标检测的评价标准: