SSD论文阅读笔记
SSD: Single Shot MultiBox Detector
论文arxiv链接:https://arxiv.org/pdf/1605.06409v2.pdf
- 亮点在于对多个size的featuremap产生各自scale的bbox:
- scale采取的是0-1的归一化scale,假设一共利用了m个大小不同的feature map,就会有m个scale,对于一个第k个featuremap,每一个location的default bbox的scale是:,而aspect对每一个featuremap都是, bbox的长宽计算方法是,对于的情况再加一种长宽都为的bbox,所以对于每一个feature map的每一个location都有6个default bbox. 假设第k个feature map的size是那么feature map
上索引为的default bbox的中心对应到原图的位置是其中 - 此外有一点需要注意的是,不同于其它检测器在训练时match GTbox的时候只选择与dtbox iou最高的GTbox为GT, SSD是通过阈值选择的,也即只要iou超过某个阈值(一般是0.5),就认为是GT,也就是说同一个dt可以match到多个GT,具体还得看代码