Faster-Rcnn记录

一、loss损失记录

文章来源:https://blog.****.net/wfei101/article/details/79809332
Faster-Rcnn记录图1
Faster-Rcnn记录
上述图关键点理解如下:
(1)Ncls=256:每个图片的所有anctor中正负样本各抽取128,若正样本不够128,负样本补,即每个图片是一个batch,batch-size=256。
(2)Nreg=2400:40*60指代feature map的尺寸,1/Nreg是对计算回归的loss的归一化,回归的loss是计算每个anctor位置偏移的相对像素值,然后再除以feature map的尺寸,相当于归一化到0-1之间。
(3)图1中loss公式是计算的一张图片的anctor的fg/bg分类和一张图片的128个anctor(只有fg,可能会小于128)的定位loss损失。i为一张图片选取的anctor索引。

二、rpn训练输出记录

文章来源:https://zhuanlan.zhihu.com/p/31426458
Faster-Rcnn记录
图3
(1)图3上下两条线,上面线和下面线分别有个18 和36,分别指代9×2和9×4, 9为每个像素点的anctor数,2指代二分类,4指代定位的四个指标。最后的输出为M×N×(9×2)和M×N×(9×4),M×N指代卷积后的feature map的尺寸。
(2)rpn训练输入的是选取的每个图片的256个anctor,但模型输出的是不只是256个anctor的信息,而是所有anctor的信息M×N(9×2)和M×N×(9×4),这个地方真正参与训练的是256个anctor,其他的anctor不参与计算,直接标记0,即M×N×(9×2)和M×N×(9×4)是所有anctor的信息,然后再输送到后面的网络。