Faster-RCNN的代码实现以及原理
代码Github链接:https://github.com/jwyang/faster-rcnn.pytorch
代码比较好的中文解析:https://blog.****.net/weixin_43380510/article/details/83004127
Faster R-CNN的实现原理:https://blog.****.net/e01528/article/details/79615987
下面这幅图最清晰地展示了Faster R-CNN的原理:https://blog.****.net/u012457308/article/details/79566195
基于tensorflow的实现:
https://blog.****.net/char_QwQ/article/details/80980505
非极大值抑制(Non Maximum Suppression):
https://blog.****.net/xiexu911/article/details/80609298
NMS操作步骤:
1.选出候选框中得分最高的一个,图中红色的框
2.去掉和红色的重叠度很高的候选框(重叠度用IOU计算,删除标准根据设定的阈值,如0.7),重叠度很高的候选框比较浪费计算,因此去掉。
之后在剩余的框中继续采用以上顺序,选取边框,找到所有曾经被保留下来的矩形框。
非极大值抑制实际是在去冗余。
附详细步骤:
假设有ABCDEF这么多个得分框(已经按照得分从小到大排序)。
1、从最大概率矩形框F开始,分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
2、假设B、D与F的重叠度超过阈值,那么就扔掉B、D;并标记第一个矩形框F,是我们保留下来的。
3、从剩下的矩形框A、C、E中,选择概率最大的E,然后判断E与A、C的重叠度,重叠度大于一定的阈值,那么就扔掉;并标记E是我们保留下来的第二个矩形框。
4、一直重复这个过程,找到所有曾经被保留下来的矩形框。
一行代码改进NMS:Soft-NMS
参考:https://blog.****.net/shuzfan/article/details/71036040
Motivation
绝大部分目标检测方法,最后都要用到 NMS-非极大值抑制进行后处理。 通常的做法是将检测框按得分排序,然后保留得分最高的框,同时删除与该框重叠面积大于一定比例的其它框。
这种贪心式方法存在如下图所示的问题: 红色框和绿色框是当前的检测结果,二者的得分分别是0.95和0.80。如果按照传统的NMS进行处理,首先选中得分最高的红色框,然后绿色框就会因为与之重叠面积过大而被删掉。
另一方面,NMS的阈值也不太容易确定,设小了会出现下图的情况(绿色框因为和红色框重叠面积较大而被删掉),设置过高又容易增大误检。
思路:不要粗鲁地删除所有IOU大于阈值的框,而是降低其置信度。
之前是将IOU大于阈值的窗口的得分全部置为0,soft-NMS思想是:M为当前得分最高框,bibi 为待处理框,bibi 和M的IOU越大,bibi 的得分sisi 就下降的越厉害。