Faster-RCNN的代码实现以及原理

代码Github链接：https://github.com/jwyang/faster-rcnn.pytorch

代码比较好的中文解析：https://blog.****.net/weixin_43380510/article/details/83004127

Faster R-CNN的实现原理：https://blog.****.net/e01528/article/details/79615987

下面这幅图最清晰地展示了Faster R-CNN的原理：https://blog.****.net/u012457308/article/details/79566195

基于tensorflow的实现：

https://blog.****.net/char_QwQ/article/details/80980505

非极大值抑制（Non Maximum Suppression）：

https://blog.****.net/xiexu911/article/details/80609298

NMS操作步骤：

1.选出候选框中得分最高的一个，图中红色的框

Faster-RCNN的代码实现以及原理

2.去掉和红色的重叠度很高的候选框（重叠度用IOU计算，删除标准根据设定的阈值，如0.7），重叠度很高的候选框比较浪费计算，因此去掉。

Faster-RCNN的代码实现以及原理

之后在剩余的框中继续采用以上顺序，选取边框，找到所有曾经被保留下来的矩形框。

非极大值抑制实际是在去冗余。

附详细步骤：

假设有ABCDEF这么多个得分框（已经按照得分从小到大排序）。

1、从最大概率矩形框F开始，分别判断A~E与F的重叠度IOU是否大于某个设定的阈值;
2、假设B、D与F的重叠度超过阈值，那么就扔掉B、D；并标记第一个矩形框F，是我们保留下来的。
3、从剩下的矩形框A、C、E中，选择概率最大的E，然后判断E与A、C的重叠度，重叠度大于一定的阈值，那么就扔掉；并标记E是我们保留下来的第二个矩形框。
4、一直重复这个过程，找到所有曾经被保留下来的矩形框。

一行代码改进NMS：Soft-NMS

参考：https://blog.****.net/shuzfan/article/details/71036040

Motivation

绝大部分目标检测方法，最后都要用到 NMS-非极大值抑制进行后处理。通常的做法是将检测框按得分排序，然后保留得分最高的框，同时删除与该框重叠面积大于一定比例的其它框。

这种贪心式方法存在如下图所示的问题：红色框和绿色框是当前的检测结果，二者的得分分别是0.95和0.80。如果按照传统的NMS进行处理，首先选中得分最高的红色框，然后绿色框就会因为与之重叠面积过大而被删掉。

另一方面，NMS的阈值也不太容易确定，设小了会出现下图的情况（绿色框因为和红色框重叠面积较大而被删掉），设置过高又容易增大误检。

Faster-RCNN的代码实现以及原理

思路：不要粗鲁地删除所有IOU大于阈值的框，而是降低其置信度。

之前是将IOU大于阈值的窗口的得分全部置为0，soft-NMS思想是：M为当前得分最高框，bibi 为待处理框，bibi 和M的IOU越大，bibi 的得分sisi 就下降的越厉害。

Faster-RCNN的代码实现以及原理

非极大值抑制（Non Maximum Suppression）：

一行代码改进NMS：Soft-NMS

Motivation

相关推荐