Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

RCNN相对于传统的目标检测算法，依然采用了传统的流程，先找目标区域，再提取特征，但是引入了CNN，可以采用GPU，最后使用SVM进行分类。

RCNN模型由三部分组成：

1. 先在ILSVRC2012上面训练一个1000类的分类器，保存下来。

2. 加载一的模型，利用ss算法生成的候选区域和我们标注的区域进行比较，如果重合读大于0.5则作为正样本，否则作为负样本。

3. 训练二分类器，IOU 大于0.7为正样本，小于0.3为负样本,0.3和0.7之间的丢掉不训练。

图片的转换方法：等比缩放，填充缩放，非等比缩放。

Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

IOU定义：定义了两个bounding box的重叠度。

Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

IOU=(A∩B)/(A∪B)定义为，也即重叠面积跟求并面积的比值。

非极大值抑制：将多个候选矩形框，按照分类器给出的概率进行排序，首先选择概率最大的一个，然后从剩下的分别与最大的求IOU，假设IOU超过一定的阈值，则舍弃超过的这些阈值的候选框。以此类推，从剩下的候选框中选择最大的概率的候选框进行分别与剩下的进行IOU的重合度计算。

最后需要一个回归器，做Bounding box和Ground truth之间的预测。

结果：

PASCAL VOC 2010测试集上实现了53.7%的mAP；

PASCAL VOC 2012测试集上实现了53.3%的mAP；

参考文章：