Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

RCNN相对于传统的目标检测算法,依然采用了传统的流程,先找目标区域,再提取特征,但是引入了CNN,可以采用GPU,最后使用SVM进行分类。

Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

RCNN模型由三部分组成:

1. 先在ILSVRC2012上面训练一个1000类的分类器,保存下来。

2. 加载一的模型,利用ss算法生成的候选区域和我们标注的区域进行比较,如果重合读大于0.5则作为正样本,否则作为负样本。

3. 训练二分类器,IOU 大于0.7为正样本,小于0.3为负样本,0.3和0.7之间的丢掉不训练。

图片的转换方法:等比缩放,填充缩放,非等比缩放。

Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

IOU定义:定义了两个bounding box的重叠度。

Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记

IOU=(A∩B)/(A∪B)定义为,也即重叠面积跟求并面积的比值。

非极大值抑制:将多个候选矩形框,按照分类器给出的概率进行排序,首先选择概率最大的一个,然后从剩下的分别与最大的求IOU,假设IOU超过一定的阈值,则舍弃超过的这些阈值的候选框。以此类推,从剩下的候选框中选择最大的概率的候选框进行分别与剩下的进行IOU的重合度计算。

最后需要一个回归器,做Bounding box和Ground truth之间的预测。

fw

结果:

PASCAL VOC 2010测试集上实现了53.7%的mAP;

PASCAL VOC 2012测试集上实现了53.3%的mAP;

 

 

 

参考文章:

1. https://blog.****.net/xjz18298268521/article/details/52412991

2. https://blog.****.net/u014696921/article/details/52824097