Regions with Convolutional NeuralNetwork Features (RCNN) 学习笔记
RCNN相对于传统的目标检测算法,依然采用了传统的流程,先找目标区域,再提取特征,但是引入了CNN,可以采用GPU,最后使用SVM进行分类。
RCNN模型由三部分组成:
1. 先在ILSVRC2012上面训练一个1000类的分类器,保存下来。
2. 加载一的模型,利用ss算法生成的候选区域和我们标注的区域进行比较,如果重合读大于0.5则作为正样本,否则作为负样本。
3. 训练二分类器,IOU 大于0.7为正样本,小于0.3为负样本,0.3和0.7之间的丢掉不训练。
图片的转换方法:等比缩放,填充缩放,非等比缩放。
IOU定义:定义了两个bounding box的重叠度。
IOU=(A∩B)/(A∪B)定义为,也即重叠面积跟求并面积的比值。
非极大值抑制:将多个候选矩形框,按照分类器给出的概率进行排序,首先选择概率最大的一个,然后从剩下的分别与最大的求IOU,假设IOU超过一定的阈值,则舍弃超过的这些阈值的候选框。以此类推,从剩下的候选框中选择最大的概率的候选框进行分别与剩下的进行IOU的重合度计算。
最后需要一个回归器,做Bounding box和Ground truth之间的预测。
fw
结果:
PASCAL VOC 2010测试集上实现了53.7%的mAP;
PASCAL VOC 2012测试集上实现了53.3%的mAP;
参考文章:
1. https://blog.****.net/xjz18298268521/article/details/52412991
2. https://blog.****.net/u014696921/article/details/52824097