faster rcnn深处理解

faster r-cnn 是第一个完全可微分的检测模型 。也就是从数据到模型输出的整条路径既可以 前行传播 forward ,也可以反向传播 backword 。是一个 end -to- end 模型。

faster r-cnn 发展进程

1. R-CNN :

特点

候选区域 + 卷积特征提取 + (SVM)特征分类 和 边界回归

候选区域:select serch 方法; 提取个数大约:1k~2k
特征提取:CNN 网络
分类和边框回归: 事先训练的SVM 分类器分出类别后 进行线性边框回归得到精准位置。

致命缺陷

  1. 事先大量候选区域提取:(1)无法做到端到端训练;(2)占用大量磁盘空间
  2. 输入CNN 的图像大小固定尺寸,resize 破坏原有特征
  3. 每个region proposal 都经过CNN 网络计算,导致过多重复特征提取

2. fast R-CNN

特点

候选区域 + 特征提取 + softmax分类和边框回归

改进

  1. 特征提取后最后一个卷积层后加了一个ROI pooling layer,参考ssp,不再对图像进行resize。
  2. 损失函数使用了multi-task loss(多任务损失)函数,将边框回归直接加到CNN网络中训练。分类直接用softmax替代SVM进行分类。

3 faster R-CNN

faster rcnn 的亮点是它不要事先进行select serch 获取候选框后再进行训练 ,因此提出了 RPN 网络
1. RPN
2. fast R-CNN

三者对比

faster rcnn深处理解