您的位置: 首页 > 文章 > faster rcnn深处理解

faster rcnn深处理解

分类: 文章 • 2024-11-24 21:01:40

faster r-cnn 是第一个完全可微分的检测模型。也就是从数据到模型输出的整条路径既可以 前行传播 forward ，也可以反向传播 backword 。是一个 end -to- end 模型。

faster r-cnn 发展进程

1. R-CNN :

特点：

候选区域 + 卷积特征提取 + （SVM）特征分类和边界回归

候选区域：select serch 方法；提取个数大约：1k~2k
特征提取：CNN 网络
分类和边框回归：事先训练的SVM 分类器分出类别后进行线性边框回归得到精准位置。

致命缺陷：

事先大量候选区域提取：（1）无法做到端到端训练；（2）占用大量磁盘空间
输入CNN 的图像大小固定尺寸，resize 破坏原有特征
每个region proposal 都经过CNN 网络计算，导致过多重复特征提取

2. fast R-CNN

特点

候选区域 + 特征提取 + softmax分类和边框回归

改进

特征提取后最后一个卷积层后加了一个ROI pooling layer，参考ssp,不再对图像进行resize。
损失函数使用了multi-task loss（多任务损失）函数，将边框回归直接加到CNN网络中训练。分类直接用softmax替代SVM进行分类。

3 faster R-CNN

faster rcnn 的亮点是它不要事先进行select serch 获取候选框后再进行训练，因此提出了 RPN 网络。
1. RPN
2. fast R-CNN

三者对比

faster rcnn深处理解