faster rcnn深处理解
faster r-cnn 是第一个完全可微分的检测模型 。也就是从数据到模型输出的整条路径既可以 前行传播 forward ,也可以反向传播 backword 。是一个 end -to- end 模型。
faster r-cnn 发展进程
1. R-CNN :
特点:
候选区域 + 卷积特征提取 + (SVM)特征分类 和 边界回归
候选区域:select serch 方法; 提取个数大约:1k~2k
特征提取:CNN 网络
分类和边框回归: 事先训练的SVM 分类器分出类别后 进行线性边框回归得到精准位置。
致命缺陷:
- 事先大量候选区域提取:(1)无法做到端到端训练;(2)占用大量磁盘空间
- 输入CNN 的图像大小固定尺寸,resize 破坏原有特征
- 每个region proposal 都经过CNN 网络计算,导致过多重复特征提取
2. fast R-CNN
特点
候选区域 + 特征提取 + softmax分类和边框回归
改进
- 特征提取后最后一个卷积层后加了一个ROI pooling layer,参考ssp,不再对图像进行resize。
- 损失函数使用了multi-task loss(多任务损失)函数,将边框回归直接加到CNN网络中训练。分类直接用softmax替代SVM进行分类。
3 faster R-CNN
faster rcnn 的亮点是它不要事先进行select serch 获取候选框后再进行训练 ,因此提出了 RPN 网络。
1. RPN
2. fast R-CNN