目标检测发展史归纳R-CNN,Fast R-CNN, Faster R-CNN
简单归纳R-CNN,Fast R-CNN, Faster R-CNN
早期
滑动窗口根据设定步长对图像进行分割,对每一小块分割出的图像用分类器进行分类(object 1 or 0)
局限:1. 滑动窗口的设定;2. 步长的设定
局限于精度和计算成本
R-CNN
采用图像分割算法,筛选出2000个色块,在这2000个色块上放置边界框(候选区域 Region Proposal)
每个候选框(色块)都需进行 * 2000次
- 将色块都修正成合适尺寸,输入CNN进行特征提取
- SVM 进行二分类 object 1 or 0 (classification)
- 回归器修正候选区域 x,y,w,h (regression)
其中最终为fc层(?看完论文再来确定)
Fast R-CNN
- 变动部分:
采用卷积形式实现滑动窗口(ROI Pooling,SPP Net精简)
采用conv替换fc
fc权重固定,故输入尺寸固定,采用conv(借由步长,padding调整)即没有该限制
Faster R-CNN
- 变动部分
采用卷积神经网络替换传统的图像分割产生的候选区域,方法为Region Proposal Network(RPN)