RCNN、Fast-RCNN Faster-RCNN大致区别总结
RCNN大致步骤:先提取proposal,然后将proposal输入CNN提取特征,使用SVM分类,最后做bbox reg。
缺点:速度。提取proposal的时候计算机进行大量重复计算
Fast改进:ROI pooling
在fast中,作者将输入变为一整张图片,通过ROI再进行特征选择。
并且将bbox reg和区域分类都加入网络变成了multi-task
Fast将RCNN每一个框都要单独进CNN入这一大缺点改进,提升了速度。
尽管fast极大地提高了速度,但是筛选特征框还是需要花费大量的时间,那么有没有办法进一步提高选择 框 的速度?
使用 RPN(之前都是使用特定的算法选择)
关于RPN:
在CNN提取的feature map上滑动窗口
提出两个class, reg损失函数
滑动窗口(sliding window) 提供了目标的大致位置
Reg回归进一步确定了目标的精确位置
一种网络 提供四个损失:
RPN classification(确定选择anchor的好坏 1或0)
RPN localation (选择框proposal的位置 image->proposal)
Fast RCNN classification(所有类别分类)
Fast RCNN localation(对于proposal上的box的位置 proposal->box)