RCNN、Fast-RCNN Faster-RCNN大致区别总结

RCNN大致步骤：先提取proposal，然后将proposal输入CNN提取特征，使用SVM分类，最后做bbox reg。

缺点：速度。提取proposal的时候计算机进行大量重复计算

Fast改进：ROI pooling

RCNN、Fast-RCNN Faster-RCNN大致区别总结

在fast中，作者将输入变为一整张图片，通过ROI再进行特征选择。

并且将bbox reg和区域分类都加入网络变成了multi-task

Fast将RCNN每一个框都要单独进CNN入这一大缺点改进，提升了速度。

RCNN、Fast-RCNN Faster-RCNN大致区别总结

尽管fast极大地提高了速度，但是筛选特征框还是需要花费大量的时间，那么有没有办法进一步提高选择框的速度？

使用 RPN（之前都是使用特定的算法选择）

RCNN、Fast-RCNN Faster-RCNN大致区别总结

关于RPN：

在CNN提取的feature map上滑动窗口

提出两个class， reg损失函数

滑动窗口（sliding window）提供了目标的大致位置

Reg回归进一步确定了目标的精确位置

RCNN、Fast-RCNN Faster-RCNN大致区别总结

一种网络提供四个损失：

RPN classification（确定选择anchor的好坏 1或0）

RPN localation （选择框proposal的位置 image->proposal）

Fast RCNN classification（所有类别分类）

Fast RCNN localation（对于proposal上的box的位置 proposal->box）

RCNN、Fast-RCNN Faster-RCNN大致区别总结