Faster-RCNN笔记

（1）anchor机制
Faster-RCNN笔记

实验中，原图大小1000*600，经过五层卷积后缩小为原来的1/16，feature map大小为60*40。这里面的关键就是选择合适的sliding window大小，使得在feature map上任意一个object region的信息必须包含在一个sliding window内。然后再选择合适大小和比例的anchor box 来生成region proposals。
每个anchor box有四个坐标（x，y，w，h），将它们平移缩放后，就可以得到原始图片中object 的bounding box的四个坐标（x’,y’,w’,h’）。如果将它们与ground truth相比较，就能够得到它们的分类分数。

相关推荐