Faster-RCNN笔记
(1)anchor机制
实验中,原图大小1000*600,经过五层卷积后缩小为原来的1/16,feature map大小为60*40。这里面的关键就是选择合适的sliding window大小,使得在feature map上任意一个object region的信息必须包含在一个sliding window内。然后再选择合适大小和比例的anchor box 来生成region proposals。
每个anchor box有四个坐标(x,y,w,h),将它们平移缩放后,就可以得到原始图片中object 的bounding box的四个坐标(x’,y’,w’,h’)。如果将它们与ground truth相比较,就能够得到它们的分类分数。