目标检测之ROI-Pooling与ROI-Align的异同
以下是本人对ROI-Pooling与ROI-Align异同的理解,如若有误,欢迎大家留言纠正。
一、ROI-Pooling与ROI-Align的异同
- 在Faster RCNN中,步骤二和步骤三要经过量化处理,来对齐特征图坐标。每经过一次量化,就会造成原图目标的像素丢失
- 在特征图中,只有整数坐标的位置会有特征值,而浮点坐标没有对应特征值,所以需要向下取整,对齐特征图
- 上图中,每一个小方格有两层含义:1、特征的坐标;2、表示的特征值
- 在Mask RCNN中,步骤二和步骤三不做量化处理,保留浮点数坐标位置不变,经过双线性插值为浮点坐标匹配特征值。
- 在特征图中,整数坐标和浮点坐标的位置都会有特征值,而浮点坐标的特征值需要通过整数坐标的特征值做双线性插值处理
- 上图中,每一个小方格有两层含义:1、特征的坐标;2、表示的特征值
二、参考资料
1、目标检测之R-CNN系列
2、Fast R-CNN中的边框回归
3、目标检测之YOLO V1
3、目标检测之YOLO V2 V3
4、目标检测 1 : 目标检测中的Anchor详解
5、回归损失函数1:L1 loss, L2 loss以及Smooth L1 Loss的对比
6、回归损失函数2 : HUber loss,Log Cosh Loss,以及 Quantile Loss
7、一文搞懂交叉熵损失
8、ROI-Align 原理理解