SppNet中的spatial pyramid pooling(SPP)

SPP 提出的初衷是为了解决CNN对输入图片尺寸的限制。由于全连接层的存在,与之相连的最后一个卷积层的输出特征需要固定尺寸,从而要求输入图片尺寸也要固定。

SppNet中的spatial pyramid pooling(SPP)
任意尺寸的feature map三个尺度的金字塔层分别池化,将池化后的结果拼接得到固定长度的特征向量(图中的256为filter的个数),送入全连接层进行后续操作。

后来的Fast RCNN网络即借鉴了SPP的思想。
其中的ROI Pooling可理解为单尺度的SPP层。