FPN相关问题学习记录

关于FPN的学习,拖了一周,记录一下,我先是看的论文,然后看的博客:https://blog.csdn.net/WZZ18191171661/article/details/79494534 阅读量比较高,博主讲的也比较清晰,记录一下。

1.第一点疑问,关于AP50的计算方式的疑问,参考链接:https://blog.csdn.net/qq_41994006/article/details/81051150,讲的比较清楚。

2.第二点疑问,关于图像金字塔和特征金字塔,首先明确这两个东西是不同的,这点我是看文章明白的,推荐大家把原论文基本原理部分看一遍。

3.关于横向连接,看了一篇博客是这么解释的,现在对横向连接有了第一个感觉就是怎么是这么融合的,ResNet每个阶段的输出和经过上采样之后的输出融合,对网络究竟影响在何处。

另外我想研究FPN用在目标检测领域,对于Anchor的理解,还需要进一步细化。

自底向上的过程实际上就是前馈神经网络的计算过程。以ResNet为例,对每个阶段提取最后一个residual block的输出(conv2,conv3,conv4和conv5)来构成特征金字塔,相对于输入图像,步长分别为4、8、16、32像素(不使用conv1是因为它占内存太大)。自顶向下的过程通过上采样完成,也就是把高层的feature map通过最近邻上采样使其尺寸*2。横向连接就是将上采样的高层feature map和自底向上产生的feature map(通过1*1的卷积操作来减少feature map的通道数)融合(元素加)。通过上述过程不断迭代产生最好的feature map,即C2。在每个合并的map上附加一个3*3卷积产生最终特征映射,以降低上采样的混叠效应。

 

关于FPN最好结合图片来理解最好,这是从我参考的博客里截取过来的。

FPN相关问题学习记录

原论文对应的部分贴在下边

 FPN相关问题学习记录

原论文中提到参数共享对于性能影响不大,姑且这么认为(在RPN中测试)。

 

其他参考链接:

1.https://blog.csdn.net/baidu_30594023/article/details/82623623

2.http://www.mamicode.com/info-detail-2602526.html

3.https://blog.csdn.net/Jason_mmt/article/details/82662306 (下一步研究)

 

后续继续补充...