
主干网络
主干网络使用了CSPDarknet53,这个网络最主要的区别就是,另外建立了一个从原始图像到最后featuremap的残差边。

查了下论文,CSPNet这个思想我之前也想到过,感觉损失了一篇CVPR的论文啊。不过只是想到这样连接可以增加空间信息的融合,原文中对前向传播和反向传播的分析是很透彻的,分析结果表明这个方法还可以降低方向传播的计算量。
SPP
使用了传统的SPP,用不同大小的池化核进行池化,然后再融合
PAN
使用了改进的PAN,不过整体还是一样,三个不同阶段的featurmap,三个不同尺度的输出。
Head
和YOLO3没有差异