EfficientDet物体检测-论文笔记

1 简介

本文依据2020年《EfficientDet: Scalable and Efficient Object Detection》翻译总结。

在效率和准确率两方面兼顾。1，多尺度特征融合；2.模型的规模精简。

下图可以看到，EfficientDet需要很少的训练参数和训练次数就可以取得很好的成绩AP。
EfficientDet物体检测-论文笔记

如上图d，是BiFPN的结构，又融合多尺度，有比以前的a\b\c网络架构精简、准确率高。公式如下。
EfficientDet物体检测-论文笔记

不同的输入特征在不同的分辨率上，它们对输出的贡献各不同，所以可以对输入加上不同的权重，让网络学习这些权重。

BiFPN集成了双向跨尺度连接和fasf normalized fusion。

fasf normalized fusion公式：
EfficientDet物体检测-论文笔记

BiFPN公式的进一步细化：
EfficientDet物体检测-论文笔记

包括EfficientDet Architecture的backbone、多个BiFPN、多个class/box层。
EfficientDet物体检测-论文笔记

上图左侧，backbone是单步检测金字塔，BiFPN用了其{P3、P4、P5、P6、P7}级别的特征。

BiFPN：

BiFPN depth Dbifpn (#layers)
BiFPN width Wbifpn (#channels)

EfficientDet物体检测-论文笔记

#Box/class：

Box/class prediction network 的宽度与BiFPN 相同，Wpred = Wbifpn。
Box/class prediction network 深度如下：

EfficientDet物体检测-论文笔记

输入图片大小，能被128整除。

EfficientDet物体检测-论文笔记

下表列了不同深度EfficientDet的参数。
EfficientDet物体检测-论文笔记

可以看到EfficientDet参数很少，物体检测实验效果很好。
EfficientDet物体检测-论文笔记

语义分割（Semantic Segmentation）效果也很好，如下：

EfficientDet物体检测-论文笔记

下图可以看到compound scaling method（综合增强了all dimensions of depth/width/resolution for backbone, BiFPN, and box/class prediction networks），比只增强单个方面的效果好。

EfficientDet物体检测-论文笔记