【论文阅读】YOLOv4: Optimal Speed and Accuracy of Object Detection
随着 YOLO 之父退出了 CV 届,号称 YOLOv4 的“继承者”通过在原 YOLO 技术上疯狂试探了众多崭新的 Tricks,通过强大的工程实践实现了速度与精度的有效提升!(有钱真好。。。)
论文链接:https://arxiv.org/abs/2004.10934v1
代码链接:https://github.com/AlexeyAB/darknet
摘要
有大量的特征被认为可提高卷积神经网络 (CNN) 的精度。需要在大型数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。某些功能只在某些模型、某些问题或只在小规模数据集上生效;而某些功能 (如 BN 和 残差连接) 适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权残差连接 (Weighted-Residual-Connections, WRC)、跨阶段部分连接 (Cross-Stage-Partial-connections, CSP)、跨小批量归一化 (Cross mini-Batch Normalization, CmBN)、自对抗训练 (Self-adversarial-training, SAT) 和Mish **。我们使用了新功能:WRC、CSP、CmBN、SAT、Mish **、Mosaic 数据增强、CmBN、DropBlock 正则化 和 CIoU 损失,并将其中一些功能结合起来,以达到 STOA:在 Tesla V100 上以约 65 FPS 的实时速度实现 MS COCO 数据集 43.5% AP (65.7% AP50) 。
图示