汇总|目标检测中的数据增强、backbone、head、neck、损失函数

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

作者:Tom Hardy

https://zhuanlan.zhihu.com/p/137769687

本文仅做学术分享,如有侵权,请联系删除。

一、数据增强方式

  1. random erase

  2. CutOut

  3. MixUp

  4. CutMix

  5. 色彩、对比度增强

  6. 旋转、裁剪

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

解决数据不均衡:

  • Focal loss

  • hard negative example mining

  • OHEM

  • S-OHEM

  • GHM(较大关注easy和正常hard样本,较少关注outliners)

  • PISA

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

二、常用backbone

  1. VGG

  2. ResNet(ResNet18,50,100)

  3. ResNeXt

  4. DenseNet

  5. SqueezeNet

  6. Darknet(Darknet19,53)

  7. MobileNet

  8. ShuffleNet

  9. DetNet

  10. DetNAS

  11. SpineNet

  12. EfficientNet(EfficientNet-B0/B7)

  13. CSPResNeXt50

  14. CSPDarknet53

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

三、常用Head

Dense Prediction (one-stage):

  1. RPN

  2. SSD

  3. YOLO

  4. RetinaNet

  5. (anchor based)

  6. CornerNet

  7. CenterNet

  8. MatrixNet

  9. FCOS(anchor free)

Sparse Prediction (two-stage):

  1. Faster R-CNN

  2. R-FCN

  3. Mask RCNN (anchor based)

  4. RepPoints(anchor free)

四、常用neck

Additional blocks:

  1. SPP

  2. ASPP

  3. RFB

  4. SAM

Path-aggregation blocks:

  1. FPN

  2. PAN

  3. NAS-FPN

  4. Fully-connected FPN

  5. BiFPN

  6. ASFF

  7. SFAM

  8. NAS-FPN

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

五、Skip-connections

  1. Residual connections

  2. Weighted residual connections

  3. Multi-input weighted residual connections

  4. Cross stage partial connections (CSP)

六、常用**函数和loss

**函数:

  • ReLU

  • LReLU

  • PReLU

  • ReLU6

  • Scaled Exponential Linear Unit (SELU)

  • Swish

  • hard-Swish

  • Mish

loss:

  • MSE

  • Smooth L1

  • Balanced L1

  • KL Loss

  • GHM loss

  • IoU Loss

  • Bounded IoU Loss

  • GIoU Loss

  • CIoU Loss

  • DIoU Loss

七、正则化和BN方式

正则化:

  • DropOut

  • DropPath

  • Spatial DropOut

  • DropBlock

BN:

  • Batch Normalization (BN)

  • Cross-GPU Batch Normalization (CGBN or SyncBN)

  • Filter Response Normalization (FRN)

  • Cross-Iteration Batch Normalization (CBN)

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

八、训练技巧

  • Label Smoothing

  • Warm Up

推荐阅读

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

▲长按加微信群或投稿

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

汇总|目标检测中的数据增强、backbone、head、neck、损失函数

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题