【目标检测】 IterDet模型简介、TIDE评价指标介绍
来源 | 极链AI云(性价比最高的共享GPU算力平台,双十活动进行中 10.9-10.11,新人注册可领取198元大礼包,价值100小时的免费使用时长,领取地址:https://cloud.videojj.com/)
作者 | 小仇 极链AI云技术原创奖励计划
原文地址 |
[目标检测] IterDet(Iterative Scheme for Object Detection in Crowded Environments)模型简介
[目标检测-评价指标] TIDE(A General Toolbox for Identifying Object Detection Errors)介绍
一、IterDet模型简介
这里介绍用于拥挤环境的目标检测算法IterDet。
论文链接:https://arxiv.org/pdf/2005.05708.pdf
源码链接:https://github.com/saic-vul/iterdet
拥挤目标检测存在的主要问题:
1.在存在相同类别的多个对象的情况下,很难区分两个盒子是属于同一对象还是对应于不同的重叠对象。
2.严重拥挤的实例的较少的视觉特征几乎无法提供足够的信息来进行精确的物体检测
主要应用领域:街道上行人 显微镜图像中的细菌
方法
提出的方案不是同时检测图像中的所有对象,而是提供迭代检测结果。在每次迭代中,都会检测到一个新的对象子集。从前一次迭代中检测到的盒子将在下一次迭代中传递到网络,以避免重复检测。推断过程中一个过程只预测一部分目标框。将前一步预测生成的图片通过一个卷积网络与一般第一层backbone得到的特征图合并。
训练过程中,将训练集分成无交集的Bold和Bnew,训练将Bold与历史图像共同预测剩余的Bnew。
实验
AdaptIS:
CrowdHuman:
WiderPerson:
二、TIDE评价指标介绍
通用目标检测和实例分割领域常用的评价指标是COCO数据集的mAP指标,但该指标偏学术,工程解释性不强。这篇论文中提供一个自动计算错误类型所占比例和FN、FP比例的工具箱。
论文链接:https://arxiv.org/abs/2008.08115
源码地址:https://github.com/dbolya/tide
工具介绍
为了计算mAP,我们首先为检测器提供了每个图像的预测列表。然后,将图像中的每个GT最多匹配一次预测框。预测框中满足与地面真实情况具有相同的类别,并且IoU重叠大于某个阈值的作为TP。如果存在多个预测框与GT覆盖了大于阈值则将覆盖率最大的作为TP,别的作为FN。定义前景 IOU阈值tf,背景IOU阈值tb。
论文中提到的错误类型:
1.Classification error IOU>tf但类别不同
2.Localization error 类别相同但tb<IOU<tf
3.Both classification and localization error
4.Duplicate error 存在多个同类别的预测框对应GT满足IOU>tf
5.Background error 所有的GT都满足IOU<tb,即背景错认为是目标物
6.Missed Ground Truth 没有预测框与某一GT对应
因为导师项目和论文刚用过这个工具箱,完全兼容最新版本的mmdetection生成的json文件和maskrcnn benchmark生成的json文件,像作者说的几行代码可以快速计算所需指标。
想要认识更多深度学习小伙伴,交流更多技术问题,欢迎关注公众号“极链AI云”(为你提供性价比最高的共享算力平台,官网地址:https://cloud.videojj.com/)