深度学习评价指标

与目标识别不同，目标检测中不仅仅需要在一张图片中检测到是否含有某物体，还需要将该物体的位置找出来，所以在判定模型的好坏时，就有其标准--mAP

一、Mean Average Precision--mAP

(一)什么是mAP

平均精度均值（mAP）是预测目标位置以及类别的这一类算法的性能度量标准。mAP对于评估目标定位模型、目标检测模型以及实例分割模型非常有用。

在模型预测时，输出的bounding box是有很多的，但是大多数都是置信度很小的，我们zhix只需要输出置信度chao超过某个阈值的bounding box。

（二）mAP是怎么计算的

（1）准确率---precision

若yige一个待检测的物体为狗，我们将被正确识别的狗，即检测为狗实际也为狗，成为true positives。将被正确识别为猫实际也为猫，成为true negatives。被错误识别为狗的猫成为False positive，被错误识别为猫的狗成为False negatives。

则precision的计算为：

深度学习评价指标

准确率可以反映一个类别的正确预测正确率。

（2）召回率----recall

recall的计算为：

深度学习评价指标

召回率指的是一类目标有多少被识别出来了。

（3）精确度---accuracy

精确度就是在所有预测的样本中，识别正确的占了多少。

深度学习评价指标

准确率和召回率是相互影响的，因为如果想要提高准确率就会把预测的置信率阈值调高，所有置信率较高的预测才会被显示出来，而那一些正确预测（true positive）可能因为置信率比较低而没有被显示了。一般情况下准确率高、召回率就低，召回率低、准确率高，如果两者都低，就是网络出问题了。一般情况，用不同的阈值，统计出一组不同阈值下的精确率和召回率，如下图：

深度学习评价指标

3、AP值

Average precision 平均精确度

如何衡量一个模型的性能，单纯用precision和recall都不科学。于是人们想到，为何不把PR曲线下的面积当作衡量尺度？于是就

有了AP值这一概念。这里的average等于对precision取平均。

4、mAP值

是对多个验证集个体求平均AP值。如下图

深度学习评价指标

二、影响mAP的因素

一般来说影响mAP的原因有很多，主要以下几个：

1、不好的训练数据

2、训练数据不够多

3、标注的框不够准确

4、数据的多变性

有的时候增加训练数据可能mAP并不会增加多少。当然了，使用表现更好的网络，其mAP自然地也会更加的高。

深度学习评价指标

相关推荐