准确率、精确率、召回率、F1-measure简单总结

准确率、精确率、召回率、F1-measure简单总结

- 相关(Relevant),正类 无关(NonRelevant),负类
被检索到(Retrieved) true positives(TP 正类判定为正类) false positives(FP 负类判定为正类)
未被检索到(Not Retrieved) false negatives(FN 正类判定为负类) true negatives(TN 负类判定为负类)

准确率(Accuracy)

ATP+TNP+NA=\frac{TP + TN} { P + N}
对于给定的测试数据集,分类器正确分类的样本数与总样本数之比

精确率(precision)

P=TPTP+FP P = \frac{TP}{TP+FP}
计算的是所有"正确被检索的item(TP)"占所有"实际被检索到的(TP+FP)"的比例

预测为正的样本中有多少是真正的正样本,它是针对我们预测结果而言的

Precision又称为查准率

召回率(recall)

R=TPTP+FN R = \frac{TP}{TP+FN}
计算的是所有"正确被检索的item(TP)"占所有"应该检索到的item(TP+FN)"的比例

样本中的正例有多少被预测正确了, 它是针对我们原来的样本而言的

Recall又称为查全率

F1-measure值

就是精确值和召回率的调和均值

2F1=1P+1R \frac{2}{F_1} = \frac{1}{P} + \frac{1}{R}

调整下也就是

F1=2PRP+R=2TP2TP+FP+FNF_1 = \frac{2PR}{P+R} = \frac{2TP}{2TP + FP + FN}

将F-measure一般化

Fa=(a2+1)PRa2(P+R) F_a = \frac{(a^2 + 1 )PR}{a^2(P+R)}

a=1a = 1 时, F1=FaF_1 = F_a

F1-measure认为精确率和召回率的权重是一样的,但有些场景下,我们可能认为精确率会更加重要,调整参数a,使用Fa-measure可以帮助我们更好的evaluate结果.

总结

准确率就是找得对,召回率就是找得全

参考:

  1. 准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure
  2. 准确率(Precision)、召回率(Recall)以及综合评价指标(F1-Measure )