一些评价指标
我们将算法预测的结果分成四种情况:
- 正确肯定(True Positive,TP) :预测为真,实际为真
- 正确否定(True Negative,TN) :预测为假,实际为假
- 错误肯定(False Positive,FP) :预测为真,实际为假
- 错误否定(False Negative,FN):预测为假,实际为真
则:
查准率(精确度Precision)= TP/(TP+FP)
例,在所有我们预测有恶性肿瘤的病人中,实际上有恶性肿瘤的病人的百分比,越高越好。
查全率(召回率Recall)= TP/(TP+FN)
例,在所有实际上有恶性肿瘤的病人中,成功预测有恶性肿瘤的病人的百分比,越高越好
准确率(Accuracy)= TP+TN/(TP+TN+FP+FN)
例,在所有人(样本)中,成功预测有恶性肿瘤的病人加上成功预测没有肿瘤的人占全部参与测试的人的百分比,越高越好
F1Score = 2PR /(P+R)
其中P:查准率;R:召回率
查准率与查全率之间关系:
一般通过F1Score来权衡P与R