机器学习-查准率、查全率、调和平均值
在机器学习里,预测出来的结果与真实情况总会有差距,两者的误差需要进行测试。
一.误差的表示方法
二.查准率、查全率
- 1.定义
- 2.具体解释
- 3.两者关联
三.调和平均值
- 1.公式
- 2.用参数β度量两者关系
一.误差的表示方法
误差的大小有时候不能视为评判算法效果的依据,这时需要引进查准率和查全率。
二.查准率、查全率
-
1.定义
设查准率Precision与查全率Recall分别定义了为:
Precision=TP/(TP+FP) ,Recall=TP/(TP+FN) -
2.具体解释
查准率的意思就是在预测出来的正类样本中真实情况下的正类样本所占的比例 , 查全率的意思就是在真正情况下的正类样本中预测出来的正类样本所占的比例。
查准率考量对于数据集辨别真实能力,即排除披着真实数据外衣(即预测为正类,而实际是负类)的假向量的能力
查全率考量对于数据集包容真实能力,即能容忍与假向量多少相似度的真向量的能力 -
3.两者关联
一般来说,剔除假向量的能力越强,那么对于假向量的容忍度就越低(即使他是真的向量)
三.调和平均值
用一个F1值来综合评估查准率、查全率 , 它是查准率和查全率的调和平均值
-
1.公式
-
2.用参数β度量两者关系
如果β>1,召回率有更大影响;
如果β<1,精确率有更大影响;
如果β=1,精确率和召回率影响力相同,和F1形式一样