机器学习的性能度量指标

机器学习的性能度量指标


对学习器的泛化性能进行评估,不仅需要有效可行的实验估计方法,还需要有衡量模型泛化能力的评价标准,这就是性能度量。
机器学习的性能度量指标

错误率和精度

错误率是测试集中判断错误的样本数量占样本总数的比列,精度是正确样本数量占样本总数的比。
机器学习的性能度量指标
机器学习的性能度量指标
机器学习的性能度量指标

查准率、查全率与F1

错误率和准确率虽然经常使用,但是不能满足我们所有任务的要求。再次基础上,提出了查准率、查全率和F1。
以西瓜识别为列子,我们知道有多少瓜是错误识别的还不够,生活中需要知道在错误识别瓜的好坏中,原本是好瓜的被识别为坏瓜所占的比列,这个一般称为查全率,而坏瓜中有多少被识别为好瓜,称为查准率。
机器学习的性能度量指标F1是基于查全率和查准率的调和平均定义的,
机器学习的性能度量指标但是在实际情况中,对于查全率和查准率会有一定的侧重,根据实际情况需要调整侧重比列,这时候需要使用:
机器学习的性能度量指标
ß>1 时查全率有更大影响, ß <1 时查准率有更大的影响