机器学习评价指标

拟合问题

拟合问题比较简单,所用到的衡量指标也相对直观。假设yi是第i个样本的真实值,y^i是对第i个样本的预测值。

1. 平均绝对误差

平均绝对误差MAE(Mean Absolute Error)又被称为l1范数损失(l1-norm loss):

MAE(y,y^)=1nsamplesi=1nsamples|yiy^i|。

2. 平均平方误差

平均平方误差MSE(Mean Squared Error)又被称为l2范数损失(l2-norm loss):

MSE(y,y^)=1nsamplesi=1nsamples(yiy^i)2

分类

1. 精确率与召回率

精确率与召回率多用于二分类问题。精确率(Precision)指的是模型判为正的所有样本中有多少是真正的正样本;召回率(Recall)指的是所有正样本有多少被模型判为正样本,即召回。设模型输出的正样本集合为A,真正的正样本集合为B,则有:

Precision(A,B)=|AB||A|,Recall(A,B)=|AB||B|

有时候我们需要在精确率与召回率间进行权衡,一种选择是画出精确率-召回率曲线(Precision-Recall Curve),曲线下的面积被称为AP分数(Average precision score);另外一种选择是计算Fβ分数:

Fβ=(1+β2)precisionrecallβ2precision+recall   

β=1称为F1分数,是分类与信息检索中最常用的指标之一。

2.交叉熵代价函数

方差代价函数:

机器学习评价指标

在以Sigmoid函数为**函数时候,会导致权重和偏置更新非常缓慢(想了解具体细节的小伙伴看这一篇博文:http://blog.csdn.net/u012162613/article/details/44239919)。

为了克服这个缺点,引入了交叉熵代价函数:

机器学习评价指标