混淆矩阵
混淆矩阵:
针对实际样本(Positive, Negitive)
针对预测结果(True, False)
TP 真阳 正样本预测为正例 预测正确
TN 真阴 负样本预测为负例 预测正确
FP 假阳 负样本预测为正例 预测错误
FN 假阴 正样本预测为负例 预测错误
1. 召回率Recall = TP / (TP+FN)
衡量原样本中正样本中预测正确的比例
也称为:灵敏度; 敏感性;查全率;
2. 精确率Precision = TP / (TP+FP)
表示预测为正例的样本中预测正确的比例
3. 特异性Specificity = TN / (TN+FP)
衡量原样本中负样本中预测正确的比例
4. ROC曲线
横轴: 假阳率 = FP /(TN+FP); 越小越好
预测为正例,但预测错误了,即负样本中预测为正例的,
也就是衡 量原样本中负例预测错误的比例,也等于(1 - 特
异性)
纵轴: 真阳率 = TP / (TP + FN); 越大越好
预测为正例,且预测正确了,即正样本中预测为正例的,
也就是衡 量原样本中正例预测正确的比例,也就是召回率
ROC曲线在斜对角线以下,则表示该分类器效果差于随机分类器,反之,效果
好于随机分类器,当然,我们希望ROC曲线尽量除于斜对角线以上,也就是向
左上角(0,1)凸
5. AUC(Area under the ROC curve)
AUC实际上就是ROC曲线下的面积,直观地反映了ROC曲线表达
的分类能力