分类模型的评估指标

1)混淆矩阵:

2)准确率:

3)精确率(查准率):

分类模型的评估指标

4)召回率(recall,查全率):

分类模型的评估指标

精准率和召回率是相互矛盾的两个参数;精准率变高,召回率会变低;反之亦然。

F1-score:综合精准率和召回率的指标

                  分类模型的评估指标

5)PR曲线:

P-R曲线,即横轴为precision,纵轴为recall的曲线,通过不同模型之间曲线的高低,来判断模型的优劣,PR曲线也高,模型越优;

(1)如何绘制PR曲线

precision-recall的值,是根据分类的阈值(threshold)计算的,基于不同的阈值,precision-recall值也会波动。

在sklearn中,不能直接设置threshold,API采用model.decision_function(data)返回预测的得分值(score), 根据score>=threshold对data进行划分。

API使用方法:

decision_scores = model.decision_function(X_test)

分类模型的评估指标

plt.plot(precisions,recalls)

plt.show()

(2)如何观察PR曲线,根据PR曲线选择模型

      分类模型的评估指标

如图所示,通过两个模型,或者两个模型给与不同的调参,绘制除了如上的两根PR曲线,显然,上面的曲线精度更高(pre一定的时候,recall更大),这种情况,说明上面曲线对应的模型更优;

6)ROC曲线

Receiver Operation Characteristic Curve

分类模型的评估指标

a. 曲线反应什么意义,如何根据曲线选择/调优模型(FPR,TPR)的面积

分类模型的评估指标

b. 如何绘制ROC曲线

c. ROC的应用场合:比较两个模型,孰优孰劣

7)AUC(area under ROC curve)指标