4.4.2分类模型评判指标(四) - ROC,AUC,GINI,KS,Lift,Gain,MSE总结
简介
分类模型的评判指标光是图就有好多,ROC,AUC,GINI,KS,Lift,Gain,MSE,这些有些是图有些是指标,放在一起乱七八糟搞得人分不清东南西北。所以这里我先整体给大家一个直观的介绍。省的以后再遇上这么多图的时候完全分不清是谁是谁。
三句话概括版本:
Confusion Matrix -> Lift,Gain,ROC。
ROC -> AUC,KS -> GINI。
MSE独立出来。
中文,英文,简称
在介绍之前,我们先重新明确一下这些图表的名称,中文、英文、简称,全部来熟悉一下:
记住这个之后,我们来理解一下他们之间的关系。
拟人化概括
其实,这些图之间的关系不是很复杂。我尝试着用一个小故事概括一下8位登场人物之间的关系。
故事是这样的:
首先,混淆矩阵是个元老,年龄最大也资历最老。创建了两个帮派,一个夫妻帮,一个阶级帮。
之后,夫妻帮里面是夫妻两个,一个Lift曲线,一个Gain曲线,两个人不分高低,共用一个横轴。
再次,阶级帮里面就比较混乱。
1. 帮主是ROC曲线。
2. 副帮主是KS曲线,AUC面积
3. AUC养了一个小弟,叫GINI系数。
最后,MSE是世外高人,游离在整个帮派系统之外。
好了,现在咱们应该比较清楚谁跟谁关系好,哪些曲线指标应该抱成一团儿了吧。
混淆矩阵:所有的基础
混淆矩阵其实就是交叉对比真实值与预测值的结果。很像Excel中的透视表。它的目的是告诉我们模型预测对了几个,错了几个。
下图就是混淆矩阵:
最基础的混淆矩阵中只包含4个指标,TP,FP,FN,TN。
用这四个指标相互进行运算,得到了Precision,Recall,Specificity,FPR等众多次级指标。
这些指标,就是构成ROC,KS,AUC,Lift,Gain的基础。
7个曲线与指标总结对比
对单一图表的讲解我都有单独发过文章讲解过,所以这里不会详细的把所有制作图表的过程都讲出来。
下图是7个曲线与指标的综合对比图。
再补充一句,我查看了许多的资料,KS曲线的横轴有资料上写说是阈值,有些资料上写是数据样本的所占百分比。具体是否对其有官方的定义,我确实还没有能够找到。
但是,从样本测评的角度来讲,不管是样本的百分比,还是阈值,其实都能达到同样的效果。
- 如果我们的横轴选用阈值,这时我们就能判断在不同阈值的选择下,模型分割样本的优劣。
- 如果我们的横轴选用样本百分比,我们能衡量模型能够很好的解释百分之多少的样本。在样本容量是多少的时候,模型的判别最为优秀。
所以,从我个人的理解,横轴选用阈值还是样本百分比,只是模型解释的角度不同。在真实的生活与工作中,这些图都是在为了解释模型、评定模型准确性服务。所以了解如何解释模型,才是最为关键。
上述曲线我有专门的文章去独立讲解,所以这里只是将他们放在一起总结出来。方便在脑中形成整体的框架。