深刻理解AUC指标与ROC曲线的关系

一定要理解ROC曲线和AUC指标两者之间的关系:
深刻理解AUC指标与ROC曲线的关系

图中的曲线和直线的含义搞清楚:

  • ROC 曲线:图中无论是曲线还是直线,曲线或直线每一个点都代表一个阈值,遍历所有的阈值,就得到了ROC曲线。曲线距离左上角越近,证明分类器效果越好
  • AUC指标:AUC指标用曲线或直线与横轴所围成的面积来衡量,即AUC的值

AUC指标的取值范围:最小值为0.5,也就是直线与横轴围成的面积。如果用曲线和直线分别代表医生A,B的医术,则医生B为庸医,因为医生B全都是蒙的,蒙对一半,蒙错一半;而医生A明显优于医生B的医术。最好的状态就是左上角的点(TPR=1,FPR=0),为完美分类,也就是这个医生医术高明,诊断全对。

  • 为什么需要 AUC?
    前面我们说了 ROC曲线 可以用来给一个模型确定阈值,那么 AUC 则是来评判一个 二分类的 模型的优劣。
    如果 AUC = 1:完美预测,基本不会存在的情况。
    如果 0.5 < AUC < 1:除了完美预测,那就乘这个区间的最有价值了。
    如果 AUC = 0.5:因为是二分类,随机猜测也就是这个概率了,完全就没有价值
    如果 AUC < 0.5:比随机猜测的概率还低!!!但是反过来说,非黑即白,如果取个反呢?

参考:http://blog.sina.com.cn/s/blog_52de1dc10102x880.html