ROC曲线

ROC曲线

众所周知,深度学习或者一些机器学习模型中需要有一定标准来判别模型的准确度,理想的模型是对于实际的测试正样本尽量判别为正,反之负样本判别为负。

#模型判断标准

一般论文中比较常见的评判标准,TP为true positive就是模型判别为正样本然后实际gt也是正样本的个数,FP(flase positive),FN(false negative)等同理。
ROC曲线

ROC曲线(receiver operating characteristic curve,简称ROC曲线)
以下为百度百科中的简介:
ROC曲线是根据一系列不同的二分类方式(分界值或决定阈),以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。ROC曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态,可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大致异常和异常五个等级再进行统计分析。因此,ROC曲线评价方法适用的范围更为广泛.

这个意思就是说对于分类后得到的概率可以使用不同的阈值将同样的样本归结于不同的类。因为实验结果可能对分类的阈值比较敏感,因此可以判别模型在不同阈值情况下的所有表现。
AUC(Area under Curve(曲线下的面积))用来计算ROC代表的信息。横坐标为false positive rate,纵坐标为true positive rate。如果一个模型表现很好,则应该是false positive降低,true positive升高,也就是曲线越接近于左上角,也就是下图中(0,1)坐标。曲线下的面积表示了在所有阈值情况下接近于(0,1)的平均程度。(同时也可以通过roc曲线选择模型表现最佳的阈值)。
ROC曲线