版权声明:署名,允许他人基于本文进行创作,且必须基于与原先许可协议相同的许可协议分发本文 (Creative Commons)
理解ROC/AUC
接上一篇清晰简明混淆矩阵:
下图表示训练集(假设只有一个特征维度)关于特征维度的分布情况。根据某一算法,确定的临界值如图。小于临界值
,大于临界值
从上帝视角来看一下,表现如何?下图表示将
分别画出关于这一特征的分布情况(上一个图是整体分布)。
根据上图,和混淆矩阵的对应关系如下图(仅仅为示意图,比例有调整):
性能度量 | ROC坐标轴 | 公式 | 备注 |
---|---|---|---|
True Positive Rate | Y | Recall,sensitivity | |
False Positive Rate | X | 1-specificity |
ROC曲线下方的面积(Area Under Curve,AUC)是性能的度量,靠近左上角,性能更好。