一、说明

在机器学习中，性能测量是一项基本任务。因此，当涉及到分类问题时，我们可以依靠AUC - ROC曲线。当我们需要检查或可视化多类分类问题的性能时，我们使用AUC（曲线下面积）ROC（接收器工作特性）曲线。它是检查任何分类模型性能的最重要评估指标之一。它也写为 AUROC（接收器工作特性下的区域)

注意：为了更好地理解，我建议您阅读我关于混淆矩阵的文章。

本博客旨在回答以下问题：

1. 什么是 AUC - ROC 曲线？

2. 定义 AUC 和 ROC 曲线中使用的术语。

3. 如何推测模型的性能？

4. 敏感性、特异性、FPR 和阈值之间的关系。

5. 如何在多类模型中使用 AUC - ROC 曲线？

二、什么是 AUC - ROC 曲线？

AUC - ROC 曲线是各种阈值设置下分类问题的性能度量。ROC 是一条概率曲线，AUC 表示可分离性的程度或度量。它告诉模型能够区分类的程度。AUC 越高，模型在将 0 个类预测为 0 和将 1 个类预测为 1 方面越好。以此类推，AUC越高，模型在区分有疾病和无疾病患者方面就越好。

ROC 曲线使用 TPR 与 FPR 绘制，其中 TPR 在 y 轴上，FPR 在 x 轴上。

三、定义 AUC 和 ROC 曲线中使用的术语。

3.1 TPR（真阳性率）/召回率/灵敏度

3.2 特异性

3.3 FPR

四、如何推测模型的性能？

优秀的模型的 AUC 接近 1，这意味着它具有良好的可分离性。较差的模型的 AUC 接近 0，这意味着它的可分离性度量最差。事实上，这意味着它正在回报结果。它将 0 预测为 1，将 1 预测为 0。当 AUC 为 0.5 时，意味着模型没有任何类别分离能力。我们来解读一下上面的说法。众所周知，ROC是一条概率曲线。那么让我们绘制这些概率的分布：注：红色分布曲线为正类（患病患者），绿色分布曲线为负类（无疾病患者）。