类不平衡(样本不均衡数据)处理笔记+ROC/AUC曲线

在这里插入图片描述

划分训练集测试集时

在这里插入图片描述

在这里插入图片描述
函数train_test_split中的参数stratif
在这里插入图片描述

ROC曲线

为什么提出ROC曲线

在不同的应用任务中,我们可根据任务需求来采用不同的阈值。

例如,若我们更重视“查准率”,则可以把阈值设置的大一些,让分类器的预测结果更有把握;若我们更重视“查全率”,则可以把阈值设置的小一些,让分类器预测出更多的正例。

因此,阈值设置的好坏,体现了综合考虑学习器在不同任务下的泛化性能的好坏。为了形象的描述这一变化,在此引入ROC曲线,ROC曲线则是从阈值选取角度出发来研究学习器泛化性能的有力工具。

什么是ROC曲线

ROC曲线的纵轴是“真正例率”(True Positive Rate, 简称TPR),横轴是“假正例率”(False Positive Rate,简称FPR)

ROC具体细节

在这里插入图片描述

意义

在这里插入图片描述

扫描二维码关注公众号,回复: 13827174 查看本文章

为什么提出AUC

两条曲线发生交叉,则难以判断谁好谁坏。
进行比较时采用AUC
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_45942265/article/details/119297725