划分训练集测试集时
函数train_test_split中的参数stratif
ROC曲线
为什么提出ROC曲线
在不同的应用任务中,我们可根据任务需求来采用不同的阈值。
例如,若我们更重视“查准率”,则可以把阈值设置的大一些,让分类器的预测结果更有把握;若我们更重视“查全率”,则可以把阈值设置的小一些,让分类器预测出更多的正例。
因此,阈值设置的好坏,体现了综合考虑学习器在不同任务下的泛化性能的好坏。为了形象的描述这一变化,在此引入ROC曲线,ROC曲线则是从阈值选取角度出发来研究学习器泛化性能的有力工具。
什么是ROC曲线
ROC曲线的纵轴是“真正例率”(True Positive Rate, 简称TPR),横轴是“假正例率”(False Positive Rate,简称FPR)
ROC具体细节
意义
扫描二维码关注公众号,回复:
13827174 查看本文章
为什么提出AUC
两条曲线发生交叉,则难以判断谁好谁坏。
进行比较时采用AUC