ML笔记 - 分类模型评估 - 代码天地

ML笔记 - 分类模型评估

其他 2019-02-26 06:41:03 阅读次数: 0

版权声明：本文为博主原创文章，可以转载，但请添加原文链接。 https://blog.csdn.net/hwhsong/article/details/87719249

混淆矩阵

混淆矩阵（Confusion Matrix）是可视化工具，特别用于监督学习，在无监督学习中一般叫做匹配矩阵，主要用于比较分类结果和实际测得值，可以把分类结果的精度显示在一个混淆矩阵里面。
在这里插入图片描述

TP的定义：实际为正预测为正

FP的定义：实际为负但预测为正

TN的定义：实际为负预测为负

FN的定义：实际为正但预测为负

召回率（Recall,TNR）：预测对的正例数占真正的正例数的比率

计算公式：Recall=TP / (TP+FN)

准确率：反映分类器统对整个样本的判定能力，能将正的判定为正，负的判定为负

计算公式：Accuracy=(TP+TN) / (TP+FP+TN+FN)

精准率：指的是所得数值与真实值之间的精确程度；预测正确的正例数占预测为正例总量的比率

计算公式：Precision=TP / (TP+FP)

F值：F-score是Precision和Recall加权调和平均数，并假设两者一样重要

计算公式：F1 Score=(2RecallPrecision) / (Recall+Precision)

在这里插入图片描述

二分类评估

**AUC（Area Under Curve）**被定义为ROC曲线下的面积，显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方，所以AUC的取值范围在0.5和1之间。使用AUC值作为评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好，而作为一个数值，对应AUC更大的分类器效果更好。

AUC值是一个概率值，当你随机挑选一个正样本以及一个负样本，当前的分类算法根据计算得到的Score值将这个正样本排在负样本前面的概率就是AUC值。当然，AUC值越大，当前的分类算法越有可能将正样本排在负样本前面，即能够更好的分类。

KS值，正样本洛伦兹曲线记为f(x)，负样本洛伦兹曲线记为g(x)，K-S曲线实际上是f(x)与g(x)的差值曲线。K-S曲线的最高点（最大值）定义为KS值，KS值越大，模型分值的区分度越好，KS值为0代表是最没有区分度的随机模型。准确的来说，K-S是用来度量阳性与阴性分类区分程度的。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/hwhsong/article/details/87719249

ML笔记 - 分类模型评估

ML笔记 - 模型的选择及评估

pyspark-ml学习笔记：模型评估

分类模型评估-My way of ML8

[R - ml] 模型的评估

[R - ml] 模型的评估

ML模型评估

模型评估与选择-ML读书笔记01

ML笔记 - 模型的性能度量

笔记︱风控分类模型种类（决策、排序）比较与模型评估体系（ROC/gini/KS/lift）

西瓜书笔记ML(三)：线性模型

【《机器学习》周志华学习笔记2.3.3】~模型评估与选择-ROC曲线与AUC值（性能分类指标）

《机器学习(周志华)》笔记--模型的评估与选择（7）--sklearn中的分类性能指标

《美团机器学习实践》学习笔记：机器学习中的模型评价指标（一）——分类模型评估

分类模型评估指标

分类模型评估方法

分类模型评估

分类模型评估——func()

分类模型的评估（三）

分类模型的评估（二）

分类模型的评估（一）

分类模型效果评估

分类——模型评估

分类模型的评估

评估分类模型

分类模型的评估方法

笔记 - 模型评估：准确率评估

《机器学习(周志华)》笔记--模型的评估与选择（6）--衡量分类任务的性能指标：ROC曲线与AUC计算与绘制

数据挖掘导论学习笔记第四章分类：基本概念、决策树与模型评估

《数据挖掘导论》笔记 Ch4 分类：基本概念、决策树与模型评估（上）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)