【机器学习】混淆矩阵详细介绍（代码+含义+解释） - 代码天地

【机器学习】混淆矩阵详细介绍（代码+含义+解释）

其他 2020-03-31 10:31:05 阅读次数: 0

文章目录一瞥

图形介绍
重要概念
混淆矩阵延伸出的各个评价指标
关键术语

图形介绍

同样的道理，这里我们采用recall来计算模型的好坏，也就是说那些异常的样本我们的检测到了多少，这也是咱们最初的目的！这里通常用混淆矩阵来展示。
在这里插入图片描述

混淆矩阵（confusion matrix）衡量的是一个分类器分类的准确程度。理解其概念本身容易理解，但一些特定术语易被混淆。
混淆矩阵适用于包含多个分类器的问题，本文为了让读者理解更加容易，以二元分类的混淆矩阵为例进行讲解。
观察混淆矩阵，可得如下结论：

示例是一个二元分类问题，产生两种可能的分类：“是”或者“不是”。当预测一个事件是否发生时，“是”意味着该事件已经发生，而“否”则相反，该事件没有发生。
该模型对这个事件进行了100次预测。
在这100次预测结果中，“是”有45次，“否”有55次。但实际上该事件发生了40次。

重要概念

真阳性（True Positive，TP）：样本的真实类别是正例，并且模型预测的结果也是正例
真阴性（True Negative，TN）：样本的真实类别是负例，并且模型将其预测成为负例
假阳性（False Positive，FP）：样本的真实类别是负例，但是模型将其预测成为正例
假阴性（False Negative，FN）：样本的真实类别是正例，但是模型将其预测成为负例

混淆矩阵延伸出的各个评价指标

正确率（Accuracy）：被正确分类的样本比例或数量

(TP+TN)/Total = (35+50)/100 = 85%

错误率（Misclassification/Error Rate）：被错误分类的样本比例或数量

(FP+FN)/Total = (5+10)/100 = 15%

真阳率（True Positive Rate）：分类器预测为正例的样本占实际正例样本数量的比例，也叫敏感度（sensitivity）或召回率（recall），描述了分类器对正例类别的敏感程度。

TP/ actual yes = 35/40 = 87%

假阳率（False Positive Rate）：分类器预测为正例的样本占实际负例样本数量的比例。

FP/actual no = 10/60 = 17%

特异性（Specificity）：实例是负例，分类器预测结果的类别也是负例的比例。

TN/actual no = 50/60 = 83%

精度（Precision）：在所有判别为正例的结果中，真正正例所占的比例。

TP/predicted yes = 35/45 = 77%

流行程度（Prevalence）：正例在样本中所占比例。

Actual Yes/Total = 40/100 = 40%

关键术语

阳性预测值： 其术语概念与精度非常类似，只是在计算阳性预测值考虑了流行程度。在流行程度为50%的时候，阳性预测值（PPV）与精度相同。
空错误率： 当模型总是预测比例较高的类别，其预测错误的实例所占百分比。在上述示例中，空错误率为60/100 = 60%，因为如果分类器总是预测“是”，那么对于60个为“否”的事件则可能进行错误预测。该指标可用于分类器间的性能比较。然而，对于某些特定的应用程序来说，其最佳分类器的错误率有时会比空错误率更高。
F值：F 值即为正确率和召回率的调和平均值。
Roc曲线：即接收者操作特征曲线(receiver operating characteristic curve)，反映了真阳性率（灵敏度）和假阳性率（1-特异度）之间的变化关系。Roc曲线越趋近于左上角，预测结果越准确。

和你在一起^_^

发布了157 篇原创文章 · 获赞 94 · 访问量 11万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42462804/article/details/100015334

【机器学习】混淆矩阵详细介绍（代码+含义+解释）

机器学习---混淆矩阵代码

机器学习-混淆矩阵

机器学习之混淆矩阵

机器学习（三）混淆矩阵

机器学习——混淆矩阵的笔记

机器学习混淆矩阵笔记

【机器学习】混淆矩阵及其绘制

机器学习（)-多分类任务混淆矩阵

[机器学习笔记] 混淆矩阵（Confusion Matrix）

机器学习测试模型的混淆矩阵

机器学习算法--分类的衡量指标（误差矩阵或混淆矩阵）

可解释机器学习介绍

简单理解混淆矩阵—Matlab详细代码注解

机器学习 | 混淆矩阵和两类错误的关系

机器学习-混淆矩阵、ROC曲线和AUC图像

机器学习笔记 - 使用scikit-learn创建混淆矩阵

python：打印机器学习分类结果的混淆矩阵

机器学习模型优劣评价指标：混淆矩阵，P-R曲线与平均精确度（附代码实现）

GEE机器学习——混淆矩阵Classifier.confusionMatrix()和errorMatrix()和exlain()的用法（js和python代码）

混淆矩阵（confusion_matrix）含义

ProGuard代码混淆详细攻略

confusionchart()混淆矩阵绘图函数介绍（MATLAB）

机器学习——BP神经网络详细介绍及案例Python代码实现

机器学习：性能度量_分类_混淆矩阵、查准率(precision)、查全率(recall)

机器学习：评价分类结果（多分类问题中的混淆矩阵）

机器学习100天-逻辑回归 [ 混淆矩阵， np.meshgrid()，np.ravel() ]

机器学习基础（十三）之混淆矩阵（精准率和召回率andF1 score）

机器学习基础---评价指标---混淆矩阵及相关的二级指标、三级指标

五分钟秒懂机器学习混淆矩阵、ROC和AUC

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)