模型评估 (Model Assessment)

其他 2023-06-24 19:49:37 阅读次数: 0

1.模型评估 (Model Assessment)

笔记来源于《白话机器学习的数学》

我们训练好模型后，要对知道这个模型到底好不好，定量描述这个模型好坏就是模型评估

把获取的全部训练数据分成两份：一份用于测试，一份用于训练。然后用前者来评估模型。大多数情况会采用 3 : 7 或者 2 : 8 这种训练数据更多的比例
把全部训练数据分为测试数据和训练数据的做法称为交叉验证

假如我们要进行 4 折交叉验证，那么就会这样测量精度

不切实际地增加 K 值会非常耗费时间，所以我们必须要确定一个合适的 K 值

1.1 回归问题的验证

对于回归的情况，只要在训练好的模型上计算测试数据的误差的平方，再取其平均值就可以了。（其实是个误差函数，回归问题的目标函数也是误差函数）
测试数据有 n 个，则均方误差（MSE）

MSE越小，精度就越高，模型也就越好
除了MSE外，还有均方根误差（RMSE）、平均绝对误差（MAE）、均方根对数误差(RMSLE)等

1.2 分类问题的验证

精度（Accuracy）
表示在整个数据集中，被正确分类的数据 TP 和 TN 所占的比例，得到精度基本可以掌握分类结果的整体的精度了

精确率（Precision）（以TP为主）
在被分类为 Positive 的数据中，本来就是 True 的数据所占的比例

精确率（Precision）（以TN为主）

召回率（Recall）（以TP为主）
在True数据中，实际被分类为 Positive 的数据所占的比例

召回率（Recall）（以TN为主）

怎么选择用以TP为主的精确率和召回率还是用以TN为主的？

当数据不平衡时，使用数量少的那个会更好
如果 Positive 少，就使用 TP为主的
如果 Negative 少，就使用 TN为主的

通常情况下精确率和召回率会一个高一个低，需要我们取舍，有些麻烦

F1值
精确率和召回率的调和平均值

带权重的F值
$\beta$ 为权重，权重为1时就是上式

猜你喜欢

转载自blog.csdn.net/weixin_48524215/article/details/131366941

模型评估 (Model Assessment)

Model Assessment and Selection

普林斯顿算法课评估指南 Assessment Guide

CISSP考点拾遗——安全评估方法assessment methods

EMA：评估动态的过程模型 A process model of appraisal dynamics

【模型评估与选择】sklearn.model_selection.KFold

【模型评估与选择】sklearn.model_selection.train_test_split

LLMs NLP模型评估Model evaluation ROUGE and BLEU SCORE

Model 模型

模型（Model）

模型Model

图像质量评估 (IQA) ： Deep Neural Networks for No-Reference and Full-Reference Image Quality Assessment

BackTrack5漏洞评估之OpenVAS Open Vulnerability Assessment System

【人脸质量评估】RankIQA Learning from Rankings for No-reference Image Quality Assessment

【论文阅读】定量评估服务模式__Quantitative Assessment of Service Pattern: Framework, Language, and Metrics

django中model模型

django 模型——model 字段

Django - 模型（model）-- ORM

Django中的模型（model）

Django 模型Model层

laravel框架模型model

Model模型（上）

django (四) model模型

Keras Model模型方法

云模型（Cloud Model）

beego——模型（model）

laravel之模型Model

Model 处理模型数据

django模型层model

模型压缩（Model compression）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)