训练误差与泛化误差的说明 - 代码天地

训练误差与泛化误差的说明

企业开发 2023-06-11 21:19:26 阅读次数: 0

1. 训练误差与泛化误差的定义

在机器学习中，评价一个模型“优劣”的最直观的数据就是模型的误差，其中误差又分为以下两种误差：

- 训练误差（training error）：模型在训练数据集上表现出的误差；

- 泛化误差（generalization error）：模型在任意测试数据上表现出的误差。

讲定义太无聊了，下面直接通过实例说明。

2. 通过实例说明训练误差与泛化误差

假设我们要构建一个网络模型来拟合下面的训练数据：

- 输入：trianset_x = [1, 2, 3, 4, 5]

- 输出：trainset_y = [1, 4, 9, 16, 25]

然后我们构建了一个网络模型A进行训练，经过训练后测试，输入trainset_x输出为：

- A_output = [1.1, 4.3, 8.9, 15.6, 26.1]

这里网络模型A的训练误差即为loss(trainset_y, A_output), 其中loss为损失函数。

这里，我们可以看到网络模型A的效果并不太好，它的训练误差还是比较大的。于是我们又构建一个网络模型B。

网络模型B训练后输入trainset_x输出为：

- B_output = [1.00001, 4.00001, 9.00001, 16.00001, 25.00001]

可见，网络模型B的训练误差已经远远小于网络模型A。

那么网络模型B就一定比网络模型A好吗？

肯定不是！！

要知道，我们构建网络模型的目的是实现输入到输出的预测，是要“泛化”到所有的输入数据都能有准确的输出，而不是仅仅关注在训练数据上。

回到上面的例子，如果再输入一个测试数据testset_x = [10, 20]，真实的期望输出testset_y = [100, 400]，而此时

网络模型A的输出为：A_test_output = [93.7, 412.8]

网络模型B的输出为：B_test_output = [-12.89, 1023,432]

此时的误差loss(A_test_output, testset_y)和loss(B_test_output, testset_y)即为泛化误差。可见网络模型A的泛化误差明显小于网络模型B的泛化误差。

可以直观看出网络模型A是更好的模型，所以机器学习模型应该更加关注泛化误差的降低。

实际应用中，类似网络模型B这种离谱输出的情况很有可能是因为过拟合导致的。

猜你喜欢

转载自blog.csdn.net/m0_49963403/article/details/129972848

训练误差与泛化误差的说明

训练误差、测试误差、泛化误差的区别

过拟合、欠拟合、泛化误差、训练误差

泛化误差，训练误差，偏差，方差，偏置

经验误差，泛化误差

经验误差与泛化误差

训练误差和测试（泛化）误差的区别及其与模型复杂度的关系

谈谈对泛化误差的理解

名词解析之泛化误差

关于第二章深度学习基础中泛化误差分析的具体说明

Keras在训练期间可视化训练误差和测试误差

Tensorflow解决训练误差大于测试误差

ROC曲线含义偏差方差泛化误差

计算学习理论中泛化误差的研究

模型过拟合及模型泛化误差评估

理解方差、偏差且其泛化误差的关系

基于Rademacher复杂度的泛化误差界

【统计学习笔记】泛化误差上界

如何通过 Keras 中的活动正则化减少泛化误差

SSE，MSE均方误差计算公式（训练误差，测试误差）

关于泛化误差（generalization ability）与风险函数（risk function）与期望损失（expected loss）

【机器学习】理解方差、偏差且其泛化误差的关系

[DataAnalysis]机器学习算法泛化误差率的偏差-方差分解

李航统计学习方法笔记——泛化误差上界

二分类问题泛化误差上界的详细证明

偏差、方差、噪声、泛化误差以及过拟合和欠拟合

统计方法（李航）|第一章|泛化误差上界定理推导

误差与误差分析

训练网络时出现误差loss 是 NAN

问：为什么Keras训练模型得到的训练误差比测试误差高很多？

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)