30 解释学习曲线：偏差很高（30 Interpreting learning curves_ High bias） - 代码天地

30 解释学习曲线：偏差很高（30 Interpreting learning curves_ High bias）

其他 2019-04-25 11:01:12 阅读次数: 0

假设开发集损失曲线是这样的：

我们之前说过，如果开发集损失曲线变成了水平的，增加数据并不能获得期望的性能。

但是很难确切地推断出红色曲线应该长成什么样子。如果开发集很小，曲线中可能有噪音就更加不能确定曲线的样子了。
假设我们将训练集损失加到上图中：

现在可以绝对确定增加数据本身并不足以改善算法性能。为什么会这样？回忆一下我们之前的两个发现：

随着我们增加训练数据，训练集损失只会更高。因此，蓝色的线会保持不变或者升高。这样的话，蓝色线只能更加远离绿色线，也就是远离期望的性能。
红色线通常在蓝色线上方，当训练集损失超过了期望值（注：蓝色线在绿色线上方）时，增加训练数据根本没法将红色线降到绿色线的水平（注：开发集损失曲线不能穿越训练集损失曲线，到达绿色钱）。

在同一张图上观察开发集和测试集损失曲线，将帮助我们更加有信息地推测开发集损失曲线的走向。

为了方便讨论，假设期望性能是我们估计的最优错误率，上图是一个标准的教科书式的高偏差（可消除的）学习曲线，在训练集达到最大时-我们拥有的所有数据-训练集损失和期望损失之间的间距很大，这就是可以消除的偏差。
更进一步，训练集曲线和开发集曲线之间的间距很小，表明方差小。

我们在之前只在该图的最右方端点度量训练集，开发集误差，最右的点代表使用了所有数据。绘制完整的学习曲线使我们更全面地了解算法在不同训练集大小上的性能。

猜你喜欢

转载自blog.csdn.net/weixin_35576881/article/details/85050992

30 解释学习曲线：偏差很高（30 Interpreting learning curves_ High bias）

31 解读学习曲线：其他的例子（31 Interpreting learning curves_ Other cases）

28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance: Learning curves)

28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance_ Learning curves)

学习曲线（learning curves）

学习曲线 learning curves | 判断回归模型是否欠拟合和过拟合

【机器学习笔记】Machine Learning Fundamentals: Bias（偏差）、Variance（方差）、Overfit（过度拟合）

偏差bias与偏差variance

偏差（Bias）与方差（Variance）

零样本学习&Domain-aware Visual Bias Eliminating for Generalized Zero-Shot Learning

机器学习restriction bias与preference bias的区别

Machine Learning Yearning28~30

Ng笔记----诊断欠拟合与过拟合 (high bias or high variance)

bias

算法—偏差Bias 与方差Variance

偏差bias/方差variance 的理解

偏差(Bias)与方差(Variance)详解

偏差（bias）和方差（variance）

Machine Learning: 机器学习项目Top 30 (v.2018)

30）

30

机器学习中的偏差（Bias）与方差（Variance）

深度学习笔记-偏差(Bias)，方差(variance)

文章学习37“When Image Denoising Meets High-Level Vision Tasks: A Deep Learning Approach”

PyTorch学习笔记(19) ——NIPS2019 PyTorch: An Imperative Style, High-Performance Deep Learning Library

Bias-Variance Tradeoff解释

学习摘要：Methods for interpreting and understanding deep neural networks

判断模型是overfit还是underfit -- learning curve 与 bias/variance tradeoff

Machine Learning - Coursera week6 Bias vs Variance

机器学习-Bias-Variance

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)