28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance: Learning curves) - 代码天地

28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance: Learning curves)

其他 2018-05-19 11:25:09 阅读次数: 2

我们已经知道一些方法可以用来估计（可避免的）偏差和方差可以导致多少误差。这些方法包括估计最佳的错误率和计算算法的训练集和开发集误差。下面我们将讨论一种可以获得更多信息的方法：绘制学习曲线。

学习曲线绘制了开发集错误率和训练样本数量之间的关系。为了绘制学习曲线，需要在不同的训练集大小上运行算法。例如，如果有1000个样本，可以在100，200，300，…，1000个样本上分别运行算法。这样就可以画出关于开发集错误率和训练样本数量的学习曲线。举例如下：

随着训练集的增大，开发集错误率应该减少。
我们通常为算法设置一个期望错误率。比如：
- 如果期望人类水平的性能，则人类水平错误率就是期望错误率
- 如果算法作为某种产品（例如识别有猫的图片），我们可能会直观的知道什么样的性能才能给用户一个好的体验。
- 如果你在一个重要的应用上工作了很长的时间，你可能已经形成了一种直观的感觉：明年我可能在这个应用上取得多少成果。

为学习曲线添加期望的性能：

可以从图中猜出增加训练集样本数量之后，红色的“开发集错误率”可以在多大程度上靠近期望值。上面的例子中，看起来增加一倍的训练样本可能达到期望的性能。
但是如果开发集错误率已经是稳定状态（例如：曲线变平了），那么可以立即肯定增加训练样本没什么用处。

分析上图的学习曲线，可以避免你花费数月时间，收集大量数据到最后发现没有什么用处。

只分析开发集错误率也有其不利的一面，因为即使增加更多训练数据也很难推断红色曲线将会是什么趋势。额外绘制训练集错误率曲线将会有利于估计增加训练数据所产生的效果。

猜你喜欢

转载自blog.csdn.net/weixin_35576881/article/details/80333226

28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance: Learning curves)

28 诊断偏差和方差：学习曲线 (28 Diagnosing bias and variance_ Learning curves)

30 解释学习曲线：偏差很高（30 Interpreting learning curves_ High bias）

偏差（Bias）与方差（Variance）

偏差（bias）和方差（variance）

偏差bias与偏差variance

学习曲线（learning curves）

算法—偏差Bias 与方差Variance

偏差bias/方差variance 的理解

偏差(Bias)与方差(Variance)详解

【机器学习笔记】Machine Learning Fundamentals: Bias（偏差）、Variance（方差）、Overfit（过度拟合）

偏差bias和方差variance和噪声

机器学习中的偏差（Bias）与方差（Variance）

深度学习笔记-偏差(Bias)，方差(variance)

偏差（bias)和方差(variance)区别：

Bias和Variance

Bias 和 Variance的计算

理解 Bias 和 Variance

偏差(Bias)和方差(Variance)——机器学习中的模型选择

机器学习3 -- 误差来源（偏差bias和方差variance）

理解机器学习中的偏差（bias）和方差（variance）

Bias-Variance Tradeoff (权衡偏差与方差)

模型的偏差bias以及方差variance

bagging与boosting的偏差bias与方差variance

正则化——“偏差（bias）”与“方差（variance）”

24 偏差，方差平衡（ Bias vs Variance)

偏差-方差分解bias-variance decomposition

偏差-方差权衡（bias-variance-tradeoff）

机器学习-Bias-Variance

学习笔记——机器学习（偏差bias与方差variance）

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)