机器学习-Bias-Variance - 代码天地

机器学习-Bias-Variance

其他 2018-08-17 18:13:55 阅读次数: 0

对Bias和Variance的来源的解释

Bias：来源于训练集中没有的，测试集中存在的data产生的。

Variance：来源于训练集里有的，但是测试集里没有的，且不应该属于ground truth的data（这里其实有个假设：就是test data认为是没有噪音的，完全是ground truth）。

三个值

h相当于模型对训练集不含有variance的数据进行拟合产生的最佳模型。
f相当于对测试集数据应该产生的模型
y相当于对训练集含有噪声的数据应该产生的模型

最希望的模型：

几种现象组合

high variance

low variance

high bias

测试集数据和训练集数据严重不符

训练集数据也有大量噪声。

测试集有大量groundtruth训练集没有。

欠拟合

low bias

过拟合

good model

几个解决欠拟合和过拟合的方法通过bias和variance理解：

assumption：

如果数据足够好，bias应该是非常少的，更多的可能是train sample中的variance更多些。

数据端影响：

Bagging：（单个subset更少）每个model的subset data包含的variance更少，假设比例不变，这样每个模型variance更小。（多个subset）同时有多个subdata set，让每个model能看到的train和test都能见到的数据更多，解决bias问题。第一个模型出现的bias，靠其他模型看到过test数据集有，第一个subset没有的数据，来弥补。
扩充高质量数据集：稀释variance，减少bias
特征选择，减少特征：减少variance发生的列，减少variance影响。

模型端影响：

正则化：问题来源：high variance。削弱模型对指定特征的学习能力，减少了高variance的风险。
简单模型：减少学习variance能力，当然也同时削弱了预测bias的能力。
复杂模型：对variance和bias数据都增强了拟合能力。
扩展特征：扩充bias可能性增加，同时有增加variance风险。将数据升维，更改数据的排布，让训练和测试集的分布更加贴近。

参考文章：http://www.cs.cmu.edu/~wcohen/10-601/bias-variance.pdf

友情推荐：ABC技术研习社

为技术人打造的专属A(AI),B(Big Data),C(Cloud)技术公众号和技术交流社群。

猜你喜欢

转载自blog.csdn.net/gao8658/article/details/81332940

机器学习-Bias-Variance

机器学习中的方差偏差分析（Bias-variance analysis）

【机器学习】偏差-方差分解Bias-variance Decomposition

Bias-Variance Tradeoff

机器学习算法系列（18）：方差偏差权衡（Bias-Variance Tradeoff）

机器学习与数据挖掘第八讲：Bias-Variance Tradeoff

Bias-Variance Tradeoff解释

[转] Bias-Variance Tradeoff

再谈Bias-Variance Tradeoff

Bias-Variance Tradeoff (权衡偏差与方差)

偏差-方差分解bias-variance decomposition

偏置-方差分解(Bias-Variance Decomposition)

机器学习中的Bias,Error,Variance的区别

机器学习中的偏差（Bias）与方差（Variance）

R语言文摘：Understanding the Bias-Variance Tradeoff

从线性回归看偏差-方差分解（Bias-Variance Decomposition）

”Unstanding the Bias-Variance Tradeoff“主题内容翻译

3.2. The Bias-Variance Decomposition(PRML系列)

学习笔记——机器学习（偏差bias与方差variance）

机器学习系列（三）——误差（error），偏差（bias），方差（variance）

【机器学习】：偏差(bias)与方差(variance)、bagging与随机森林(RF)

【机器学习（李宏毅）】三、Bias and Variance

【机器学习】深入理解偏差bias与误差variance

李宏毅机器学习笔记-03 Bias and Variance

机器学习bias， error ，variance区别和联系

机器学习中的Bias和Variance是指什么

偏差(Bias)和方差(Variance)——机器学习中的模型选择

机器学习3 -- 误差来源（偏差bias和方差variance）

理解机器学习中的偏差（bias）和方差（variance）

李宏毅机器学习笔记3-机器学习中的错误来源（bias和variance）

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)