方差与偏差 - 代码天地

方差与偏差

其他 2018-05-06 21:58:28 阅读次数: 5

公式定义：

对测试样本 $x$ ， $y_D$ 表示在 $x$ 数据集上的标记， $y$ 为 $x$ 的真实标记， $f(x;D)$ 为训练集D上学得模型 $f$ 在 $x$ 上的预测输出。以回归为例：
算法的期望预测：

f^{-} (x) = E_{D} [f (x; D)]

$f^-(x) = E_D[f(x;D)]$
使用样本数相同的不同训练集产生的方差为：

v a r (x) = E_{D} [{(f (x; D) - f^{-} (x))}^{2}]

$var(x) = E_D[{(f(x;D)-f^-(x) )}^2]$
噪声为：

ϵ^{2} = E_{D} [(y_{D} - y)^{2}]

$\epsilon^2 = E_D [(y_D-y)^2]$
期望输出与真实标记的差别称为偏差（bias），即

b i a s^{2} (x) = (f^{-} (x) - y)^{2}

$bias^2(x)=( f^-(x) - y)^2$
关系：泛化误差可分解为偏差、方差和噪声之和

E (f; D) = b i a s^{2} (x) + v a r (x) + ϵ^{2}

$E(f;D) = bias^2(x) + var(x) +\epsilon^2$

偏差、方差、噪声的含义：

偏差：
度量了学习算法的期望预测与真实结果的偏离程度，即刻画了算法本身的拟合能力。偏差越大越偏离真实值。
方差：
度量了同样大小训练集的变动所导致的学习性能的变化，即刻画了数据扰动所造成的影响。反映了离散程度，预测值到期望值的距离；方差越大，数据分布越分散。也就可以理解为衡量模型的稳定性（鲁棒性）。
噪声：
表达了在当前任务上任何学习算法所能达到的期望泛华误差的下界，即刻画了学习问题本身的难度。

猜你喜欢

转载自blog.csdn.net/yingfengfeixiang/article/details/80003016

方差与偏差

偏差与方差

偏差方差

偏差与方差推导

方差-偏差-噪声的理解

偏差（Bias）与方差（Variance）

偏差-方差分析

偏差和方差

理解偏差、方差

模型的偏差和方差

集成学习，方差，偏差

深度学习的方差与偏差

偏差-方差分解

方差偏差困境

偏差-方差权衡

五：方差和偏差

精度（偏差）与方差的区别

偏差与方差理论

机器学习——方差与偏差

算法—偏差Bias 与方差Variance

ML12偏差与方差

Bagging和Boosting（偏差与方差）

偏差bias/方差variance 的理解

机器学习 - KNN、偏差与方差

高偏差和高方差

机器学习之偏差方差

机器学习中的偏差与方差

模型的偏差、方差分析

机器学习－－偏差和方差

机器学习偏差与方差的理解

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

周排行

决策树的部分理解

STM32软件IIC的实现

RocketMQ原理解析-HA

vue-动态路由（路由的传参和接参）

利用python对Excel中的特定数据提取并写入新表

【Ubuntu】 Ubuntu16.04搭建NFS服务

Elasticsearch基础操作与对应的curl命令行，python对接实现

JVM数据存储结构 & Java的值传递和址传递

yum命令使用指南

java基础（一）：java语法基础

每日归档

更多

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)