版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/itnerd/article/details/82764964
在预测问题中,给定一个新的数据点,预测错误的期望是多少?
假设数据是独立同分布地从一个潜在固定的概率分布中获取的,假设其分布函数为
P(<x,y>)=P(x)P(y∣x),我们的目标就是对任意给定的数据点
x, 求出
EP[(y−h(x))2∣x],其中,y 是数据集中
x 对应的值,期望是针对所有数据集,下标 P 表示所有数据集是从同一分布 P 中获取的。形式上,该值是某一点
x 在多个数据集上的预测错误的均值(期望)。
对于给定的假设集,我们可以计算出模型的真实错误(true error),也称泛化错误、测试错误
x∑EP[(y−h(x))2∣x]P(x),即为 所有数据点 在那个输入数据的潜在固定分布上的预测错误的期望。如果
x 为连续变量,则上述求和转化成积分形式。
我们接下来将把 真实错误(true error) 一分为三:
真实错误 = 偏差 + 方差 + 噪声。
关于方差和期望的基本结论:
E[X2]=(E[X])2+Var[X]E(XY)=E(X)E(Y)+Cov(X,Y)
先做一个简单展开:
EP[(y−h(x))2∣x]=EP[(h(x))2−2yh(x)+y2x∣x]=EP[(h(x))2∣x]+EP[y2∣x]−2EP[y∣x]EP[h(x)∣x],……(1)
上式中包含三项。令
h(x)=EP[h(x)∣x],表示点 x 在不同数据集上(分布P上)预测的均值(期望),则
第一项
运用方差的结论:平方的期望=期望的平方+方差
EP[(h(x))2∣x]=(h(x))2+EP[(h(x)−h(x))2∣x]。……(2)
第二项
运用方差的结论:平方的期望=期望的平方+方差
EP[y2∣x]=(EP(y∣x))2+EP[(y−f(x))2∣x]
注意到
EP(y∣x)=EP(f(x)+ϵ∣x)=f(x),其中
ϵ∼N(0,σ),故上式化为
EP[y2∣x]=(f(x))2+EP[(y−f(x))2∣x]。……(3)
将(2)(3)代入(1),得
EP[(y−h(x))2∣x]=EP[(h(x))2∣x]+EP[y2∣x]−2f(x)h(x)=(h(x))2+EP[(h(x)−h(x))2∣x]+(f(x))2+EP[(y−f(x))2∣x]−2f(x)h(x)=EP[(h(x)−h(x))2∣x]+(f(x)−h(x))2+EP[(y−f(x))2∣x]。……(∗)
大功告成!!!!!!!!!!!!!!!!!!!!!!!!!!!!
-
EP[(h(x)−h(x))2∣x] 为 预测的 方差;
-
(f(x)−h(x))2 为 平方偏差;
-
EP[(y−f(x))2∣x] 为 噪声