目录
1.2为什么用贝叶斯线性回归
1.2.1最大似然估计(MLE)
目标函数
argmaxθp(D|θ)
这里
θ
是模型里面的参数,
D
是观测值
优点:计算简单
缺点:容易过度拟合
预测结果是一个固定的值,无法对不确定性建模
1.2.2最大后验(MAP)
目标函数
argmaxθp(θ|D)
优点:解决了过度拟合的问题;
缺点:任然没有办法对不确定性建模;
1.2.3 贝叶斯方法
贝叶斯对预测分布建模,
p(y|t,D)
1.2.4 贝叶斯线性模型定义
一组观测数据
D=((x1,y1),(x2,y2),...(xn,yn)),xi∈Rd,yi∈R
Y1,Y2,..Yn
对 w独立
Yi∼N(wTxi,a−1)
这里
a=1σ2,a>0
又被称为精度
w∼N(0,b−1I)
,b>0;
这里假设
a,b
是已知的。
1.2.4贝叶斯线性回归的后验分布
为了计算后验分布,我们首先需要似然函数,写为:
p(D|w)∝exp(−a2(y−Aw)T(y−Aw))
这边
A
是design matrix。
后验分布
p(w|D)∝p(D|w)p(w)∝exp(−a2(y−Aw)T(y−Aw)−b2wTw)
p(w|D)=N(w|μ,Λ−1)
Λ=aATA+bIu=aΛ−1ATy
1.2.5贝叶斯线性回归的预测分布
预测分布
p(y|x,D)=∫p(y|x,D,w)p(w|x,D)dw∫p(y|x,w)p(w|D)dw∫N(y|wTx,a−1N(w|μ,Λ−1))
p(y|x,D)=N(u,1λ)
u=μTx1λ=1a+xTΛ−1x