1.2贝叶斯线性回归模型

目录

1.2为什么用贝叶斯线性回归

1.2.1最大似然估计(MLE)

目标函数

arg max θ p ( D | θ )

这里 θ 是模型里面的参数, D 是观测值
优点:计算简单
缺点:容易过度拟合
预测结果是一个固定的值,无法对不确定性建模

1.2.2最大后验(MAP)

目标函数

arg max θ p ( θ | D )

优点:解决了过度拟合的问题;
缺点:任然没有办法对不确定性建模;

1.2.3 贝叶斯方法

贝叶斯对预测分布建模,

p ( y | t , D )

1.2.4 贝叶斯线性模型定义

一组观测数据 D = ( x 1 , y 1 , ( x 2 , y 2 ) , . . . ( x n , y n ) ) , x i R d , y i R
Y 1 , Y 2 , . . Y n 对 w独立
Y i N ( w T x i , a 1 ) 这里 a = 1 σ 2 , a > 0 又被称为精度
w N ( 0 , b 1 I ) ,b>0;
这里假设 a , b 是已知的。

1.2.4贝叶斯线性回归的后验分布

为了计算后验分布,我们首先需要似然函数,写为:

p ( D | w ) e x p ( a 2 ( y A w ) T ( y A w ) )

这边 A 是design matrix。
后验分布
p ( w | D ) p ( D | w ) p ( w ) exp ( a 2 ( y A w ) T ( y A w ) b 2 w T w )

p ( w | D ) = N ( w | μ , Λ 1 )

Λ = a A T A + b I u = a Λ 1 A T y

1.2.5贝叶斯线性回归的预测分布

预测分布

p ( y | x , D ) = p ( y | x , D , w ) p ( w | x , D ) d w p ( y | x , w ) p ( w | D ) d w N ( y | w T x , a 1 N ( w | μ , Λ 1 ) )

p ( y | x , D ) = N ( u , 1 λ )

u = μ T x 1 λ = 1 a + x T Λ 1 x

猜你喜欢

转载自blog.csdn.net/dmsgames/article/details/82082521
今日推荐