线性回归

误差分析

假设线性回归的预测值和真实值表示为:

y i = θ T x i + ε i

在线性回归中,假设误差 ε i 是独立同分布(误差有大有小,并且服从正太分布),并且服从均值为0,方差为 θ 2 的高斯分布,则有:
p ( ε i ) = 1 2 π δ e x p ( ( ε i ) 2 2 δ 2 )

合并上面两个式子,则有

p ( y i | x i ; θ ) = 1 2 π δ e x p ( ( y i θ T x i ) 2 2 δ 2 )

极大似然估计

似然函数
根据样本对参数进行估计,用数据去推参数。线性回归中的似然函数可以表示为:

L ( θ ) = i = 1 m ( p ( y i | x i ; θ ) = i = 1 m 1 2 π δ e x p ( ( y i θ T x i ) 2 2 δ 2 )

(乘法难做,转化成加法)
对数似然函数:
l ( θ ) = i = 1 m log 1 2 π δ e x p ( ( y i θ T x i ) 2 2 δ 2 )

= m log ( 1 2 π δ ) 1 2 δ 2 i = 1 m ( y i θ T x i ) 2

由上式子可以得到目标函数(求极小值):
J ( θ ) = 1 2 i = 1 m ( y i θ T x i ) 2

这个式子就是 线性回归的最小二乘法

猜你喜欢

转载自blog.csdn.net/x_lingbai/article/details/80051458