误差分析
假设线性回归的预测值和真实值表示为:
yi=θTxi+εi
在线性回归中,假设误差
εi
是独立同分布(误差有大有小,并且服从正太分布),并且服从均值为0,方差为
θ2
的高斯分布,则有:
p(εi)=12πδ‾‾‾‾√exp(−(εi)22δ2)
合并上面两个式子,则有
p(yi|xi;θ)=12πδ‾‾‾‾√exp(−(yi−θTxi)22δ2)
极大似然估计
似然函数:
根据样本对参数进行估计,用数据去推参数。线性回归中的似然函数可以表示为:
L(θ)=∏i=1m(p(yi|xi;θ)=∏i=1m12πδ‾‾‾‾√exp(−(yi−θTxi)22δ2)
(乘法难做,转化成加法)
对数似然函数:
l(θ)=∑i=1mlog12πδ‾‾‾‾√exp(−(yi−θTxi)22δ2)
=mlog(12πδ‾‾‾‾√)−12δ2∑i=1m(yi−θTxi)2
由上式子可以得到目标函数(求极小值):
J(θ)=12∑i=1m(yi−θTxi)2
这个式子就是
线性回归的最小二乘法。