线性回归算法

误差:真实值和预测值之间存在差异

误差是独立并且具有相同的分布。独立是说每个样本之间的误差没有联系,同分布是说在一个实验环境下。并且服从均值为0,方差为θ平方的高斯分布。服从高斯分布是指绝大多数情况下浮动不大,极小情况浮动较大。

似然函数:由已经样本数据去推参数值。什么参数跟数据组合后更接近真实值,误差越小。

最大似然估计:成为真实值的概率越大越好

对数似然:变似然函数的乘法为加法。通过log对数转换乘法为加法,

让最小二乘法越小,即误差越小就越接近真实值。

给式子则求偏导,让偏导结果等于0极为极小值,求出参数的值。


其他求最小值:一步步尝试,优化,

评估方法

最常用的评估项R平方:越接近1越好

猜你喜欢

转载自blog.csdn.net/weixin_42309501/article/details/80452223