python每日一记13

K最近邻算法既可以用于分类,也可以回归,是最简单易懂的方法,但是并不常用。下面介绍线性模型算法
1、线性回归模型
得出预测值,评分,方程截距和系数
在这里插入图片描述
在这里插入图片描述
2、以上是基本的线性回归模型,存在较多的局限性,因为显示生活中的数据很复杂,我们需要找到一个能控制模型复杂度的模型来模拟现实的复杂数据。接下来就介绍岭回归:
岭回归是能设置参数避免过拟合(过拟合就是训练集表现好但是测试集表现不好,欠拟合则相反)
在这里插入图片描述
在这里插入图片描述
一般线性回归对于训练集评分高于测试集,模型泛化能力不好,但我们希望的是较好的模型泛化能力。
在这里插入图片描述
上图的岭回归结果使得训练评分和测试评分一致,泛化能力更好。

岭回归参数alpha越大,模型泛化能力越好,特征变量系数越小。默认为1
数据量小的情况下,岭回归表现高于一般线性回归,但是数据量越大,两者没那么大的差别。

3、套索回归
套索回归与岭回归类似,更加容易将系数变成0,减少特征的个数。
使用的是Lasso;也有参数alpha。
实践中岭回归更加常用,但如果想要降低特征的个数,让模型更加容易理解,则套索回归更加有意义。

4、那么参数的设置将更加考验我们的能力!

猜你喜欢

转载自blog.csdn.net/weixin_44663675/article/details/88558253
今日推荐