Sci-learn LARS算法进行线性回归

LARS适合这样的应用场景:

当特征的个数p远远大于样本个数n时,使用LARS算法。

1. 准备数据

200个样本,500种特征,10种有效特征

2. 导入模型

为什么选择较少的特征数?

我们分别使用12个特征,与500个特征,同样使用100个数据进行建模:

MSE出现很大的差异:

 这就是过拟合给我们带来的问题。

交叉验证

使用交叉验证可以用于优化参数,决定使用多少个非零参数:

 

猜你喜欢

转载自blog.csdn.net/Day_and_Night_2017/article/details/89429381