LARS适合这样的应用场景:
当特征的个数p远远大于样本个数n时,使用LARS算法。
1. 准备数据
200个样本,500种特征,10种有效特征
2. 导入模型
为什么选择较少的特征数?
我们分别使用12个特征,与500个特征,同样使用100个数据进行建模:
MSE出现很大的差异:
这就是过拟合给我们带来的问题。
交叉验证
使用交叉验证可以用于优化参数,决定使用多少个非零参数:
LARS适合这样的应用场景:
当特征的个数p远远大于样本个数n时,使用LARS算法。
200个样本,500种特征,10种有效特征
我们分别使用12个特征,与500个特征,同样使用100个数据进行建模:
MSE出现很大的差异:
这就是过拟合给我们带来的问题。
使用交叉验证可以用于优化参数,决定使用多少个非零参数: