获得更多的训练实例,通常来说是有效的,但代价比较大,在高偏差/欠拟合的情况下,增加数据到训练集不一定能有帮助。而在高方差/过拟合的情况下,增加更多的数据到训练集可能可以提高算法效果。
以下是几种可以先考虑的方法:
1、在过拟合的情况下,可以尝试减少特征的数量,解决高方差。
2、在欠拟合的情况下,可以尝试获得更多的特征,解决高偏差。
3、尝试增加多项式特征,解决高偏差。
4、尝试减少正则化程度λ,解决高偏差。
5、尝试增加正则化程度λ,解决高方差。
获得更多的训练实例,通常来说是有效的,但代价比较大,在高偏差/欠拟合的情况下,增加数据到训练集不一定能有帮助。而在高方差/过拟合的情况下,增加更多的数据到训练集可能可以提高算法效果。
以下是几种可以先考虑的方法:
1、在过拟合的情况下,可以尝试减少特征的数量,解决高方差。
2、在欠拟合的情况下,可以尝试获得更多的特征,解决高偏差。
3、尝试增加多项式特征,解决高偏差。
4、尝试减少正则化程度λ,解决高偏差。
5、尝试增加正则化程度λ,解决高方差。