- 什么是过拟合?
模型拟合过度,在训练集上表现好,在测试集上效果差。
- 什么是欠拟合?
模型拟合不够,在训练集上表现效果差,没有充分利用数据,预测准确率低。
- 导致过拟合的原因?
1.训练数据集样本单一,不能覆盖所有的数据类型
2.噪声干扰较大
3.模型过于复杂
- 如何解决过拟合的问题?
1.在训练和建立模型的时候,从相对简单的模型开始,不要一上来就把模型调得很复杂,特征非常多
2.数据的采样,应该尽可能覆盖全部数据类型(数据集扩增)
3.清洗数据,避免混入大量噪声数据
4.加上正则化项,如L1正则化或L2正则化
5.在深度学习中,可以采用dropout的方法
6.在深度学习中可以采用early stopping的方法
7.交叉验证