吴恩达机器学习(八)偏差与方差

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/82885750

目录

0. 前言

1. 评估模型过程

2. 最高次幂对方差偏差的影响

3. 正则化参数对方差偏差的影响

4. 高偏差的学习曲线

5. 高方差的学习曲线

6. 对机器学习算法的调试


学习完吴恩达老师机器学习课程的应用机器学习的建议,简单的做个笔记。文中部分描述属于个人消化后的理解,仅供参考。

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

0. 前言

对训练集进行模型训练的时候,通常会存在两种问题,“过拟合”和“欠拟合”,分别对应高方差(high variance)和高偏差(high bias)。

  • 高方差:拟合程度过好,以至于过拟合,无法泛化新的样本数据
  • 高偏差:拟合程度太差,以至于欠拟合,存在很大的误差

1. 评估模型过程

  1. 随机划分训练集和测试集
  2. 用训练集进行模型训练,降低 J_{train}(\theta) ,用测试集计算 J_{test}(\theta)
  3. 或者采用错误分类率 Test\ error=\frac{1}{m}\sum_{i=1}^{m}err(h_{\theta}(x^{(i)}),y^{(i)})err(h_{\theta}(x),y)= \left\{\begin{align*} &1\ if\ h_{\theta}(x)\geq 0.5,y=0\ or\ h_{\theta}(x)< 0.5,y=1\\ &0\ else \end{align*}\right.

2. 最高次幂对方差偏差的影响

如图所示(图源:吴恩达机器学习),横坐标为最高次幂,纵坐标为错误分类率或者代价函数,一般情况下:

  • 当 d 很小时,曲线无法拟合大部分数据,具有高偏差,\left\{\begin{align*} &J_{train}(\theta)\ will\ be\ high\\ &J_{test}(\theta)\approx J_{train}(\theta) \end{align*}\right.
  • 当 d 很大时,曲线拟合训练集过好,造成无法泛化测试集,具有高方差,\left\{\begin{align*} &J_{train}(\theta)\ will\ be\ low\\ &J_{test}(\theta)\gg J_{train}(\theta) \end{align*}\right.

3. 正则化参数对方差偏差的影响

如图所示(图源:吴恩达机器学习),横坐标为正则化参数 \lambda ,纵坐标为错误分类率或者代价函数,一般情况下:

  • 当 \lambda 很小时,未减少权重系数的大小,曲线对训练集的拟合程度很好,具有高方差
  • 当 \lambda 很大时,减少权重系数太多,曲线无法很好的拟合数据,具有高偏差

4. 高偏差的学习曲线

如图所示(图源:吴恩达机器学习),横坐标为训练集大小,纵坐标为错误分类率或者代价函数,一般情况下:

  • 随着数据集的增大,训练集的误差会越来越大,测试集的误差会越来越小
  • 当 m\rightarrow \infty 时, 训练集和测试集的误差均会趋近于一个较大的常数

5. 高方差的学习曲线

如图所示(图源:吴恩达机器学习),横坐标为训练集大小,纵坐标为错误分类率或者代价函数,一般情况下:

  • 随着数据集的增大,训练集的误差会越来越大,测试集的误差会越来越小
  • 训练集的误差和测试集的误差之间的间隙较大

6. 对机器学习算法的调试

  • 采用更多的训练集 \rightarrow 解决高方差(过拟合)
  • 减少特征数量 \rightarrow 解决高方差(过拟合)
  • 增加特征数量 \rightarrow 解决高偏差(欠拟合)
  • 增加最高次幂 \rightarrow 解决高偏差(欠拟合)
  • 降低正则化系数 \lambda \rightarrow 解决高偏差(欠拟合)
  • 增加正则化系数 \lambda \rightarrow 解决高方差(过拟合)

如果这篇文章对你有一点小小的帮助,请给个关注喔~我会非常开心的~

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/82885750