吴恩达机器学习（八）偏差与方差

其他 2018-10-09 00:22:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/zhq9695/article/details/82885750

目录

1. 评估模型过程

2. 最高次幂对方差偏差的影响

3. 正则化参数对方差偏差的影响

4. 高偏差的学习曲线

5. 高方差的学习曲线

6. 对机器学习算法的调试

学习完吴恩达老师机器学习课程的应用机器学习的建议，简单的做个笔记。文中部分描述属于个人消化后的理解，仅供参考。

如果这篇文章对你有一点小小的帮助，请给个关注喔~我会非常开心的~

0. 前言

对训练集进行模型训练的时候，通常会存在两种问题，“过拟合”和“欠拟合”，分别对应高方差（high variance）和高偏差（high bias）。

高方差：拟合程度过好，以至于过拟合，无法泛化新的样本数据
高偏差：拟合程度太差，以至于欠拟合，存在很大的误差

1. 评估模型过程

随机划分训练集和测试集
用训练集进行模型训练，降低 $J_{train}(\theta)$ ，用测试集计算 $J_{test}(\theta)$
或者采用错误分类率 $Test\ error=\frac{1}{m}\sum_{i=1}^{m}err(h_{\theta}(x^{(i)}),y^{(i)})$ ， $err(h_{\theta}(x),y)= \left\{\begin{align*} &1\ if\ h_{\theta}(x)\geq 0.5,y=0\ or\ h_{\theta}(x)< 0.5,y=1\\ &0\ else \end{align*}\right.$

2. 最高次幂对方差偏差的影响

如图所示（图源：吴恩达机器学习），横坐标为最高次幂，纵坐标为错误分类率或者代价函数，一般情况下：

当 $d$ 很小时，曲线无法拟合大部分数据，具有高偏差， $\left\{\begin{align*} &J_{train}(\theta)\ will\ be\ high\\ &J_{test}(\theta)\approx J_{train}(\theta) \end{align*}\right.$
当 $d$ 很大时，曲线拟合训练集过好，造成无法泛化测试集，具有高方差， $\left\{\begin{align*} &J_{train}(\theta)\ will\ be\ low\\ &J_{test}(\theta)\gg J_{train}(\theta) \end{align*}\right.$

3. 正则化参数对方差偏差的影响

如图所示（图源：吴恩达机器学习），横坐标为正则化参数 $\lambda$ ，纵坐标为错误分类率或者代价函数，一般情况下：

当 $\lambda$ 很小时，未减少权重系数的大小，曲线对训练集的拟合程度很好，具有高方差
当 $\lambda$ 很大时，减少权重系数太多，曲线无法很好的拟合数据，具有高偏差

4. 高偏差的学习曲线

如图所示（图源：吴恩达机器学习），横坐标为训练集大小，纵坐标为错误分类率或者代价函数，一般情况下：

随着数据集的增大，训练集的误差会越来越大，测试集的误差会越来越小
当 $m\rightarrow \infty$ 时，训练集和测试集的误差均会趋近于一个较大的常数

5. 高方差的学习曲线

如图所示（图源：吴恩达机器学习），横坐标为训练集大小，纵坐标为错误分类率或者代价函数，一般情况下：

随着数据集的增大，训练集的误差会越来越大，测试集的误差会越来越小
训练集的误差和测试集的误差之间的间隙较大

6. 对机器学习算法的调试

采用更多的训练集 $\rightarrow$ 解决高方差（过拟合）
减少特征数量 $\rightarrow$ 解决高方差（过拟合）
增加特征数量 $\rightarrow$ 解决高偏差（欠拟合）
增加最高次幂 $\rightarrow$ 解决高偏差（欠拟合）
降低正则化系数 $\lambda$ $\rightarrow$ 解决高偏差（欠拟合）
增加正则化系数 $\lambda$ $\rightarrow$ 解决高方差（过拟合）

如果这篇文章对你有一点小小的帮助，请给个关注喔~我会非常开心的~

猜你喜欢

转载自blog.csdn.net/zhq9695/article/details/82885750

吴恩达机器学习（八）偏差与方差

吴恩达新书-机器学习学习笔记-（三）偏差与方差

吴恩达机器学习练习5——正则化线性回归和偏差/方差

吴恩达机器学习笔记——由方差和偏差改进神经网络

吴恩达|机器学习作业5.0.偏差与方差

吴恩达机器学习（十）——诊断法、偏差与方差、欠拟合与过拟合

吴恩达机器学习作业Python实现(五)：偏差和方差

西瓜书+实战+吴恩达机器学习（二）机器学习基础（偏差、方差、调试模型技巧）

吴恩达-机器学习(6)-评估学习算法、偏差与方差、构架垃圾邮件分类器、处理倾斜数据

编程作业（python）| 吴恩达机器学习（5）偏差与方差，训练集，验证集，测试集，学习曲线

吴恩达机器学习作业Python3实现(五)：方差和偏差及学习曲线绘制

吴恩达机器学习笔记：关于训练模型中出现高偏差和高方差的处理办法

【吴恩达】机器学习作业ex5--＞偏差与方差（过拟合/欠拟合）Python

吴恩达机器学习笔记（八）

吴恩达机器学习(八)

Machine Learning（吴恩达＜三＞偏差与方差）

吴恩达学习笔记——训练集与验证集，方差与偏差

吴恩达深度学习笔记(29)-神经网络训练的方差和偏差分析

吴恩达机器学习课程笔记+代码实现(18)Python实现正则化的线性回归和偏差/方差(Programming Exercise 5)

吴恩达机器学习课后作业5——怎么通过观察偏差和方差（bias vs variance）来调参

笔记：机器学习——吴恩达第八周

吴恩达机器学习（八）——神经网络模型

吴恩达机器学习

机器学习——吴恩达

吴恩达机器学习

机器学习吴恩达

吴恩达《机器学习》

1.2 偏差/方差-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授

吴恩达机器学习中协方差矩阵的向量表示推导

机器学习——方差与偏差

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)