【吴恩达机器学习】学习笔记（过拟合&正则化） - 代码天地

【吴恩达机器学习】学习笔记（过拟合&正则化）

其他 2019-01-30 02:00:56 阅读次数: 0

过拟合问题

（1）underfitting（欠拟合）

如果我们的假设函数是一个一次函数，我们可能最后得到的是这样的一条直线，很容易看出它的拟合效果不是很好，这种情况我们称之为欠拟合。
在这里插入图片描述

（2）just right(拟合的很好)

在这里插入图片描述

（3）overfittiing（过拟合）

如果我们给假设函数加入很多的高阶项，最后得到的曲线会想尽一切办法，把所有的数据点都拟合进去，这样的情况称过拟合
在这里插入图片描述
这种情况下，看似所有的数据都被拟合进去，但是这条曲线却会不停波动，不是一个好的假设函数，这种状况的原因是因为我们有太多变量θ，却没有足够的数据集去限制这些变量。

正则化

如何解决过拟合问题，一般来说有两种方法

1.减少特征变量

导致过拟合的原因就是我们有太多的特征变量而没有足够的数据集，如果我们能够通过手动选择减少一些变量，或者通过一个叫 model selection的算法自动识别能减少哪些变量，就能够解决过拟合问题。

2.regularization(正则化)

如果我们不能够减少变量的数量，那么也可以用正则化的思想去解决过拟合问题。这个方法的思想是在代价函数里加入惩罚项
在这里插入图片描述
例如像这样在上面过拟合例子的代价函数里对θ3，θ4加入惩罚项，这样做的结果是我们最后得到的假设函数中，θ3，θ4就会很小，看起来就和二次函数差不多。
在实际情况中，我们并不知道哪些项应该尽可能小最好，所以在正则化中，我们采取的方法是对每一个参数都加入惩罚项，这样得到一个新的代价函数
在这里插入图片描述
这里的 $\lambda$ 叫做正则化参数，它有两个目标，一是要与前面的项关联，去更好的拟合数据，第二个目标是尽量让每个参数更小，以实现正则化的目标。 $\lambda$ 需要在这两个目标中间找到一个平衡。
所以如果这里 $\lambda$ 太大，如 $10^{10}$ ,那么会导致对每一项的惩罚力度过大，从而每一项都接近于0，这样只会得到一条直线，从而导致欠拟合问题。

猜你喜欢

转载自blog.csdn.net/weixin_42970456/article/details/86524060

吴恩达机器学习（四）过拟合与正则化

【吴恩达机器学习】学习笔记（过拟合&正则化）

吴恩达《机器学习》学习笔记六——过拟合与正则化

吴恩达机器学习课程笔记5——过拟合和正则化

吴恩达机器学习（五）正则化（解决过拟合问题）

吴恩达机器学习007过拟合&&代价函数&&正则化

吴恩达深度学习笔记(31)-为什么正则化可以防止过拟合

吴恩达《机器学习》——欠拟合与过拟合

【机器学习】吴恩达机器学习课程笔记LESSON2——欠拟合与过拟合

吴恩达机器学习—正则化

吴恩达机器学习笔记 —— 8 正则化

吴恩达机器学习笔记8——正则化Regularization

吴恩达机器学习笔记--正则化

吴恩达机器学习笔记之正则化

吴恩达机器学习笔记——正则化

吴恩达机器学习笔记（五）正则化

吴恩达机器学习笔记--第三周-4.解决过拟合问题

吴恩达机器学习之正则化：过拟合的问题、代价函数、正则化线性回归、正则化的逻辑回归模型（详细笔记，建议收藏，已有专栏）

机器学习笔记（参考吴恩达机器学习视频笔记）06_正则化

吴恩达机器学习（十）——诊断法、偏差与方差、欠拟合与过拟合

传统机器学习-正则化(吴恩达机器学习笔记)

吴恩达机器学习 - 逻辑回归的正则化

正则化 from 吴恩达的机器学习

吴恩达《机器学习》课程总结（7）正则化

《吴恩达机器学习》7 正则化

吴恩达《机器学习》课程总结(6)_正则化

吴恩达机器学习——第8章正则化

吴恩达机器学习 - 逻辑回归的正则化吴恩达机器学习 - 逻辑回归的正则化

机器学习课程（吴恩达）学习笔记（3）—分类算法和正则化

吴恩达机器学习______学习笔记记录#七、正则化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)