机器学习学习总结第五章什么是正则化？正则化是如何运作的？

其他 2020-01-23 15:07:02 阅读次数: 0

什么是正则化？

举例说明

如下数据集，两个函数模型的拟合曲线如图：

显然，当阶次较高时，可以很好的拟合数据，但是一般性不好，过度拟合了数据。

下面是在之前的线性回归方程中假设的代价函数：
在这里插入图片描述
选择增加两个惩罚项来尽量减少θ3和θ4的值。
代价函数就是我们优化的目标，我们要尽量减少代价函数的均方误差
对代价函数增加如下两项：

为了使这个新代价函数最小化，我们要让θ3和θ4尽量小。实现最小化后θ3和θ4的值接近于0，此时就相当于x三次方和x四次方项几乎被忽略。这样假设函数的图像就会变得更加光滑，更少曲折，也能够更泛化的预测新数据样本。就如这个例子中的二次函数拟合数据集一样。

正则化运作思路

当θ值比较小时，可以得到形式更简单的假设函数，函数图像也会更光滑，就不易发生过拟合问题。

当一个案例中的变量非常多时，我们并不能直观的知道我们该保留哪些变量，舍弃哪些变量来使我们的函数能够更好的拟合数据集。

为了选择参数，减少参数的数目，所以在正则化问题是我们要修改线性回归的代价函数。修改后的代价函数如下：

最右边的求和项就是正则项，朗达是正则化参数。

我们的第一个目标就是能够更好的拟合数据集，第二个目标就是想要保持参数值较小。而朗达就是要保持这两个目标之间的平衡，使假设函数的形式更加简单。

朗达值一般是设定为非常大的数。

————————————————————

Ace_bb

发布了50 篇原创文章 · 获赞 3 · 访问量 5181

私信关注

猜你喜欢

转载自blog.csdn.net/Ace_bb/article/details/104064570

机器学习学习总结第五章什么是正则化？正则化是如何运作的？

机器学习学习总结第五章梯度下降法求正则化代价函数最小值

机器学习学习总结第五章在监督学习中什么是过度拟合问题？

java第五章学习总结

第五章学习总结

第五章学习总结

《学习之道》第五章是如何拖延的

Deep Learning - 第五章：机器学习基础

《机器学习实战》笔记--第五章：Logistic回归

机器学习实战第五章Logistic回归

《机器学习实战》第五章----Logistic回归

机器学习第五章神经网络

机器学习算法概述第五章——CART算法

李弘毅机器学习笔记：第五章—分类

机器学习第五章神经网络

机器学习-西瓜书、南瓜书第五章

神经网络基础机器学习第五章

第五章：数组学习笔记

python学习第五章

第五章学习小结

第五章学习笔记———201711671206

Linux学习笔记(第五章)

【第五章】学习小结

第五章学习小结树

python学习笔记——第五章

第五章继承 | 学习笔记

Java学习第五章数组

学习RabbitMQ(第五章)

学习MySQL-第五章

第五章学习的机制（1）

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)