［机器学习］overfitting 和regularization - 代码天地

［机器学习］overfitting 和regularization

其他 2018-11-01 10:21:42 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/aFeiOnePiece/article/details/47712351

overfitting，见下图。就是说，你的model太好了，好到只对training data有用，而test data可能并不待见。

原因就是如图所说，太多feature，可能这些feature是冗余的呢。

怎么解决这个问题i？

首先想到的可能是减少feature！但这个得人工来整。

其次，换一个角度看问题（世界可能大不一样）。如果像上图那个overfitting的例子一样，theta3和theta4非常小，甚至为0，也可以一定程度上缓解overfitting。

如下图，我们通过1000这个系数来使theta3和theta4在min CostFunction的时候变得非常小。最后得到的曲线就是粉色的那条

于是，我们可爱的前辈们证明了下面的式子（证明是个头疼的问题，可以参考台湾大学林轩田教授的《机器学习基石》课程）

这里引入一个参数 lambda。lambda的选择至关重要，一个好的lambda可以避免overfitting。同时，如果lambda特别大，theta就会整体取值为0，导致underfit

J(theta)加入 regularization项之后，其偏微分也要跟着改变，直接影响GD算法计算theta的迭代式

这里注意一点：我们的lambda是不作用在 theta0上的，因为x0=1是我们人为加上的

在逻辑回归中，也有类似的效果

猜你喜欢

转载自blog.csdn.net/aFeiOnePiece/article/details/47712351

［机器学习］overfitting 和regularization

[机器学习笔记] 机器学习中的“过拟合（Overfitting）”和“欠拟合（Underfitting）”

Regularization - The problem of overfitting

Stanford机器学习-Regularization

机器学习中overfitting的理解

李宏毅机器学习总结笔记2- regression（回归）和regularization（正则化）

增加正则项Regularization to Prevent Overfitting

机器学习--正则化(Regularization)

Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization

机器学习 - 正则化方法：L1和L2 regularization、数据集扩增、dropout

Overfitting机器学习中过度拟合问题

机器学习基石13-Hazard of Overfitting

从bias和variance来分析深度学习中的正则化(Regularization）和dropout

机器学习之正则化（Regularization）

机器学习基石 Lecture14: Regularization

机器学习中的正则化（Regularization）

机器学习笔记——正则化（regularization）

机器学习笔记4：正则化（Regularization）

机器学习基石笔记：14 Regularization

机器学习基石14：正则化（Regularization）

机器学习(11) 正则化(Regularization)

深度学习中的归一化(normalization)和正则化(regularization)

深入理解深度学习——正则化（Regularization）：Bagging和其他集成方法

深入理解深度学习——正则化（Regularization）：参数绑定和参数共享

深入理解深度学习——正则化（Regularization）：正则化和欠约束问题

Normalization，Regularization 和 standardization

机器学习基石笔记：13 Hazard of Overfitting

机器学习与数据挖掘第十一讲：Overfitting

机器学习（一）—— 过拟合（Overfitting）、正则化与损失函数

机器学习基石13：过拟合风险（Hazard of Overfitting）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)