正则化(regularized)是什么？过拟合又是什么？

其他 2020-09-08 11:20:38 阅读次数: 0

不哔哔，机器学习里的正则化，它是为了解决过拟合提出的。

一背景

正则化是为了解决过拟合问题而提出的。regularization，让它正常，不要那么不正常了，那么这个不正常体现在那里呢，目前[2020-5-15]来看，不就是它过拟合了，不像正常的那样了。

二过拟合

过拟合是什么呢？
过拟合从字面意义上看，就是拟合过度了，什么才叫拟合过度呢？看下图。一个点，有好多情况，你得到的曲线，只适合某一种样本点，其他样本点适应性极差。

在这里插入图片描述

从数据角度分析：首先， $X$ 是样本数据阵，它是一个N*P维的矩阵，N表示的样本的数量，P维表示的是每一个样本的状态数，就是N个样本，每个样本是p维的。然后，理论上应该样本数N应该远大于样本的维数P，但是，实际中可能仅有几个样本，出现N<P的情况，那么就会造成过拟合
从数学角度分析：最小二乘法求得的 $w=(X^TX)^{-1}X^TY$ 中式子 $X^TX$ 可能是不可逆的，就会直接造成过拟合。

解决过拟合的方法：

增加样本数量
特征选择/特征提取，实际就是降维，降低p的维数。PCA
正则化，对w约束，改变w的形式，把 $(X^{T}X)^{-1}$ 改造成一个绝对可逆的式子。

正则化分为两种

L1 -> Lasso
L2 -> Ridge

三过拟合Vs正则化

将不可逆变为可逆即为正则化

为什么需要正则化，首先正则化出现的背景是最小二乘法 $w=(X^TX)^{-1}X^TY$ 中式子 $X^TX$ 可能是不可逆的，从数学角度分析就是X为N*p维的矩阵，N表示样本数，p是Xi的状态向量数，在实际应用中，可能测得的样本数很少，出现了N<P的情况，即 $X^TX$ 不可逆，那么w就求不来。

这样不可逆会导致什么后果呢。答，会引起过拟合。因为如果样本数过少，那么拟合的方法就会有很多。出现错误的几率就会很高。

在这里插入图片描述

怎么解决这个问题提，答，引入正则化。正则化实际上就是给最小二乘法的损失函数(Loss Function)L(w)加一个框架，得到一个新的函数J(w)，其中 $J(w)=L(w)+\lambda P(w)$ 。这样求出的w就会绝对可逆。

参考资料

[1] shuhuai008. 【机器学习】【白板推导系列】【合集 1～23】. bilibili. 2019.
https://www.bilibili.com/video/BV1aE411o7qd?p=9

猜你喜欢

转载自blog.csdn.net/ALexander_Monster/article/details/106145498

正则化(regularized)是什么？过拟合又是什么？

机器学习中使用正则化来防止过拟合是什么原理？

过拟合是什么怎么解决？

【推荐系统】欠拟合和过拟合是什么？

编程中实例是什么？什么是实例？实例化又是什么？什么是类？什么是对象？

深度学习笔记(六)：过拟合是什么意思

过拟合是什么？如何解决过拟合？l1、l2怎么解决过拟合

幸福是什么？什么又是幸福？

为什么正则化（Regularization）可以减少过拟合风险

为什么正则化能减少模型过拟合程度

1.5 为什么正则化可以减少过拟合？

为什么正则化能够解决过拟合问题？

为什么正则化可以减少过拟合？

机器学习：正则化项为什么能够防止过拟合？防止过拟合的方法

挖矿是什么？区块链又是什么？

seo是什么？seo技术又是什么？

网页开发中SEO是什么？TDK又是什么？

神经网络的过拟合是什么,神经网络数据拟合例题

神经网络拟合是什么意思,全连接神经网络过拟合

Dropout是什么？为什么Dropout可以防止过拟合？

XML文件中的DTD又是什么？

XML文件中的DID又是什么

xml文件中的dtd又是什么

activity alias又是什么鬼

怎样理解OOP？OOP又是什么？

进程是什么，线程又是什么，进程与线程的区别是什么

Python是什么，.pyc是什么？运行过程又是什么？

深度学习笔记：1.4 正则化 & 1.5 为什么正则化可以减少过拟合

程序员说模型过拟合的时候，说的是什么?

什么是区块链，区块链又是什么？

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)