减少过拟合的方法—正则化及其原理 - 代码天地

减少过拟合的方法—正则化及其原理

编程语言 2018-07-30 01:35:47 阅读次数: 0

成本函数J（w，b）=(（1/m） $\sum$ L（y_hati,yi）)+( $\lambda$ /2m)||w|| $_{2}^{2}$ ,其中 $\lambda$ 是正则化参数，||w|| $_{2}^{2}$ 是w平方的范数即欧几里得范数的平方，其中||w|| $_{2}^{2}$ 等于wj（j值从1到n）平方的和。此方法称为L2正则化。对于b也可以这样操作，但是w通常是高维向量，已经可以表达高偏差问题，而b只是单个参数，w中包含了很多参数，如果加了b，也没有什么太大影响。

使用验证集来配置正则化参数 $\lambda$ ，尝试各种数据，来寻找最好的参数。

造成过拟合的原因一个是权重矩阵W中的值太大了，一个是W中的值太多了即神经网络节点的个数太多了。解决办法就是要么将W值变小，要么将节点个数变少。这样做的后果就是使得神经网络更加接近线性，这样就会在过拟合和欠拟合之间取得一个合适的情况即适度拟合。

还有一种减少过拟合的正则化方法叫做dropout（随机失活）：对于每一个样本，首先复制整个神经网络，接着遍历每一层，并设置消除神经网络节点的概率，之后再根据概率来消除一些节点以及与之相连的线，这样就可以得到一个节点更少、规模更小的网络。就可以对这个网络进行常规计算了。

实现随机失活的方法是反向随机失活，即将简化过后的激活函数a等于a除以每个节点保留下来的概率，不同层的概率不同，同一层的概率相同。这样就会保持a的期望值不变。

在测试阶段，不使用随机失活，这是由于在反向随机失活中a除以了每个节点保留下来的概率，这样就会记住该层的特征。

神经网络要做的就是减少J，因此我们在选择工具来优化J时，只要关注w和b使得J（w，b）更小即可，然后预防过拟合还有其他任务即换句话说就是减少方差，这一步就使用另一套工具来实现。这种思想叫做“正交化”，就是在一个时间做一个任务。

猜你喜欢

转载自blog.csdn.net/qq_26593465/article/details/81128684

减少过拟合的方法—正则化及其原理

Dropout正则化和其他方法减少神经网络中的过拟合

为什么正则化（Regularization）可以减少过拟合风险

为什么正则化能减少模型过拟合程度

【Keras】减少过拟合的秘诀——Dropout正则化

1.5 为什么正则化可以减少过拟合？

为什么正则化可以减少过拟合？

正则化：五重境界理解减少过拟合的神器

过拟合问题——正则化方法

过拟合与正则化

深度学习笔记：1.4 正则化 & 1.5 为什么正则化可以减少过拟合

正则化方法：防止过拟合，提高泛化能力

浅议过拟合现象(overfitting)以及正则化技术原理

正则化缓解过拟合

减少过拟合（高方差）的方法

深度学习中减少过拟合方法

欠拟合，过拟合和正则化

欠拟合、过拟合以及正则化

【模型欠拟合与过拟合（正则化）】

机器学习：正则化项为什么能够防止过拟合？防止过拟合的方法

防止过拟合的正则化项

过拟合问题：正则化（转）

正则化如何防止过拟合

机器学习算法--正则化与过拟合

机器学习防止过拟合---正则化

正则化与特征稀疏，过拟合

过拟合解决利器-正则化项

过拟合，欠拟合，偏差，误差，正则化

模型正则化之欠拟合和过拟合

【机器学习】过拟合、欠拟合与正则化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)