神经网络的过拟合问题 - 代码天地

神经网络的过拟合问题

其他 2018-07-16 05:16:33 阅读次数: 0

神经网络的过拟合问题

神经网络模型训练会出现三种情况：模型过于简单，模型合理，过拟合。
为避免过拟合问题，常常使用正则化方法

正则化的思想是：在损失函数中加入刻画模型复杂程度的指标。
模型优化时需要优化该损失函数：

J (θ) + λ R (w)

$J(\theta)+\lambda R(w)$
其中：

J (θ)

$J(\theta)$ 为损失函数，

θ

$\theta$ 表示的是一个神经网络的所有参数，包括权重

w

$w$ 和偏置

b

$b$ ；

$R(w)$ 为模型复杂度函数，一般模型的复杂度只由权重 $w$ 决定，所以刻画模型复杂度的函数 $R(w)$ 有两种：

一种是L1正则化，公式为：
$R (w) = {‖ w ‖}_{1} = \sum_{i} | w_{i} |$ $R(w)=\left \|w \right \|_{1}=\sum_{i}\left | w_{i} \right |$
另一种为L2正则化，公式为：
$R (w) = {‖ w ‖}_{2}^{2} = \sum_{i} | w_{i}^{2} |$ $R(w)=\left \|w \right \|_{2}^{2}=\sum_{i}\left | w_{i}^{2} \right |$

联系与区别

联系：

无论哪一种正则化方式，基本思想都是希望通过限制权重的大小，使得模型不能任意拟合训练数据中的随机噪声。

区别：

L1正则化会使参数变得更稀疏（即0元素更多），L2不会，因为某参数很小时，平方项可以忽略，模型就不会对其再进行调整。
L1正则化公式不可导，L2正则化公式可导。

实际使用中：
可以将L1正则化和L2正则化分别赋权求和使用：
公式如下：

R (w) = \sum_{i} α | w_{i} | + (1 - α) w_{i}^{2}

$R(w)=\sum_{i}\alpha \left | w_{i} \right |+(1-\alpha )w_{i}^{2}$
其中:

α

$\alpha$ 和

(1 - α)

$(1-\alpha )$ 分别为L1正则化与L2正则化的权重。

猜你喜欢

转载自blog.csdn.net/liuxiaodong400/article/details/80900693

神经网络的过拟合问题

神经网络过拟合问题

神经网络解决过拟合问题

神经网络于过拟合

神经网络结构与过拟合问题

神经网络学习笔记——过拟合问题

神经网络防止过拟合的方法

神经网络解决过拟合的方法

神经网络中的过拟合

神经网络欠拟合与过拟合方法

[Python人工智能] 七.什么是过拟合及dropout解决神经网络中的过拟合问题

神经网络的过拟合是什么,神经网络数据拟合例题

神经网络拟合是什么意思,全连接神经网络过拟合

一个有趣的说法：多层神经网络的致命问题与过拟合

TensorFlow之如何用dropout解决神经网络的过拟合问题

Pytorch神经网络实战学习笔记_20 过拟合问题的优化技巧（二）：Dropout()方法

多层神经网络的线性与拟合问题

机器学习：过拟合、神经网络Dropout

神经网络之防止过拟合方法

CNN-卷积神经网络防止过拟合的方法

三步绝招——降低神经网络过拟合

神经网络模型优化方法（缓解过拟合）

卷积神经网络对抗过拟合的主要方法

提升神经网络的性能-防止过拟合

深入浅出——搞懂卷积神经网络的过拟合、梯度弥散、batchsize的影响的问题（二）

02--13神经网络模型实例演示&14过拟合问题解决方案

Pytorch神经网络实战学习笔记_21 过拟合问题的优化技巧（三）：批量归一化

如何降低神经网络模型的过拟合和欠拟合？

机器学习 -- 过拟合与欠拟合以及应对过拟合的方法神经网络中的超参数如何选择

Micheal Nielsen's神经网络学习之三：过拟合与规范化

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)