机器学习&深度学习训练中防止过拟合的方法 - 代码天地

机器学习&深度学习训练中防止过拟合的方法

其他 2020-06-20 10:34:41 阅读次数: 0

防止过拟合的一些方法

L1 loss

在loss function中添加模型权重参数的绝对值和，用超参数 $\alpha$ 调节L1 loss在整体loss function中占的比例。
$L_{n e w} = L_{o l d} + α \sum | w |$ ${L_{new}} = {L_{old}} + \alpha \sum {\left| w \right|}$

L2 loss

在loss function中添加模型权重参数的平方和，用超参数 $\beta$ 调节L2 loss在整体loss function中占的比例。
$L_{n e w} = L_{o l d} + β \sum {‖ w ‖}^{2}$ ${L_{new}} = {L_{old}} + \beta \sum {{{\left\| w \right\|}^2}}$

early stopping

当验证集的误差不再下降时，停止训练，防止过拟合。

数据增强

使用一些数据增强的方法(resize，crop，warp….)，增加数据量，增加模型训练结果的泛化能力

dropout

在神经网络训练中，随机抑制特定网络层的一些神经元，相当于引入随机性，这可以增加系统的鲁棒性。

集成方法

在机器学习中常用，将不同的模型进行融合，bagging，boosting等方法。

batch normalization

这个操作主要是为了使所有数据的分布都是 $N(0,1)$ 分布的，减少了Internal convariate shift，可以加快训练过程；但是这种方法会导致网络学到的特征被破坏，因此在BN中，又通过学习的方法引入两个参数，对归一化的数据进行变换，得到最终的输出。具体的公式变换如下

\begin{array}{l} μ_{B} = \frac{1}{m} \sum_{i = 1}^{m} x_{i} \\ σ_{B}^{2} = \frac{1}{m} \sum_{i = 1}^{m} (x_{i} - μ_{B})^{2} \\ {\hat{x}}_{i} = \frac{x_{i} - μ_{B}}{\sqrt{σ_{B}^{2} + ε}} \\ y_{i} = γ {\hat{x}}_{i} + β = B N_{γ, β} (x_{i}) \end{array}

$\begin{array}{l} {\mu _B} = \frac{1}{m}\sum\limits_{i = 1}^m {{x_i}} \\ \sigma _B^2 = \frac{1}{m}\sum\limits_{i = 1}^m {({x_i} - } {\mu _B}{)^2}\\ {{\hat x}_i} = \frac{{{x_i} - {\mu _B}}}{{\sqrt {\sigma _B^2 + \varepsilon } }}\\ {y_i} = \gamma {{\hat x}_i} + \beta = B{N_{\gamma ,\beta }}({x_i}) \end{array}$

参考链接

猜你喜欢

转载自blog.csdn.net/u012526003/article/details/81879692

机器学习&深度学习训练中防止过拟合的方法

机器学习中防止过拟合方法

深度学习中过拟合与防止过拟合的方法

深度学习防止过拟合的方法

机器学习中防止过拟合的处理方法

机器学习：防止模型过拟合的方法

机器学习中过拟合原因和防止过拟合的方法

学习中防止过拟合的处理方法

机器学习：正则化项为什么能够防止过拟合？防止过拟合的方法

深度学习防止过拟合的几种方法

防止过拟合方法深度学习（一）-CNN原理研究

深度学习--防止过拟合的几种方法

深度学习笔记--防止过拟合的几种方法

深度学习之防止过拟合的方法及技巧

机器学习中常见的防止过拟合处理方法

机器学习中用来防止过拟合的方法有哪些？

Python机器学习 -- 防止过拟合的处理方法

机器学习 - 防止过拟合方法-正则线性模型

10种防止机器学习模型过拟合的方法

深度学习中减少过拟合方法

机器学习中过拟合的处理方法

label smooth/mixup——深度学习中的一种防止过拟合方法

机器学习防止过拟合---正则化

机器学习如何防止过拟合

深度学习中的过拟合

机器学习、深度学习中过拟合的理解及解决方法

机器学习中的过拟合

深度学习中的过拟合&欠拟合

机器学习中的欠拟合与过拟合

深度学习中降低过拟合(OverFitting)的方法

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)