深度学习（十二）过拟合的解决方案（清洗数据、增强数据、正则化、Dropout） - 代码天地

深度学习（十二）过拟合的解决方案（清洗数据、增强数据、正则化、Dropout）

其他 2018-06-04 08:18:30 阅读次数: 0

基本上所做的项目中都出现了过拟合，这也是每个神经网络训练者需要面对的问题。越多的神经元，就越能表达复杂的模型，但也不是越多越好，在训练样本有限的情况下，很容易导致过拟合。

过拟合的解决方案：

1、重新清洗数据

2、增加训练数据量

3、损失函数加正则化项（详细可看正则化惩罚项文章链接）

不同惩罚系数下的拟合结果对比如图，惩罚系数λ=0.001伸出的爪子本质就是过拟合了，λ=0.1泛化能力强。

4、Dropout

复杂的网络VC维非常高，这导致它的记忆能力非常强，很多个体上没有泛化能力的特征也会被它记忆学习下来，网络中的大量的w参数会记住点点星星的特点，使得整个网络不够简洁，很容易导致过拟合，进而导致损失函数在训练集上下降而在验证集上反而上升的现象。

Dropout（丢弃）方法在每一轮的训练上选择性的（原则上是随机的）丢弃部分网络节点（如图所示），让它们关闭，即既不输出也不输入，相当于整个网络的结构发生了变化，每次训练其实相当于网络的一部分所形成的一个自网络或者子模型，这在一定程度上降低了VC维的数量，减小了过拟合的风险。在最终的分类阶段将所有节点都置于有效状态，这样就可以把训练中得到的所有子网络“并联”使用，形成一个由多个VC维较低的部分的分类模型所组成的完整的分类模型。一般可设置dropout-rate为0.6，即训练时随机丢弃40%的节点，在Caffe和Tensorflow框架中可以很方便的设置实现，现在的神经网络基本上都使用dropout-rate基本上所有图像识别的项目都出现了过拟合，都得采取措施。

参考https://blog.csdn.net/willduan1/article/details/53070777

参考高扬《白话深度学习与Tensorflow》

猜你喜欢

转载自blog.csdn.net/hzqgangtiexia/article/details/80509812

深度学习（十二）过拟合的解决方案（清洗数据、增强数据、正则化、Dropout）

过拟合解决方案之正则化

过拟合的解决方法，正则化方法：L1和L2 regularization、数据集扩增、dropout

深度学习解决过拟合——数据增广

深度学习中 --- 解决过拟合问题（dropout, batchnormalization）

【深度学习】5-4 与学习相关的技巧 - 正则化解决过拟合（权值衰减，Dropout）

深度学习：欠拟合、过拟合、正则化，BN ,L1/L2 范数正则化、bagging集成，dropout

深度学习——过拟合和Dropout

深度学习的过拟合与欠拟合问题的介绍与解决方案

深度学习笔记 4 过拟合+欠拟合+解决方案

dropout解决过拟合

防止过拟合篇：正则化方法：L1和L2 regularization、数据集扩增、dropout

过拟合解决方案

过拟合解决方法之L2正则化和Dropout

【Keras】减少过拟合的秘诀——Dropout正则化

浅谈深度学习尝常识：泛化、过拟合、Dropout、Attention

spark数据清洗解决方案

解决机器学习和深度学习模型过拟合，增强鲁棒性和泛化能力总结

通过 Dropout 增强深度学习模型：对抗过度拟合的策略

人工智能-模型过拟合解决方案：Regularization/正则化/Weight Decay【L1正则化、L2正则化】

【机器学习】过拟合的原因及解决方案

Dropout解决过拟合问题

Dropout解决过拟合代码

深度学习(2):4-2 Dropout 过拟合

【深度学习】实验13 使用Dropout抑制过拟合

深度学习理论——过拟合、欠拟合、正则化、优化器

深度学习笔记：1.4 正则化 & 1.5 为什么正则化可以减少过拟合

过拟合的原因和解决方案

过拟合（原因、解决方案、原理）

MXNET深度学习框架-09-使用正则化方法解决过拟合问题(以从0开始的线性回归为例)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)