Dropout解决过拟合代码 - 代码天地

Dropout解决过拟合代码

其他 2020-04-05 11:49:02 阅读次数: 0

学习自《深度学习入门》

过拟合指的是只能拟合训练数据，但不能很好地拟合不包含在训练数据中的其他数据的状态。

发生过拟合的原因，主要有以下两个。

模型拥有大量参数、表现力强。
训练数据少

权值衰减是一直以来经常被使用的一种抑制过拟合的方法，。该方法可以简单地实现，在某种程度上能够抑制过拟合。但是，如果网络的模型变得很复杂，只用权值衰减就难以应对了。在这种情况下，我们经常会使用Dropout 方法

Dropout是一种在学习的过程中随机删除神经元的方法

训练时，每传递一次数据，随机选出隐藏层的神经元，然后将其删除。被删除的神经元不再进行信号的传递
测试时，虽然会传递所有的神经元信号，但是对于各个神经元的输出，要乘上训练时的删除比例后再输出
在这里插入图片描述

class Dropout:
 def __init__(self, dropout_ratio=0.5):
   self.dropout_ratio = dropout_ratio
   self.mask = None
 def forward(self, x, train_flg=True):
   if train_flg:
     self.mask = np.random.rand(*x.shape) > self.dropout_ratio
     return x * self.mask
   else:
     return x * (1.0 - self.dropout_ratio)
 def backward(self, dout):
    return dout * self.mask

这里的要点是，每次正向传播时，self.mask中都会以False的形式保存要删除的神经元。self.mask会随机生成和x形状相同的数组，并将值比dropout_ratio大的元素设为True。反向传播时的行为和ReLU相同。也就是说，正向传播时传递了信号的神经元，反向传播时按原样传递信号；正向传播时没有传递信号的神经元，反向传播时信号将停在那

代码解释

a=[[1,2,3],
   [4,5,6]]
dropout_ratio=0.5
print(np.random.rand(*np.array(a).shape))
mask=np.random.rand(*np.array(a).shape)>0.5
print(mask)

>>>
[[0.03797064 0.24113302 0.23486832]
 [0.67104404 0.63273187 0.81895389]]
[[ True False False]
 [False  True  True]]

晴雪儿

发布了178 篇原创文章 · 获赞 140 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_42146775/article/details/104595624

Dropout解决过拟合代码

dropout解决过拟合

Dropout解决过拟合问题

TensorFlow利用dropout解决过拟合问题

Tensorflow——Dropout(解决过拟合问题)

转：Dropout解决过拟合问题

Dropout为什么解决过拟合，以及Dropout的缺点

dropout和过拟合

Dropout 缓解过拟合

【DropOut】防止过拟合

dropout 过拟合

过拟合理论和代码 Dropout -PyTorch 展示

TensorFlow 编程训练9利用dropout解决过拟合问题

深度学习中 --- 解决过拟合问题（dropout, batchnormalization）

防止过拟合、dropout理解

tensorflow的dropout 防止过拟合

防止过拟合（二）：Dropout

【Python】Dropout抑制过拟合

抑制过拟合——Dropout原理

[Python人工智能] 七.什么是过拟合及dropout解决神经网络中的过拟合问题

TensorFlow实战利用dropout抑制过拟合

5.4 高阶内容-Dropout 缓解过拟合

Dropout判断可以抵抗过拟合的方法

深度学习——过拟合和Dropout

深度学习（十二）过拟合的解决方案（清洗数据、增强数据、正则化、Dropout）

tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题

TensorFlow之如何用dropout解决神经网络的过拟合问题

过拟合解决方法之L2正则化和Dropout

防止过拟合以及解决过拟合

防止过拟合采用dropout方式：tf.nn.dropout()/tf.layers.dropout()

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)