为什么测试的时候不需要batch normalization 和dropout？ - 代码天地

为什么测试的时候不需要batch normalization 和dropout？

企业开发 2023-07-01 08:01:12 阅读次数: 0

转载自：

BN和Dropout在训练和测试时的差别

Batch Normalization
BN，Batch Normalization，就是在深度神经网络训练过程中使得每一层神经网络的输入保持相近的分布。

BN训练和测试时的参数是一样的嘛？

对于BN，在训练时，是对每一批的训练数据进行归一化，也即用每一批数据的均值和方差。

而在测试时，比如进行一个样本的预测，就并没有batch的概念，因此，这个时候用的均值和方差是全量训练数据的均值和方差

BN训练时为什么不用全量训练集的均值和方差呢？

因为在训练的第一个完整epoch过程中是无法得到输入层之外其他层全量训练集的均值和方差，只能在前向传播过程中获取已训练batch的均值和方差。那在一个完整epoch之后可以使用全量数据集的均值和方差嘛？

对于BN，是对每一批数据进行归一化到一个相同的分布，而每一批数据的均值和方差会有一定的差别，而不是用固定的值，这个差别实际上也能够增加模型的鲁棒性，也会在一定程度上减少过拟合。

但是一批数据和全量数据的均值和方差相差太多，又无法较好地代表训练集的分布，因此，BN一般要求将训练集完全打乱，并用一个较大的batch值，去缩小与全量数据的差别。

Dropout

Dropout 是在训练过程中以一定的概率的使神经元失活，即输出为0，以提高模型的泛化能力，减少过拟合。

扫描二维码关注公众号，回复： 15505976 查看本文章

Dropout 在训练和测试时都需要嘛？

Dropout 在训练时采用，是为了减少神经元对部分上层神经元的依赖，类似将多个不同网络结构的模型集成起来，减少过拟合的风险。

而在测试时，应该用整个训练好的模型，因此不需要dropout。

猜你喜欢

转载自blog.csdn.net/missgrass/article/details/125623752

为什么测试的时候不需要batch normalization 和dropout？

激活函数，Batch Normalization和Dropout

Batch Normalization和Dropout如何搭配使用？

Batch Normalization 以及dropout的原理解读

batch_normalization和layer normalization的区别

Batch normalization和Instance normalization的对比

深度学习总结：用pytorch做dropout和Batch Normalization时需要注意的地方，用tensorflow做dropout和BN时需要注意的地方,

【转载】深度学习总结：用pytorch做dropout和Batch Normalization时需要注意的地方，用tensorflow做dropout和BN时需要注意的地方,

深度学习基础系列（九）| Dropout VS Batch Normalization? 是时候放弃Dropout了深度学习基础系列（七）| Batch Normalization

Batch normalization和Layer normalization有什么区别？

L1、L2、Batch Normalization、Dropout为什么能够防止过拟合呢？

Convolution和Batch normalization的融合

残差网络、Dropout正则化、Batch Normalization浅了解

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

Batch normalization和Instance normalization 在域适应问题中的的作用

tensorflow中Batch Normalization和Layer Normalization的实现

Batch Normalization

深度学习中Dropout和Layer Normalization技术的使用

model.train()与model.eval()，标准化(Standardization)、归一化(Normalization），Dropout，Batch Normalization通俗理解

Batch Normalization和CNN中的shortcut

batch normalization 和激活函数的顺序问题

covariate shift和batch normalization问题

caffe+报错︱深度学习参数调优杂记+caffe训练时的问题+dropout/batch Normalization

深度学习知识点复习：feature normalization和batch normalization

为什么会出现Batch Normalization层

batch-normalization为什么效果好

为什么BN？batch normalization的原理及特点

Batch Normalization导读 Batch Normalization导读

batch normalization（BN）& group normalization（GN）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)