Batch Size大小对训练过程的影响 - 代码天地

Batch Size大小对训练过程的影响

其他 2020-04-25 10:30:47 阅读次数: 0

现在绝大多数的框架在进行mini-batch的反向传播的时候，默认都是将batch中每个instance的loss平均化之后在进行反向传播，所以相对大一点的batch size能够防止loss震荡的情况发生。从这两张图中可以看出batch size越小，相邻iter之间的loss震荡就越厉害，相应的，反传回去的梯度的变化也就越大，也就越不利于收敛。同时很有意思的一个现象，batch size为1的时候，loss到后期会发生爆炸，这主要是lr=0.02设置太大，所以某个异常值的出现会严重扰动到训练过程。这也是为什么对于较小的batchsize，要设置小lr的原因之一，避免异常值对结果造成的扰巨大扰动。而对于较大的batchsize，要设置大一点的lr的原因则是大batch每次迭代的梯度方向相对固定，大lr可以加速其收敛过程。

batch size过小，花费时间多，同时梯度震荡严重，不利于收敛；batch size过大，不同batch的梯度方向没有任何变化，容易陷入局部极小值

行*云

发布了33 篇原创文章 · 获赞 46 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_34795071/article/details/102726323

Batch Size大小对训练过程的影响

BATCH_SIZE大小设置对训练耗时的影响

SGD中batch_size大小的影响

Batch_Size对网络训练结果的影响

Batch size对神经网络训练的影响

batch_size的影响

训练数据与batch大小

batch 、batch size、epoch、 iteration

如何选取Batch Size大小

batch_size对于卷积神经网络训练的影响

batch size和模型宽度对训练结果的影响

【机器学习】浅谈 Batch Size 对训练神经网络的影响

模型训练-Batch size大小，优化和泛化

epoch,iteration,batch,batch_size

batch、batch_size、epoch、iteration简介

batch size设置技巧

batch_size的理解

batch_size的含义

Epoch和Batch Size

Batch_size的选择

Batch Size理解

caffe模型训练batch_size设置

人工智能系列（一）batch size对神经网络训练的影响

batch.size()[0]与batch.size()[1]的意思

Batch_size如何设置

epoch、 iteration和batch size

epoch， batch_size，iteration

Epoch、Batch Size和迭代

Epoch、Batch Size和Iterations

batch size、iteration、epoch的含义

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)