深度学习 batch_size - 代码天地

深度学习 batch_size

编程语言 2019-01-05 02:30:19 阅读次数: 0

1. batch_size、iteration、epoch简介

batch_size：每批数据量的大小。深度学习通常用SGD的优化算法进行训练，也就是一次（1 个iteration）一起训练batch_size个样本，计算它们的平均损失函数值，来更新参数。

iteration：1个iteration即迭代一次，也就是用batchsize个样本训练一次。

epoch：1个epoch指用训练集中的全部样本训练一次，此时相当于batchsize 等于训练集的样本数。

2.batch_size

定义：一次性读入多少批量的图片。

batch_size=数据集大小，适用于小数据集。batch_size= N（自己设定），适用于大数据集。batch_size=1，在线学习。

在合理范围内，增大 batch_size 有何好处？

内存利用率提高了，大矩阵乘法的并行化效率提高。

跑完一次 epoch（全数据集）所需的迭代次数减少，对于相同数据量的处理速度进一步加快。

在一定范围内，一般来说 batch_size 越大，其确定的下降方向越准，引起训练震荡越小。

盲目增大 batch_size 有何坏处？

内存利用率提高了，但是内存容量可能撑不住了。

跑完一次 epoch（全数据集）所需的迭代次数减少，要想达到相同的精度，其所花费的时间大大增加了，从而对参数的修正也就显得更加缓慢。

batch_size 增大到一定程度，其确定的下降方向已经基本不再变化。

总结：

首先根据显存大小选择batch_size；其次根据自己的实际情况调整batch_size，调参重在“调”，根据实际情况选择合适的参数。大数据集中batch_size 32 至 256 是不错的初始值选择，尤其是 64 和 128，选择2的指数倍的原因是：计算机内存一般为 2 的指数倍，采用 2 进制编码。设置好batch_size后，每一次epoch记得shuffle一次，不要让网络通过相同的minibach。

猜你喜欢

转载自blog.csdn.net/weixin_40277254/article/details/85781494

深度学习的batch_size

深度学习 batch_size

深度学习-Batch_Size

谈谈深度学习中的 Batch_Size

深度学习中的batch_size

深度学习中的batch_size设置

关于深度学习中的batch_size

深度学习 batch_size epoch 优化

2.深度学习中的batch_size的理解

深度学习（六）batch_size和epoch

深度学习基础--epoch、iteration、batch_size

深度学习中的epochs、batch_size、iterations详解

【深度学习 | Pytorch】从MNIST数据集看batch_size

在机器学习中epoch, iteration, batch_size的区别

机器学习基本概念：batch_size、epoch、 iteration

【深度学习参数笔记1】谈谈深度学习中的 Batch_Size

tensorflow学习笔记--深度学习中的epochs，batch_size，iterations详解

深度学习概念、参数理解：iteration, batch_size, epoch, learning rate, weight_decay

【实验操作】关于深度学习中的批处理数据的问题——epochs，batch_size，iterations

深度学习中的epochs，batch_size，iterations详解---对这三个概念说的比较清楚

深度学习中的 Batch_Size作用，调节方法和相关问题解决方法

机器学习0007 每次应该训练多少数据batch_size应该设成多少

batch_size的影响

batch_size的理解

batch_size的含义

Batch_size的选择

[调参技巧]深度机器学习中的batch的大小对学习效果有何影响？ Batch_size参数的作用：

Batch_size如何设置

epoch， batch_size，iteration

batch_size与梯度下降

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)