如何理解RNN中的Batch_size？ - 代码天地

如何理解RNN中的Batch_size？

其他 2020-04-17 10:54:58 阅读次数: 0

对于Batch_size肯定都不陌生，是机器学习中的一个重要参数

多数时候使用Batch的训练效果会比设置Batch_size=1的训练效果要好。

通俗的理解一下，Batch_size=126时模型一次看了126个样本再来决定梯度下降往哪个方向降，而Batch_size=1时，模型进行了126次横冲直撞的梯度下降，单样本更新参数的随机性太大，显然可以看出使用Batch的模型效果会更好。

同时CNN中的Batch相对比较好理解，一次读取Batch_size个图片，然后依次输入CNN，前向传播Batch_size次后更新权重即可，但是在RNN中由于数据多了一个时间维度time_step，对Batch的理解会有些不动，这里以NLP举一个简单的例子：

首先我们都知道RNN能展开成这样：

然后有一个数据集包含五句话（天气真好）（你是谁啊）（我是小明）（明天打球）（武汉加油）

数据集的维度就是（batch_size, time_step, feature_dim）= (5, 4, word_embedding)

	time_step1	time_step2	time_step3	time_step4
batch_size1	天	气	真	好
batch_size2	你	是	谁	啊
batch_size3	我	是	小	明
batch_size4	明	天	打	球
batch_size5	武	汉	加	油

对于这样一个数据集，输入RNN的时候是什么情况？

RNN是每个time_step输入一次数据，那么for循环time_step1时，进入网络的数据就是（天，你，我，明，武）每句话的第一个字进入网络，然后依次往后，这里我们最简单的理解就是同时有batch_size个RNN在处理数据，每个RNN处理一个字，那么time_step1的输出就是(batch_size, hidden_size)，整个batch处理完输出为（batch_size, time_step, hidden_size）。

Forizon

发布了80 篇原创文章 · 获赞 184 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/hesongzefairy/article/details/105159892

如何理解RNN中的Batch_size？

batch_size的理解

Pytorch中RNN LSTM的input（重点理解batch_size/time_steps）

Batch_size如何设置

2.深度学习中的batch_size的理解

谈谈深度学习中的 Batch_Size

SGD中batch_size大小的影响

深度学习中的batch_size

深度学习中的batch_size设置

关于深度学习中的batch_size

batch_size的影响

batch_size的含义

Batch_size的选择

Caffe中的batch_size和iter_size

batch_size和data_iter的理解

Keras中RNN、LSTM、GRU等输入形状batch_input_shape=(batch_size,time_steps,input_dim)及TimeseriesGenerator详解

在机器学习中epoch, iteration, batch_size的区别

神经网络中batch_size的作用(翻译)

深度学习中的epochs、batch_size、iterations详解

神经网络中的epoch、batch_size和iteration

LSTM中的batch_size到底是什么

epoch， batch_size，iteration

深度学习的batch_size

batch_size、iterations、epoch

batch_size与梯度下降

深度学习 batch_size

batch_size啥意思

深度学习-Batch_Size

epoch,iteration,batch,batch_size

batch、batch_size、epoch、iteration简介

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)