LSTM和GRU原理及pytorch代码，输入输出大小说明 - 代码天地

LSTM和GRU原理及pytorch代码，输入输出大小说明

其他 2018-12-27 23:35:32 阅读次数: 0

#RNN
rnn=nn.RNN(10,20,2) #(each_input_size, hidden_state, num_layers)
input=torch.randn(5,3,10) # (seq_len, batch, input_size)
h0=torch.randn(2,3,20) #(num_layers * num_directions, batch, hidden_size)
output,hn=rnn(input,h0)
print(output.size(),hn.size())


#LSTM
rnn=nn.LSTM(10,20,2) #(each_input_size, hidden_state, num_layers)
input=torch.randn(5,3,10) # (seq_len, batch, input_size)
h0=torch.randn(2,3,20) #(num_layers * num_directions, batch, hidden_size)
c0=torch.randn(2,3,20) #(num_layers * num_directions, batch, hidden_size)
output,(hn,cn)=rnn(input,(h0,c0))
print(output.size(),hn.size(),cn.size())


#GRU
rnn=nn.GRU(10,20,2)
input=torch.randn(5,3,10)
h0=torch.randn(2,3,20)
output,hn=rnn(input,h0)
print(output.size(),hn.size())

先上结论：

output保存了最后一层，每个time step的输出h，如果是双向LSTM，每个time step的输出h = [h正向, h逆向] (同一个time step的正向和逆向的h连接起来)。
h_n保存了每一层，最后一个time step的输出h，如果是双向LSTM，单独保存前向和后向的最后一个time step的输出h。
c_n与h_n一致，只是它保存的是c的值。

output是一个三维的张量，第一维表示序列长度，第二维表示一批的样本数(batch)，第三维是 hidden_size(隐藏层大小) * num_directions ,双向的时候num_directions是2

h_n是一个三维的张量，第一维是num_layers*num_directions，num_layers是我们定义的神经网络的层数，num_directions在上面介绍过，取值为1或2，表示是否为双向LSTM

c_n与h_n的结构一样，就不重复赘述了。

猜你喜欢

转载自blog.csdn.net/qq_30468133/article/details/85244957

LSTM和GRU原理及pytorch代码，输入输出大小说明

[PyTorch] rnn,lstm,gru中输入输出维度

Pytorch-LSTM输入输出参数

理解Pytorch中LSTM的输入输出参数含义

lstm&bilstm输入输出格式(附代码)

lstm&bilstm输入输出格式(附代码)

Pytorch_LSTM与GRU

Pytorch：RNN、LSTM、GRU

【pytorch】LSTM | GRU使用

LSTM和GRU结构及原理介绍

tensorflow 笔记8：RNN、Lstm源码，训练代码输入输出，维度分析

输入输出优化代码

pytorch转置卷积(反卷积)参数说明，尺寸输入输出的计算

极简说明 RNN LSTM GRU 结构和公式

输入输出系统——轮询、中断、DMA的原理和区别

LSTM和GRU

LSTM和GRU的区别

RNN，LSTM和GRU

LSTM和GRU介绍

图解LSTM和GRU

LSTM 和GRU的区别

GRU和LSTM比较

lstm和GRU推导

重温LSTM和GRU

卷积输入输出图像大小的计算

LSTM 神经网络输入输出层

如何理解LSTM的输入输出格式

简析LSTM()函数的输入输出数据

RNN & LSTM & GRU 的原理与区别

LSTM GRU详细解释原理

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)