【pytorch】LSTM | GRU使用 - 代码天地

【pytorch】LSTM | GRU使用

其他 2020-05-23 12:24:51 阅读次数: 0

1. LSTM

长短期记忆网络，主要用于做序列建模用
原理
主要参数
- batch_first：多gpu训练时要设置为True
- bidirectional: True表示双向
- input_size: 序列的特征维度
- hidden_size：隐含层的特征维度
使用

>>> rnn = nn.LSTM(10, 20, 2)
>>> input = torch.randn(5, 3, 10)		# seq， batch， features
>>> h0 = torch.randn(2, 3, 20)
>>> c0 = torch.randn(2, 3, 20)
>>> output, (hn, cn) = rnn(input, (h0, c0))

说明
- 一般在使用的时候都是省略了h，c。h是t时刻的隐藏状态，c是t时刻的单元格状态
- 注意： 多GPU训练的时候，需要将batch放到最前面

2. GRU

同样也是主要用于序列建模
原理
主要参数
- 主要就是初始化和输入时
使用

>>> rnn = nn.GRU(10, 20, 2)
>>> input = torch.randn(5, 3, 10)
>>> h0 = torch.randn(2, 3, 20)
>>> output, hn = rnn(input, h0)

注意
- h0 的特征shape是固定的(num_layers*num_directions, batch, hidden_size)

猜你喜欢

转载自blog.csdn.net/u011622208/article/details/106015993

【pytorch】LSTM | GRU使用

Pytorch_LSTM与GRU

Pytorch：RNN、LSTM、GRU

循环神经网络（RNN、LSTM、GRU）以及Pytorch的使用

LSTM原理及Pytorch使用

简单易懂深入PyTorch中RNN、LSTM和GRU使用和理解

Pytorch：RNN、LSTM、GRU、Bi-GRU、Bi-LSTM、梯度消失、梯度爆炸

GRU与LSTM

LSTM与GRU

LSTM & GRU

GRU and LSTM

LSTM 与 GRU

[PyTorch] rnn,lstm,gru中输入输出维度

PyTorch训练RNN, GRU, LSTM：手写数字识别

python pytorch实现RNN,LSTM，GRU，文本情感分类

LSTM和GRU

GRU与LSTM总结

LSTM和GRU的区别

RNN-LSTM-GRU

RNN，LSTM和GRU

LSTM和GRU介绍

RNN、GRU、LSTM

图解LSTM和GRU

RNN - LSTM - GRU

推荐系统与LSTM、GRU

LSTM 和GRU的区别

LSTM 及 GRU 介绍

RNN, LSTM, GRU cells

GRU和LSTM比较

TextCNN/RCNN/LSTM/GRU

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)