总结PYTORCH中nn.lstm(自官方文档整理包括参数、实例) - 代码天地

总结PYTORCH中nn.lstm(自官方文档整理包括参数、实例)

其他 2020-04-12 20:11:33 阅读次数: 0

参考pytorch官方文档
https://pytorch.org/docs/master/nn.html#torch.nn.LSTM

先上原图图1 LSTM内部原理介绍没啥好说的

| 图2 关键参数介绍
这里是关键参数介绍
input_size:输入特征的数目
hidden_size:隐层的特征数目
num_layers：这个是模型集成的LSTM的个数记住这里是模型中有多少个LSTM摞起来一般默认就1个
bias：用不用偏置默认是用
batch_first:默认为假若为真，则输入、输出的tensor的格式为(batch , seq , feature)
即[batch_size, time_step, input_size] 【batch大小，序列长度，特征数目】
dropout:默认0 若非0，则为dropout率
bidirectional：是否为双向LSTM 默认为否

图3是输入输出接口
下面仅考虑单项情况
输入格式为lstm(input,(h_0, c_0))
这里面，input为（seq_len, batch, input_size）这里默认batch_first为false，否则前两个换顺序
h_0是格式为(num_layers * num_directions, batch, hidden_size)的tensor 它包含batch中每个元素的最初的隐态
若为双向lstm num_dire…=2 否则=1
c_0是格式为(seq_len, batch, input_size）的tensor 它包含batch中每个元素最初的cell state
若h_0和c_0不提供，则默认为0

输出格式为(output,(h_n,c_n))
output是形状为(seq_len, batch, num_directions*hidden_size）的tensor，包含输出特征h_t(源于LSTM每个t的最后一层)
h_n是形状为(num_layers * num_directions, batch, hidden_size)的tensor，包含t=seq_len（即序列末尾）的隐态值
c_n是形状为(num_layers * num_directions, batch, hidden_size)的tensor，包含t=seq_len（即序列末尾）的cell值

图4变量解释和示例
直接看示例

rnn = nn.LSTM(10,20,2)#输入向量维数10, 隐藏元维度20, 2个LSTM层串联(若不写则默认为1）
input = torch.randn(5,3,10)#输入（seq_len, batch, input_size） 序列长度为5 batch为3 输入维度为10
h0 = torch.randn(2,3,20)#h_0(num_layers * num_directions, batch, hidden_size)  num_layers = 2 ，batch=3 ，hidden_size = 20
c0 = torch.randn(2,3,20)#同上
output, (hn,cn) = rnn(input, (h0,c0))

1996MZH

发布了43 篇原创文章 · 获赞 14 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_41545780/article/details/89890440

总结PYTORCH中nn.lstm(自官方文档整理包括参数、实例)

pytorch中的nn.LSTM模块参数详解

pytorch nn.LSTM()参数详解

详解Pytorch中的torch.nn.MSELoss函，包括对每个参数的分析！

【nn.LSTM详解】

深度学习总结：tensorflow和pytorch关于RNN的对比,tf.nn.dynamic_rnn,nn.LSTM

基于pytorch的NLP实例讲解（包括pytorch入门讲解）

【PyTorch API】 nn.RNN 和 nn.LSTM 介绍和代码详解

PyTorch 中的 LSTM模型参数解释

libsvm中各参数介绍（包括里面结构体参数的介绍）

[Pytorch系列-53]：循环神经网络 - torch.nn.LSTM（）参数详解

Revit API修改项目文档中族实例的参数

Python中函数定义及参数实例

Go语言函数中的参数传递实例

PyTorch 保存和加载模型参数，从预训练模型中加载部分参数，包括预训练模型中某些参数不匹配的情况

pytorch_LSTM:参数

总结Thred的基本用法，包括线程创建，线程中断，线程等待，线程休眠，获取线程实例

emqx中文文档学习（包括各种配置文件参数说明）

pytorch中的参数类——torch.nn.parameter

Spring Boot之 Controller 接收参数和返回数据总结(包括上传、下载文件)

英科--获取request 中的所有参数-包括Cookie-摘录

正则表达式，取返回数据中（包括html）内指定参数的值

如何在vscode中debug python代码，包括如何优雅地传入多个参数

C++生成.dll文件后在Python中引用（包括传递参数是double型、char*数组，接收参数也为数组）

【笔记】Pytorch nn.Parameter()：作为nn.Module中的可训练参数使用

理解Pytorch中LSTM的输入输出参数含义

[Python笔记]函数中关键字参数,收集参数与分配参数的使用实例

JVM调优总结（一）之参数配置说明与实例

Pytorch 学习（6）：Pytorch中的torch.nn Convolution Layers 卷积层参数初始化

java代码复用实例 -- 将不同的方法写在参数中

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)