pytorch lstm input_size, hidden_size说明 - 代码天地

pytorch lstm input_size, hidden_size说明

企业开发 2023-08-11 19:01:25 阅读次数: 0

了解了LSTM原理后，一直搞不清Pytorch中input_size, hidden_size和output的size应该是什么，现整理一下

假设我现在有个时间序列，timestep=11, 每个timestep对应的时刻上特征维度是50，那么input_size就是50
然后说hidden_size
截知乎一个图比较好理解
在这里插入图片描述
hidden_size就是黄色圆圈，可以自己定义，假设现在定义hidden_size=64
那么output的size又是多少
再截上面知乎的一个图

可以看到output是最后一层layer的hidden输出的组合，一层LSTM的话不用考虑layer，就是所有timestep上hidden_size的组合
假设现在batch_size=20, batch_first=True
那么output的size就是(batch, timestep, hidden_size)也就是(20,11,64)

验证一下：

class RNN(nn.Module):
    def __init__(self):
        super(RNN,self).__init__()
 
        self.rnn = nn.LSTM(
            input_size=50,
            hidden_size=64,
            num_layers=1,
            batch_first=True,
        )
 
        self.out = nn.Linear(64,2) #最后时刻的hidden映射
 
    def forward(self,x):
        r_out, (h_n, h_c) = self.rnn(x, None)
        print('lstm out size:')
        print(r_out.shape) #这里输出output的size
        out = self.out(r_out[:,-1,:]) #取最后一个时刻的hidden作输出
        return out

输出：

lstm out size:
torch.Size([20, 11, 64])

猜你喜欢

转载自blog.csdn.net/level_code/article/details/108122808

pytorch lstm input_size, hidden_size说明

DeepLearning之LSTM模型输入参数：time_step, input_size, batch_size的理解

Pytorch中RNN LSTM的input（重点理解batch_size/time_steps）

Pytorch LSTM网络初始化hidden维度报错：RuntimeError: Expected hidden[0] size (2, 14, 150), got [2, 64, 150]

【Pytorch警告】Using a target size (torch.Size([])) that is different to the input size (torch.Size([1])

pytorch LSTM

LSTM in Pytorch

Pytorch ConvTranspose2d input and output size Infer

pytorch笔记：07)LSTM

pytorch, LSTM介绍

Pytorch中的LSTM

pytorch的LSTM笔记

PyTorch-LSTM

Pytorch_LSTM与GRU

pytorch RNN&LSTM

Convolutional LSTM PyTorch

Pytorch：RNN、LSTM、GRU

Pytorch LSTM dataset 设置

LSTM in PyTorch II

【pytorch】LSTM | GRU使用

Pytorch《LSTM模型》

pytorch之LSTM(四)

pytorch 调用lstm

pytorch_LSTM:参数

lstm古诗生成-pytorch

pytorch 搭建lstm模型

LSTM原理及Pytorch使用

pytorch中的size()、 squeeze()函数

input size and weight size are mismatched

LSTM中的batch_size到底是什么

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)