torch.nn.utils.rnn.pad_packed_sequence()的注意事项

其他 2020-10-25 02:39:22 阅读次数: 0

提要

看了很多讲解pytorch如何处理RNN变长padding的博客，我自己也写了一篇。但大家都没有提到一个问题，就是torch.nn.utils.rnn.pad_packed_sequence()的参数问题。(其实也不是个问题，只是大家没有提到)

我当时在用ESIM模型做文本关系推理，git下来的代码就用到了变长处理（当时看了很久）。但会出现一个问题:比如我设定max_len的长度是200，也就是经过padding后所有的句子统一长度为200。当前batch中，如果最长的句子实际长为135，那，经过packed，没什么问题，然后经过model，也没问题。

问题在pad上，pad后的所有句子长度最大就只有135了，也就是说所有<135的句子会重新pad，pad到135，而不是原来的max_len=200。

ESIM模型需要输入两个句子，那么经过pad之后，这两个句子的长度可能就不同了，再后来计算attention的时候就发生了错误。

解决

其实没什么大不了的。。。就是漏了个参数，
total_length，把它设置成了max_lenth大小，就好了。

总结

只是想做个记录，技术含量并不高。

猜你喜欢

转载自blog.csdn.net/jokerxsy/article/details/107275238

torch.nn.utils.rnn.pad_packed_sequence()的注意事项

torch.nn.utils.rnn.pad_packed_sequence()的注意事项

【pytorch】torch.nn.utils.rnn的pad_sequence、pack_padded_sequence、pad_packed_sequence、PackedSequence

pytorch中 nn.utils.rnn.pack_padded_sequence和nn.utils.rnn.pad_packed_sequence

torch.nn.utils.rnn.pad_sequence()详解【Pytorch入门手册】

pytorch中torch.nn.utils.rnn相关sequence的pad和pack操作

【pytorch】nn.utils.rnn.pad_sequence的使用

pytorch学习（一）：torch.nn.utils.rnn.pack_padded_sequence()的用法

Pytorch中的RNN之pack_padded_sequence()和pad_packed_sequence()

torch.nn.utils

Tensorflow运用RNN注意事项

torch.nn.functional.pad()函数的使用

tf.pad与torch.nn.functional.pad的区别

pytorch 之pad_sequence, pack_padded_sequence, pack_sequence, pad_packed_sequence使用

pytorch里的pack_padded_sequence和pad_packed_sequence解析

PyTorch之 pack_padded_sequence和pad_packed_sequence

使用torch.nn.functional.pad填充图片

Pytorch中torch.nn.functional.pad（）函数

torch之nn.utils.clip_grad_norm

torch.nn.CrossEntropyLoss()使用注意

freemarker 注意事项

Liunx 注意事项

cookie注意事项

Laravel注意事项

Json注意事项

mybatis注意事项

echart注意事项

less 注意事项

注意事项

for循环的注意事项

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)