PyTorch 1.0 中文官方教程：序列模型和LSTM网络 - 代码天地

PyTorch 1.0 中文官方教程：序列模型和LSTM网络

其他 2019-02-10 12:28:01 阅读次数: 0

译者：ETCartman

之前我们已经学过了许多的前馈网络. 所谓前馈网络, 就是网络中不会保存状态. 然而有时这并不是我们想要的效果. 在自然语言处理 (NLP, Natural Language Processing) 中, 序列模型是一个核心的概念. 所谓序列模型, 即输入依赖于时间信息的模型. 一个典型的序列模型是隐马尔科夫模型 (HMM, Hidden Markov Model). 另一个序列模型的例子是条件随机场 (CRF, Conditional Random Field).

循环神经网络是指可以保存某种状态的神经网络. 比如说, 网络上个时刻的输出可以作为下个时刻的输入, 这样信息就可以通过序列在网络中一直往后传递. 对于LSTM (Long-Short Term Memory) 来说, 序列中的每个元素都有一个相应的隐状态 $h_t$, 该隐状态原则上可以包含序列当前结点之前的任一节点的信息. 我们可以使用隐藏状态来预测语言模型中的单词, 词性标签以及其他各种各样的东西.

Pytorch中的LSTM

在正式学习之前，有几个点要说明一下，Pytorch中LSTM的输入形式是一个3D的Tensor，每一个维度都有固定的意义，第一个维度就是序列本身，第二个维度是mini-batch中实例的索引，第三个维度是输入元素的索引，我们之前没有接触过mini-batch所以我们就先假设第二维的维度是1。

如果要用"The cow jumped"这个句子来运行一个序列模型，那么就应该把它整理成如下的形式：

\[\begin{split}\begin{bmatrix} \overbrace{q_\text{The}}^\text{row vector} \\ q_\text{cow} \\ q_\text{jumped} \end{bmatrix}\end{split}\]

除了有一个额外的大小为1的第二维度.

此外, 你还可以向网络逐个输入序列, 在这种情况下, 第一个轴的大小也是1.

来看一个简单的例子.

# 作者: Robert Guthrie

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

torch.manual_seed(1)

阅读全文／改进本文

猜你喜欢

转载自www.cnblogs.com/wizardforcel/p/10358922.html

PyTorch 1.0 中文官方教程：序列模型和LSTM网络

PyTorch 1.0 中文官方教程：Torchvision 模型微调

PyTorch 1.0 中文官方教程：可选：数据并行处理PyTorch 1.0 中文官方教程

PyTorch 1.0 中文官方教程：PyTorch 介绍

PyTorch 1.0 中文官方教程：在 C++ 中加载 PYTORCH 模型

PyTorch 1.0 中文官方教程：ONNX 现场演示教程

PyTorch 1.0 中文官方教程：迁移学习教程

PyTorch 1.0 中文官方教程：训练分类器

PyTorch 1.0 中文官方教程：空间变换器网络教程

PyTorch 1.0 中文官方教程：混合前端的 seq2seq 模型部署

PyTorch 1.0 中文官方教程：使用字符级别特征的 RNN 网络进行姓氏分类

PyTorch 1.0 中文官方教程：数据加载和处理教程

PyTorch 1.0 中文官方教程：用 numpy 和 scipy 创建扩展

PyTorch 1.0 中文官方教程：使用 PyTorch 进行图像风格转换

PyTorch 1.0 中文官方教程：使用PyTorch进行深度学习

PyTorch 1.0 中文官方教程：使用 PyTorch C++ 前端

教程：PyTorch 1.0 教程

PyTorch 1.0 中文官方教程：基于注意力机制的 seq2seq 神经网络翻译

PyTorch 1.0 中文官方教程：对抗性示例生成

PyTorch 1.0 中文官方教程：使用 Amazon AWS 进行分布式训练

PyTorch 1.0 中文官方教程：torch.nn 到底是什么？

PyTorch 1.0 中文文档：CUDA 语义

PyTorch 1.0 中文文档：广播语义

PyTorch 1.0 中文文档：Windows FAQ

pytorch学习1.0系列------04 保存模型

PyTorch1.0 教程、例子和书籍

PyTorch 1.0 中文文档：序列化的相关语义

安装pytorch1.0

pytorch学习1.0系列------03（保存模型+加载模型）

PyTorch 1.0 中文文档：自动求导机制

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)