RNN、LSTM、Seq2Seq

编程语言 2023-07-16 06:16:22 阅读次数: 0

目录

时间序列表示
梯度弥散和梯度爆炸
RNN（循环神经网络）
LSTM
Seq2Seq
ELMo

时间序列表示

核心是加入历史信息去预测下一步骤

在NLP中，序列维度一般是这个样子:[b,seq_len,feature_len]
b个句子，每个句子seq_len个单词，每个单词feature_len个维度

NLP大部分是和时间相关的

步长，在计算机又叫记忆，比如预测一个点的值，是用多长的步长去预测它，要根据不同数据选择不同的步长

Embedding是词向量的分布式表示
在这里插入图片描述

梯度弥散和梯度爆炸

当解决短文本没有这个问题，解决长文本时，这个模型就有问题
在这里插入图片描述

RNN（循环神经网络）

在这里插入图片描述
x_t@w_xh是自身的影响，h_t@w_xh是历史信息的影响

在这里插入图片描述

只要Y4的输出信息，因为Y4记录了前面的历史信息，所以4个单词就变成只要1个单词

多层循环神经网络
在这里插入图片描述

堆叠RNN
在这里插入图片描述
信息越来越明确、清晰

双向RNN
在这里插入图片描述
反向进行也有可能让信息更加明确

LSTM

由RNN来的，在此基础上增加一些门控机制，门控用来选择存储哪些历史信息
在这里插入图片描述

f_t决定遗忘哪些信息

在这里插入图片描述
i_t和C_t决定学习哪些新信息

在这里插入图片描述

Seq2Seq

编码解码模型
在这里插入图片描述

ELMo

用来预训练语言模型
相当于2个双向的LSTM
在这里插入图片描述

注意力机制：在Seq2Seq中注意到每个单词的重要程度

猜你喜欢

转载自blog.csdn.net/qq_40527560/article/details/131626765

RNN、LSTM、Seq2Seq

『RNN』SEQ2SEQ

从LSTM到Seq2Seq

RNN、LSTM、Seq2Seq、Attention、Teacher forcing、Skip thought模型总结

多图+公式全面解析RNN,LSTM,Seq2Seq,Attention注意力机制

图解RNN、RNN变体、Seq2Seq、Attention机制

Seq2Seq

基于rnn 的基本seq2seq 任务

Pytorch+LSTM+Attention 实现 Seq2Seq

个人总结：从RNN（内含BPTT以及梯度消失/爆炸）到 LSTM（内含BiLSTM、GRU）Seq2Seq Attention

seq2seq模型

tensorflow seq2seq

seq2seq学习

seq2seq attention

seq2seq理解

seq2seq原理

PyTorch: SEQ2SEQ

seq2seq 函数

seq2seq、attention

RNN(一) —— 完全图解RNN、RNN变体、Seq2Seq、Attention机制

【转】完全图解RNN、RNN变体、Seq2Seq、Attention机制

[转]完全图解RNN、RNN变体、Seq2Seq、Attention机制

自然语言处理 | (24) RNN、RNN变体、Seq2Seq、Attention机制简介

完全图解RNN、RNN变体、Seq2Seq、Attention机制

Seq2Seq原理2

seq2seq的实现方式（2）

深度学习：Seq2seq模型

seq2seq 代码解析

seq2seq模型笔记

Seq2Seq模型讲解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)