Encoder-Decoder模型 - 代码天地

Encoder-Decoder模型

其他 2018-08-27 20:18:13 阅读次数: 0

1. 起源：

paper：Sequence to Sequence Learning with Neural Network

2014年，Sutskever提出的简单Enc-Dec模型

解决sequence to sequence转换的问题，采用了编码和解码的结构

如下图示例，其中，编码是将source sequence（x1,x2,x3,x4,...）转化为一个固定长度的context vector(c)，解码是将该context vector转化为target sequence(y1,y2,y3,...)

Encoder最后一个时间步的状态作为整个句子的中间语义context vector

context vector直接作为Decoder的初始状态。

2. 应用：

机器翻译：待翻译的文本序列-->翻译文本序列

语音识别：声学特征序列-->识别文本序列

问答系统：问题描述单词序列-->生成答案单词序列

文本摘要：文本序列-->摘要序列

3. 进展：

从简单的Encoder-Decoder到Attention-based Encoder-Decoder

下图为简单的Encoder-Decoder，Decoder部分的输入为Encoder部分编码的固定长度向量(c=hT)，不利于处理长时输入。

下图为简单的Attention-based Encoder-Decoder，Encoder部分和上面一致，Decoder部分引入Attention机制, 使得c更灵活，这时候c就是由h1,...,hT加权求和获得，

且每个hi前面的权重系数Wi不一样，增加模型的灵活性。

4. 参考资料

[1] http://blog.csdn.net/mounty_fsc/article/details/78498517

[2] Sutskever I, Vinyals O,Le Q V. Sequence to sequence learning with neural networks[J]. 2014,4:3104-3112

[3] BahdanauD,Cho K, Bengio Y. Neural Machine Translation byJointly Learning to Align and Translate[J]. Computer Science, 2014.

猜你喜欢

转载自blog.csdn.net/chinabing/article/details/78763454

Encoder-Decoder模型

Encoder-Decoder模型和Attention模型

Encoder-Decoder 模型架构详解

用Encoder-Decoder模型自动生成文本摘要

摒弃encoder-decoder结构，Pervasive Attention模型与Keras实现

拆 Transformer 系列一：Encoder-Decoder 模型架构详解

【原创】实现ChatGPT中Transformer模型之Encoder-Decoder

Encoder-Decoder 架构实现

Encoder-Decoder 预训练

ChatGPT 的结构：Encoder-Decoder

Causal decoder、Prefix decoder和encoder-decoder

自然语言处理中的Encoder-Decoder模型，基本Sequence to Sequence模型

深度学习笔记(六)：Encoder-Decoder模型和Attention模型

Tips for Generation in Encoder-Decoder model

Encoder-Decoder(有待编写）

Encoder-Decoder综述理解(推荐)

RNN成长记(三)：Encoder-Decoder

encoder-decoder模型实现seq2seq中的简单时间序列预测

机器翻译Seq2Seq(Encoder-Decoder)+Attention模型Tensorflow实现

基于深度学习的新闻摘要生成算法实现与详解（Encoder-Decoder框架模型）

Bahdanau 注意力(具备注意力机制的Encoder-Decoder模型)

SegNet:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

Encoder-Decoder （based on RNNS / LSTM）用于序列学习方案

SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation要点

论文笔记：GRU----RNN Encoder-Decoder

「Computer Vision」Note on Fully Convolutional Encoder-Decoder Network

从Encoder-Decoder(Seq2Seq)理解Attention的本质

基于encoder-decoder和DCGAN的轨迹压缩研究

LSTM 07：如何用Keras开发 Encoder-Decoder LSTM

Encoder-Decoder架构与注意力机制

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)