seq2seq编码器与解码器 --学习笔记 - 代码天地

seq2seq编码器与解码器 --学习笔记

其他 2018-11-12 19:27:13 阅读次数: 0

版权声明：转载请声明转自Juanlyjack https://blog.csdn.net/m0_38088359/article/details/83867386

0、网络图结构

在这里插入图片描述
从上图可以看出，编码是一个RNN网络，当然可以是一个单向RNN也可以是一个双向RNN，C是一个context为背景变量，将输入信息进行编码汇总得到一个信息。接着由这个背景变量作为解码的输入，加上隐藏变量和输出变量，得到结果在进行映射，依次得到序列的每个预测结果。
在这里插入图片描述
以上x1，x2，x3分别表示时间步输入，h1，h2等分别表示时间步隐藏状态，y1，y2分别表示时间步输出，s1，s2分别表示输出时间步的隐藏状态。
注意：
（1）h0一般初始化为零向量；
（2）y0一般初始化为< bos >表示序列的开始（因为y0无法观测到）；
（3）s0一般初始化为：系数W乘以输入序列的第一个字的反向隐藏层信息，在经过双正切激活函数tanh。
补充：
这里的背景变量C可以取自于输入编码的最后一个输出，也可以取自于q(h1,h2,h3,…,hT)，这个函数q根据需求改变。

1、编码器

编码器的作用是把一个不定长的输入序列变换成一个定长的背景变量 c，并在该背景变量中编码输入序列信息。常用的编码器是循环神经网络。

在这里插入图片描述

也可以使用双向循环神经网络构造编码器。这种情况下，编码器每个时间步的隐藏状态同时取决于该时间步之前和之后的子序列（包括当前时间步的输入），并编码了整个序列的信息。我们可以使用拼接的方式将每个时间步的隐藏状态拼接起来，也即concat。

2、解码器

在这里插入图片描述

学习自此处
致谢李沐大神！

猜你喜欢

转载自blog.csdn.net/m0_38088359/article/details/83867386

seq2seq编码器与解码器 --学习笔记

编码器解码器架构、Seq2Seq简要笔记

编码器—解码器（seq2seq）+ Attention

seq2seq通俗理解----编码器和解码器(TensorFlow实现)

transformer bert seq2seq 深度学习编码和解码的逻辑-重点

seq2seq学习

seq2seq学习笔记

Seq2Seq ---学习笔记

机器学习笔记：seq2seq & attentioned seq2seq

seq2seq模型笔记

TensorFlow Seq2Seq Model笔记

深度学习：Seq2seq模型

机器学习面试—seq2seq

深度学习的seq2seq模型

seq2seq and attention模型学习笔记

李沐动手学深度学习V2-Encoder-Decoder编码器和解码器架构

deepchem&rdkit | seq2seq自动编码器生成新分子

Keras深度学习实战（36）——基于编码器-解码器的机器翻译模型

机器学习笔记 - 基于最简单的编码器/解码器架构SegNet进行语义分割

2020-3-14 深度学习笔记14 - 自编码器 3（表示能力、层的大小和深度，随机编码器和解码器）

tensorflow之seq2seq阅读笔记

深度学习之seq2seq简单介绍(待续)

deeplearning.ai学习seq2seq模型

基于Seq2Seq模型的深度学习推荐算法

NLP学习记录5——seq2seq模型

NLP学习(5)----seq2seq/transformer

机器翻译数据集编码器-解码器架构以及实现动手学深度学习v2

学习笔记CB013: TensorFlow、TensorBoard、seq2seq

学习笔记CB014:TensorFlow seq2seq模型步步进阶

NLP学习笔记九-机器翻译-seq2seq模型

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)