软注意力机制和硬注意力机制，以及seq2seq - 代码天地

软注意力机制和硬注意力机制，以及seq2seq

其他 2021-11-26 16:02:13 阅读次数: 0

软注意力机制就是虽然词语权重不同，但是在训练模型的时候雨露均沾，每个词语都用到，焦点词语的权重大。硬注意力机制是从存储的多个信息中只挑出一条信息来，可能是概率最大的那个词向量,seq2seq是word2vec(词嵌入)的Encoder-Decoder框架******************************************************************************************************************************************
**以RNN作为编码器和解码器的Encoder-Decoder框架也叫做异步的序列到序列模型，而这就是如雷灌耳的Seq2Seq模型！惊不惊喜，意不意外！？
而seq2seq模型，简单来说就是一个翻译模型，把一个语言序列翻译成另一种语言序列，整个处理过程是通过使用深度神经网络( LSTM (长短记忆网络)，或者RNN (递归神经网络)）将一个序列作为输入影射为另外一个输出序列******************************************************************************如下图所示
在这里插入图片描述
在神经网络模型处理大量输入信息的过程中，利用注意力机制，可以做到只选择一些关键的的输入信息进行处理，来提高神经网络的效率，比如在机器阅读理解任务中，给定一篇很长的文章，然后就文章的内容进行提问。提出的问题只和段落中一两个句子有关，其余部分都是无关的，那么只需要把相关的片段挑出来让神经网络进行处理，而不需要把所有文章内容都输入到神经网络中。
给定这样一个场景：把输入信息向量X看做是一个信息存储器，现在给定一个查询向量q，用来查找并选择X中的某些信息，那么就需要知道被选择信息的索引位置。采取“软性”选择机制，不是从存储的多个信息中只挑出一条信息来，而是雨露均沾，从所有的信息中都抽取一些，只不过最相关的信息抽取得就多一些。

猜你喜欢

转载自blog.csdn.net/qq_44543774/article/details/121078454

软注意力机制和硬注意力机制，以及seq2seq

注意力机制和Seq2seq模型

Seq2Seq模型与注意力机制

注意力机制与Seq2seq模型

seq2seq及注意力机制

Seq2Seq - - 注意力机制

注意力机制----seq2seq中的注意力机制

91.使用注意力机制的seq2seq以及代码实现

机器翻译及相关技术、注意力机制和Seq2seq模型、Transformer

深度学习之注意力机制（Attention Mechanism）和Seq2Seq

深入理解注意力机制（Attention Mechanism）和Seq2Seq

机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer

机器翻译及相关技术 & 注意力机制与Seq2seq模型 & Transformer

多图+公式全面解析RNN,LSTM,Seq2Seq,Attention注意力机制

序列到序列网络seq2seq与注意力机制attention浅析

【深度学习】图解机器翻译模型：基于注意力机制的 Seq2Seq

动手学深度学习（四十八）——使用注意力机制的seq2seq

Pytorch系列教程-使用Seq2Seq网络和注意力机制进行机器翻译

《动手学习深度学习》之二：注意力机制和Seq2seq模型（打卡2.2）

Attention使用注意力机制的seq2seq 动手学深度学习v2

李沐动手学深度学习V2-基于注意力机制的seq2seq

PyTorch 1.0 中文官方教程：基于注意力机制的 seq2seq 神经网络翻译

可视化神经机器翻译模型（基于注意力机制的Seq2seq模型）

睿智的seq2seq模型4——往英文到法文的翻译里加上注意力机制

睿智的seq2seq模型3——注意力机制概念详解与其在LSTM中的使用

[ DLPytorch ] 注意力机制与Seq2seq模型&Transformer&机器翻译及相关技术

Task04：机器翻译及相关技术；注意力机制与Seq2seq模型；Transformer

14天动手学深度学习 task2 《动手学》：注意力机制和Seq2seq模型笔记

【动画详解人工智能原理】Tranformer 模型中的注意力机制的工作过程是怎样的？一个带有注意力的 Seq2seq 模型的机制实例视频动画详细讲解

【深度学习系列（六）】：RNN系列（4）：带注意力机制的seq2seq模型及其实战(2)：为图片添加内容描述

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)