深度学习基础--注意力机制(attention)

其他 2018-11-13 09:50:56 阅读次数: 0

注意力机制(attention)

在机器翻译中的应用

在Deep learning火起来后，最常见的建模方式是用Recurrent Neural Networks (RNN) 将上下文"“编码”"，然后再"“解码”"成目标文本。以机器翻译为例。
Google最近的论文中，用一个 RNN encoder读入context，得到一个context vector（RNN的最后一个hidden state）；然后另一个RNN decoder以这个hidden state为起始state，依次生成target的每一个单词。But,这种做法的缺点是，无论之前的context有多长，包含多少信息量，最终都要被压缩成一个几百维的vector。这意味着context越大，最终的state vector会丢失越多的信息。
输入sentence长度增加后，最终decoder翻译的结果会显著变差。事实上，因为context在输入时已知，一个模型完全可以在decode的过程中利用context的全部信息，而不仅仅是最后一个state。Attention based model的核心思想就是如此。

具体做法

首先，在生成target side的states时 ()，所有context vectors ()都会被当做输入。
其次，并不是所有context都对下一个状态的生成产生影响。例如，当翻译英文文章的时候，我们要关注的是“当前翻译的那个部分”，而不是整篇文章。“Attention”的意思就是选择恰当的context并用它生成下一个状态。
在大部分的论文中，Attention是一个权重vector（通常是softmax的输出），其维度等于context的长度。越大的权重代表对应位置的context越重要。不同论文对attention权重的计算方式不同，但其核心抛不开上述两点。

注意力机制的实现流程：
1）将 sentence embeeding 连接到到每个 location 的 image feature，
2）然后通过一个 MLP 获得每个 location 的分值，
3）然后再通过一个 softmax 获得 attention map，
4）然后以后的 visual feature 就是每一个 location 的 feature 的加权平均。"

应用

用于NLP，LSTM，captioning 任务等。

猜你喜欢

转载自blog.csdn.net/wydbyxr/article/details/83988834

深度学习基础--注意力机制(attention)

深度学习之注意力机制（Attention Mechanism）

深度学习之注意力机制attention

详解深度学习中的注意力机制（Attention）

深度学习：注意力机制(Attention Mechanism)

深度学习中注意力机制的理解-Attention mechanism

深度学习：自注意力机制(Self-Attention)

深入理解深度学习——注意力机制（Attention Mechanism）：Bahdanau注意力

深入理解深度学习——注意力机制（Attention Mechanism）：基础知识

注意力机制(Attention)学习笔记

深入理解深度学习——注意力机制（Attention Mechanism）：自注意力（Self-attention）

深入理解深度学习——注意力机制（Attention Mechanism）：多头注意力（Multi-head Attention）

深入理解深度学习——注意力机制（Attention Mechanism）：注意力评分函数（Attention Scoring Function）

深度学习中的注意力机制模型及代码实现(SE Attention、CBAM Attention)

注意力机制Attention

attention注意力机制

Attention 注意力机制

Attention,注意力机制

注意力机制 attention 注意力分数动手学深度学习v2

深入理解深度学习——注意力机制（Attention Mechanism）：注意力汇聚与Nadaraya-Watson 核回归

深度神经网络中的注意力（Attention）机制

深度学习之注意力机制（Attention Mechanism）和Seq2Seq

深度学习炼丹涨点神器之 Coordinate Attention （坐标注意力机制）

深入理解深度学习——注意力机制（Attention Mechanism）：位置编码（Positional Encoding）

【李宏毅 | 深度学习】自注意力机制（Self-attention）

深度学习中的注意力机制

深度学习之注意力机制

【深度学习】注意力机制（四）

【深度学习】注意力机制（三）

【深度学习】注意力机制（六）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)