自注意力机制 - 代码天地

自注意力机制

其他 2020-03-29 16:33:02 阅读次数: 0

介绍

自注意力机制在序列模型中取得了很大的进步，另一方面，上下文信息对于很多视觉任务都很关键，如语义分割、目标检测。自注意力机制通过（key、query、value）的三元组提供了一种有效的捕捉全局上下文信息的建模方式。

attention通常可以进行如下描述，表示为将query(Q)和key-value pairs映射到输出上，其中query、每个key、每个value都是向量，输出是V中所有values的加权，其中权重是由Query和每个key计算出来的。计算方法分为三步：

计算比较Q和K的相似度，用f表示；
将得到的相似度进行softmax归一化：
针对计算出来的权重，对所有的values进行加权求和，得到Attention向量：

计算相似度的方法有一下4中：

query、k、v的意义

以翻译为例：
source:我是中国人

target: I am Chinese

比如翻译目标单词为 I 的时候，Q为I

而source中的 “我” “是” “中国人”都是K，

那么Q就要与每一个source中的K进行对齐（相似度计算）；"I"与"我"的相似度，"I"与"是"的相似度；"I"与"中国人"的相似度；

相似度的值进行归一化后会生成对齐概率值（“I"与source中每个单词的相似度（和为1）），也可以注意力值；

而V代表每个source中输出的context vector；如果为RNN模型的话就是对应的状态向量；即key与value相同；

然后相应的V与相应的P进行加权求和，就得到了context vetor；

在这里插入图片描述

可以这样进一步解释注意力机制：将source中的构成元素想象成是由一系列的数据对构成，此时给定target中的某个元素query，通过计算query和各个key的相似性或者相关性，得到每个key对应value的权重系数，然后对value进行加权求和，即得到了最终的attention数值。所以本质上attention机制是对source中元素的value值进行加权求和，而query和key用来计算对应value的权重系数。

发布了371 篇原创文章 · 获赞 36 · 访问量 6万+

私信关注

猜你喜欢

转载自blog.csdn.net/strawqqhat/article/details/104990628

自注意力机制

自注意力机制与注意力机制

图解自注意力机制

keras实现自注意力机制

自注意力机制和transformer

视觉注意力机制——通道注意力、空间注意力、自注意力

【注意力机制】多头注意力、自注意力、层归一化、位置嵌入

注意力机制

NLP中的self-attention【自-注意力】机制

视觉中Attention自注意力机制笔记（二）

视觉中Attention自注意力机制笔记（一）

7-2 自注意力机制原理

自注意力机制(Self-Attention)

Transformer自注意力机制发展历程(原理)

【学习笔记】自注意力机制self-attention

自注意力机制中的位置编码

PyTorch——实现自注意力机制（self-attention）

自注意力机制-李宏毅课程笔记

自注意力机制超级详解（Self-attention）

图解transformer中的自注意力机制

Self-Attention 自注意力机制

self-attention（自注意力机制）

多头自注意力机制的代码实现

图解transformer中的自注意力机制（备忘）

深度学习：自注意力机制(Self-Attention)

【Transformer 相关理论深入理解】注意力机制、自注意力机制、多头注意力机制、位置编码

注意力机制（Attention）、自注意力机制(Self Attention)和多头注意力(Multi-head Self Attention)机制详解

Transformer：注意力机制（attention）和自注意力机制（self-attention）的学习总结

注意力机制----transformer中注意力机制

注意力机制（二）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)