Attention的两种机制——global attention/local attention

其他 2020-02-11 10:45:46 阅读次数: 0

目录

1 Global Attention全局注意力机制

权重计算函数

Local Attention

1 Global Attention全局注意力机制

权重计算函数

眼尖的同学肯定发现这个attention机制比较核心的地方就是如何对Query和key计算注意力权重。下面简单总结几个常用的方法：

扫描二维码关注公众号，回复： 9078333 查看本文章

1、多层感知机方法

主要是先将query和key进行拼接，然后接一个激活函数为tanh的全连接层，然后再与一个网络定义的权重矩阵做乘积。

这种方法据说对于大规模的数据特别有效。

2、Bilinear方法

通过一个权重矩阵直接建立q和k的关系映射，比较直接，且计算速度较快。

3、Dot Product

这个方法更直接，连权重矩阵都省了，直接建立q和k的关系映射，优点是计算速度更快了，且不需要参数，降低了模型的复杂度。但是需要q和k的维度要相同。

4、scaled-dot Product

上面的点积方法有一个问题，就是随着向量维度的增加，最后得到的权重也会增加，为了提升计算效率，防止数据上溢，对其进行scaling。

我个人通常会使用2和3，4。因为硬件机器性能的限制，1的方法计算比较复杂，训练成本比较高。

Local Attention

在这里插入图片描述

local attention机制选择性的关注于上下文所在的一个小窗口，这能减少计算代价。

关键值注意力（key-value attention）

自注意力（self-attention）

Multi-head attention

References：

NLP中的全局注意力机制（Global Attention）

详解注意力机制（Attention）——Global/Local/Self Attention

Attention机制简单总结

一枚小码农

发布了74 篇原创文章 · 获赞 17 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_25394043/article/details/103600780

Attention的两种机制——global attention/local attention

Attention机制论文阅读——global attention和local attention

attention

【论文笔记】Attention总结二：Attention本质思想 + Hard/Soft/Global/Local形式Attention

Attention机制（Bahdanau attention & Luong Attention）

attention机制

attention 机制

tensorflow 中两种attention机制区别

Soft Attention and Hard Attention

attention与self attention的区别

Axial Attention 轴向attention

Attention与Self-Attention

Progressive Sparse Local Attention for Video object detection

非局部attention之Non-local

Effective Approaches to Attention-based Neural Machine Translation(Global和Local attention)

QANet: Combining Local Convolution With Global Self-Attention For Reading Comprehension

Focal Self-attention for Local-Global Interactions inVision Transformers

Focal Self-attention for Local-Global Interactions in Vision Transformers

Attention Mechanism Bahdanau attention vs Luong attention

Attention机制学习（一）传统Attention机制

推荐系统与Attention机制——详解Attention机制

Attention Points

Attention模型

Attention Model

Attention in CV

ATTENTION MECHANISM

Attention总结

attention 讲解

Attention 编写

Attention 文章

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)