注意力机制笔记 - 代码天地

注意力机制笔记

其他 2019-04-11 11:11:32 阅读次数: 0

本文是对深度学习中的注意力机制做的笔记，并附上注意力机制应用的部分例子。

首先，从其功能感受下注意力机制的作用。

注意力机制让神经网络在执行预测任务时可以更多关注输入中的相关部分，更少关注不相关的部分

从上述表达提取出两个关键字段：更多关注和相关部分，两者的实现直接对应着attention机制的权重如何进行分配。具体的，原文通过Encoder-Decoder模式的计算过程进行阐明。

Encoder-Decoder框架

使用attention的Encoder-Decoder框架

图片来自这里

上图展示了引入attention后框架的变化：由固定的语义编码C变为根据输出不断变化的 $C{i}$ 。 $C{i}$ 的计算公式如下，其中， $L{x}$ 表示输入原句子的长度， $a{ij}$ 对应原句子中第j个单词的attention权重分配值， $h{j}$ 对应原句第j个单词的语义编码。

语意编码的计算公式

公式中 $a{ij}$ 的计算过程就是我们需要重点关注的注意力概率分配的处理逻辑，下图直观展示了其计算过程：计算所有的输入语义编码 $h{j}$ 和前一时刻隐节点状态 $H{i-1}$ 的相似程度(图中 $F(h{j}, H{i-1})$ 函数的作用)，然后归一化后(图中的Softmax)即可获得每个输入单词的注意力概率分配值。

attention概率值的计算过程

抽象为更一般的模型如下：相似度计算(阶段1)、相似度的归一化(阶段2)、计算attention值(阶段3)

attention机制的本质

由上可知，注意力机制的关键在于：计算的对象，对象间的相似度函数，归一化函数。

最后，附上几个相关的实现教程

扫描二维码关注公众号，回复： 5845730 查看本文章

参考文献：

猜你喜欢

转载自blog.csdn.net/hzhj2007/article/details/88086892

注意力机制笔记

注意力机制(Attention)学习笔记

注意力机制

【动手深度学习-笔记】注意力机制（一）注意力机制框架

【动手深度学习-笔记】注意力机制（三）多头注意力

【动手深度学习-笔记】注意力机制（二）注意力评分函数

注意力机制----transformer中注意力机制

自注意力机制与注意力机制

注意力机制（二）

注意力机制【译】

注意力机制（一）

注意力机制Attention

attention注意力机制

注意力机制的介绍

自注意力机制

Attention 注意力机制

注意力机制原理

注意力机制详解

SE注意力机制

注意力机制--CBAM

注意力机制浅析

Transformer——注意力机制

MaskRCNN与注意力机制

GAM注意力机制

ECA注意力机制

Attention,注意力机制

注意力机制整理

空间注意力机制

图注意力机制

注意力机制（Attention Mechanism）学习笔记

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)