Attention（注意力机制）的简单理解 - 代码天地

Attention（注意力机制）的简单理解

企业开发 2023-09-05 18:46:33 阅读次数: 0

Attention（注意力机制）

直白的理解：注意力机制，对于数据，我们有重要的数据和不重要的数据。在模型处理数据的过程中，我们如果只关注较为重要的数据部分，忽略不重要的部分，那训练的速度、模型的精度就会变得更好。
在这里插入图片描述

由图可知:我们作为人类，常常会聚焦于较为重要的内容上。

由此，Attention的主要目的，就是要模仿人类一样，学会聚焦重要的内容部分，查找到目标，并计算被查找目标的相似度。

计算过程

我们设立三个参数，Q,V,K。整个注意力机制的过程如下：

1.Q是最适合查找目标的

2.K是最适合接收查找的

3.V就是内容

4.Q(查找的目标), $K=k_1,k_2.....,k_n$ ,一般使用点乘Q，K，拿到Q和每一个K的相似值 $Q*k_n=s_n$ 。

5.做一层 $softmax(s_1,s_2,\cdots,s_n)=a_n$ 得到每一个查询对象的概率。

6.计算 $a_n*V=V'$ 事物的重要度，相似度计算,找到Q最相似的对象。
在这里插入图片描述

总结出的公式为： $Attention(Q,K,V)=softmax(\frac{Q*K_i}{\sqrt d_k})*V_i$
在这里插入图片描述

扫描二维码关注公众号，回复： 16430585 查看本文章

PS:为什么softmax中需要除以一个 $\sqrt d_k$

softmax（）作为归一化的处理，当得到的概率差距较大时如（0.05,0.95），最后所点乘出的V的差距就会过大。

一般在注意力机制中，我们常常使用 $\frac{512}{8}$ 作为处理。

猜你喜欢

转载自blog.csdn.net/m0_51581537/article/details/129317107

Attention（注意力机制）的简单理解

简单理解反向注意力(Reverse Attention)机制

注意力机制Attention

attention注意力机制

Attention 注意力机制

Attention,注意力机制

attention注意力机制的理解及简单实现（keras实现版本）

简单理解Transformer注意力机制

深度学习中注意力机制的理解-Attention mechanism

深入理解深度学习——注意力机制（Attention Mechanism）：Bahdanau注意力

注意力机制-CA注意力-Coordinate attention

深入理解深度学习——注意力机制（Attention Mechanism）：注意力评分函数（Attention Scoring Function）

深入理解深度学习——注意力机制（Attention Mechanism）：自注意力（Self-attention）

深入理解深度学习——注意力机制（Attention Mechanism）：多头注意力（Multi-head Attention）

Attention注意力机制–原理与应用

（Slide）Attention Mechanism注意力机制

Attention注意力机制介绍

注意力机制 Attention Model

注意力机制(Attention)学习笔记

Attention注意力机制--原理与应用

Attention注意力机制简介

注意力机制解析--转载Attention

注意力机制(Attention Mechanism)

注意力机制（Attention Mechanism）-ECANet

注意力机制（Attention Mechanism）-SENet

注意力机制（Attention Mechanism）-CBAM

注意力机制——Coordinate Attention

ChatGPT 的灵魂：Attention 注意力机制

Attention：何为注意力机制？

注意力机制之MUSE Attention

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)