Transformer——注意力机制

企业开发 2023-04-09 07:11:17 阅读次数: 0

1 注意力机制

如下图所示，婴儿在干嘛吗？

判断婴儿再关注什么？颜色深表示主要注意力，颜色浅表示不那么注意。

注意力机制公式：

$Attention(Q,K,V) = softmax(\frac{Q\cdot K^{T}}{\sqrt{d_{k}}})V$

那么根据上述婴儿图篇可以抽象为：

将图片的区域划分为四块，分别为左上、左下、右上、右下（Key1~4）；（V1~4代表值向量）

step1: 首先Key和Query做点乘，点乘结果越大其相似度越大

step2: 将step1的结果和对应的V矩阵相乘，得到矩阵相加。即为注意力机制的和。

2 Transfomer中的注意力

2.1 在只有单词的向量的情况下，如何获取QKV?

如下图所示：输入向量X1、X2分别于 $W^{^{Q}} \: \; W^{^{K}}\; \; W^{^{V}}$ 相乘-----》---》--》得到q、k、v

2.2 计算QK的相似度，得到attention

如上述注意力机制公式一样，点乘得到加权和

实际代码使用矩阵相乘，方便并行

多头注意力机制，把原始数据分割为不同空间，分别计算再合在一起输出

猜你喜欢

转载自blog.csdn.net/maggieyiyi/article/details/126989443

Transformer——注意力机制

注意力机制----transformer中注意力机制

自注意力机制和transformer

简单理解Transformer注意力机制

注意力&Transformer

深度学习——机器翻译、注意力机制、transformer

学习笔记-Transformer中注意力机制

注意力机制----Multi-Head Attention 和 transformer

从零开始快速入门Transformer注意力机制

Transformer多头注意力机制实现数字预测（pytorch）

Transformer自注意力机制发展历程(原理)

人工智能课程笔记：注意力机制 Transformer

图解transformer中的自注意力机制

注意力机制——Spatial Transformer Networks（STN）

图解transformer中的自注意力机制（备忘）

注意力机制

【Transformer 相关理论深入理解】注意力机制、自注意力机制、多头注意力机制、位置编码

Transformer：注意力机制（attention）和自注意力机制（self-attention）的学习总结

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

解码Transformer：自注意力机制与编解码器机制详述与代码实现

自注意力机制与注意力机制

注意力的厉害模型transformer学习

关于Transformer中注意力的理解

注意力机制（二）

注意力机制（一）

注意力机制【译】

注意力机制笔记

注意力机制Attention

attention注意力机制

注意力机制的介绍

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)