关于attention的简单理解 - 代码天地

关于attention的简单理解

其他 2020-10-26 10:21:30 阅读次数: 0

对attention的简单理解

首先，令 $\mathcal{V} = \{v_1,...,v_{|\mathcal{V}|}\}$ ， $v_i \in \mathbb{R}^d$ 为item的向量表达；令 $\mathbb{R}^{d*d} \rightarrow \mathbb{R}$ 或者 $\mathbb{R}^{d} \rightarrow \mathbb{R}$ ， $f$ 可以是perceptron，可以是内积、cos相似度等（两个自变量时）；

记 $\alpha_{v_i}$ 为item对应的attention权重，其可以通过以下三种方式计算得到（目前只看到这三种，可能也有别的，大同小异吧，而且除了self-attention我们默认了 $v_i$ 既是key又是value）：

直接把自己映射成权重： $\alpha_{v_i} = softmax(f(v_i))$
和query对比后映射成权重： $\alpha_{v_i} = softmax(f(query,v_i))$
self-attention：把自己分别映射为query和key，再对比映射为权重（ $W^q,W^k \in \mathbb{R}^{d*l}$ ）， $f$ 为内积 $\alpha_{v_i} = softmax(f(v_i\cdot W^q,v_i\cdot W^k))$

最终有item的repr $e_i = \sum_{\mathcal{V}} \alpha_{v_j}v_j$

参考

猜你喜欢

转载自blog.csdn.net/namespace_Pt/article/details/109133099

关于attention的简单理解

关于Attention机制的一些简单理解

Attention（注意力机制）的简单理解

关于group by的简单理解

关于dubbo的简单理解

关于SSH的简单理解

关于ssm的简单理解

关于异常的简单理解

关于节气的简单理解

关于接口的简单理解

关于appium的简单理解

关于对vfs的简单理解

关于Promise的简单理解

self-attention 简单直白容易理解的介绍

简单理解反向注意力(Reverse Attention)机制

关于code sign的简单理解

关于AbstractQueuedSynchronizer（AQS)的简单理解

关于js动画简单理解；

关于闭包简单的理解

关于双指针的简单理解

简单易懂关于nextTick()的理解

浅谈 Attention 机制的理解

Attention Model 的理解

理解Attention机制

关于attention structure 的总结

关于self-attention

attention注意力机制的理解及简单实现（keras实现版本）

关于分布式的简单理解

关于超图的一些简单理解

【动态规划】关于转移方程的简单理解

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)