transformer Position Embedding - 代码天地

transformer Position Embedding

企业开发 2023-07-22 20:24:41 阅读次数: 0

这是最近一段很棒的 Youtube 视频，它深入介绍了位置嵌入，并带有精美的动画：

Transformer 神经网络视觉指南 -（第 1 部分）位置嵌入

让我们尝试理解计算位置嵌入的公式的“sin”部分：

这里“pos”指的是“单词”在序列中的位置。P0指的是第一个词的位置embedding；“d”表示单词/令牌嵌入的大小。在此示例中，d=5。最后，“i”指的是嵌入的 5 个单独维度中的每一个维度（即 0、1、2、3、4）

虽然“d”是固定的，但“pos”和“i”会变化。让我们尝试理解后两者。

“pos”

如果我们绘制一条正弦曲线并改变“pos”（在 x 轴上），您将在 y 轴上得到不同的位置值。因此，具有不同位置的单词将具有不同的位置嵌入值。

但有一个问题。由于“sin”曲线间隔重复，您可以在上图中看到，P0 和 P6 具有相同的位置嵌入值，尽管位于两个非常不同的位置。这就是方程中“i”部分发挥作用的地方。

“i”

如果改变上面等式中的“i”，您将得到一堆频率不同的曲线。读取不同频率下的位置嵌入值，结果会在 P0 和 P6 的不同嵌入维度上给出不同的值。

加上这个位置编码，会破坏原来的“特征表达”里面的数据含义吗？

空间编码是以加法的方式直接加入到初始表达中,不改变原始表达的值。
初始表达代表每个关节的抽象特征,空间编码代表每个关节的空间位置信息。两者在语义上是不同的,直接加法不会使原表达失效。
加法之后,初始表达中关键点自己的特征被保留了下来,同时新增了空间位置的先验信息。
对注意力机制来说,有了空间位置编码,可以更区分不同关键点的表示,也更容易学习空间结构。

猜你喜欢

转载自blog.csdn.net/u010087338/article/details/131751918

transformer Position Embedding

Transformer的PE(position embedding),即位置编码理解

Transformer——patch embedding代码

position embedding的tensorflow实现

position embedding 代码

Transformer——位置编码器&&Embedding

【Transformer系列】深入浅出理解Embedding（词嵌入）

Ai 算法之Transformer 模型的实现: 一、Input Embedding模块和Positional Embedding模块的实现

（pytorch进阶之路）四种Position Embedding的原理及实现

Embedding

Transformer-02 MASK、FFN、残差连接+层归一化及Embedding

论文阅读：《PETR: Position Embedding Transformation for Multi-View 3D Object Detection》

【ViT 微调时关于position embedding如何插值（interpolate）的详解】

PETR: Position Embedding Transformation for Multi-View 3D Object Detection

图像检测 - PETR: Position Embedding Transformation for Multi-View 3D Object Detection (ECCV 2022)

14.CAPE：Camera View Position Embedding for Multi-View 3D Object Detection笔记

Transformer

The Transformer

【transformer】

Transformer | DETR目标检测中的位置编码position_encoding代码详解

position

用于多视图 3D 对象检测的位置嵌入变换(PETR: Position Embedding Transformation for Multi-View 3D Object Detection）

word embedding

Embedding理解

Embedding层

embedding space

embedding lookup

Embedding 意义

理解Embedding

embedding的理解

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)