Transformer——Decoder

企业开发 2023-04-09 07:11:14 阅读次数: 0

目录

1 多头注意力机制

1 多头注意力机制

1.1 mask

ques:为什么需要mask？

ans:如果没有mask，那么在训练的时候存在you和know。如下图，但是在测试的时候，没有mask，会出现误差，模型效果不好。

需要mask 如图：

训练的时候将you和know mask掉，保证一致性。

2 交互层

所有的encoder输出和每一个decoder去做交互。

具体交互如下：

encoder生成K、V矩阵；decoder提高Q矩阵，即多有注意力机制计算K、Q、K的值。公式如下：

猜你喜欢

转载自blog.csdn.net/maggieyiyi/article/details/126991415

Transformer——Decoder

Transformer Decoder详解

拆 Transformer 系列一：Encoder-Decoder 模型架构详解

Transformer-Encoder & Decoder细节详解（以DETR为例）

Transformer中解码器decoder的详细讲解（图文解释）

学习笔记：深度学习（7）——从Encoder-Decoder到Transformer

【原创】实现ChatGPT中Transformer模型之Encoder-Decoder

5分钟理解transformer中的decoder

Decoder

The Decoder

NLP课程：Encoder-Decoder框架、Attention、Transformer、ELMO、GPT、Bert学习总结

NIPS2020-RelationNet++: Bridging Visual Representations for Object Detection via Transformer Decoder

【深度学习】(4) Transformer 中的 Decoder 机制，附Pytorch完整代码

基于encoder-decoder的非自回归Transformer时间序列预测Python程序

深入理解深度学习——Transformer：解码器（Decoder）部分

Dynamic MDETR: A Dynamic Multimodal Transformer Decoder for Visual Grounding 论文阅读笔记

【轴承RUL预测代码】基于完整结构Transformer（encoder+decoder）的RUL预测代码3(精华)

深入理解深度学习——Transformer：整合编码器（Encoder）和解码器Decoder）

深入理解深度学习——Transformer：解码器（Decoder）的多头注意力层（Multi-headAttention）

NLP Transformer的Decoder的输入输出都是什么？能解释一下每个部分都是什么?

Transformer

The Transformer

【transformer】

transform decoder

Causal decoder、Prefix decoder和encoder-decoder

WAS password Decoder & Encoder

websphere Decoder / Encoder

UVA - 458 The Decoder

Unified Decoder Converter 7.1

【转】WMA Lossless Decoder

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)