认识Transformer：入门知识 - 代码天地

认识Transformer：入门知识

业界资讯 2023-08-26 02:59:44 阅读次数: 0

视频链接：
https://www.youtube.com/watch?v=ugWDIIOHtPA&list=PLJV_el3uVTsOK_ZK5L0Iv_EQoL1JefRL4&index=60

文章目录

Seq2Seq

RNN不容易被平行化
提出用CNN来代替RNN，CNN 可以平行化，但是需要的层数比较深，才能看完所有的输入内容。

Self-Attention layer

在这里插入图片描述
b1 到b4 是可以同时被算出。
可以用来取代RNN。

来源： Attention is all you need

在这里插入图片描述
然后用每一个a 去对每个k 做attention

在这里插入图片描述

加速的矩阵乘法过程

Multi-head self-attention

不同的head 可以关注不同的内容，达到一个更好的注意力效果。
在这里插入图片描述

Positional encoding

self-attention 没有考虑位置信息。
因此需要再ai的同时加ei，表示位置信息，有人工控制。

在这里插入图片描述

Seq2Seq with Attention

在这里插入图片描述

Transformer

在这里插入图片描述

在这里插入图片描述

Universal Transformer

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/NGUever15/article/details/132279424

认识Transformer：入门知识

Transformer初步认识

java入门基础知识的认识

Transformer知识点

【小知识】git 工具入门一，认识git工具

【学习】从零入门Transformer

深度学习入门Transformer

transformer入门例子

Transformer怎么入门？如何学习Transformer？

ViT（Vision Transformer）算法入门

TrOCR – 基于 Transformer 的 OCR 入门

Transformer详解一：transformer的由来和先导知识

认识Ubuntu及相关知识

认识Gradle知识

ui设计入门基础知识之图片格式认识

ui入门基础知识：像素和分辨率的认识

认识forsage佛萨奇智能合约, 先学习区块链入门知识, 小白必看

MongoDB 认识与入门

python入门—认识

Nginx认识入门

认识Dubbo，快速入门

Maven 入门 01 -认识

C++ - -入门认识

Vue入门-认识Vue

MyBatis简单认识(入门)

初级入门 --- 认识 WebGL

量化交易----入门认识

认识DataX及简单入门

React入门-认识React

Transformer

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)