Transformer简介及架构介绍 - 代码天地

Transformer简介及架构介绍

编程语言 2023-08-15 18:27:24 阅读次数: 0

说明：部分内容来源于网络教程，如有侵权请联系本人删除相关内容。

教程链接：1.1Transformer背景介绍_哔哩哔哩_bilibili

一、优势

相比于之前介绍的RNN以及其变种LSTM和GRU，Transfomer有两个优势：

1.可以利用分布式GPU并行训练，提升训练效果

2.相比于LSTM和GRU，可以关联间隔时间更长的样本，效果更好

二、作用

基于seq2seq的Transformer模型可以完成NLP领域的典型任务。但是也可以被应用到图像识别、语音识别等领域。例如可以用CNN+Transformer进行语音识别。

三、架构

图1：Tranfomer架构

1.编码器部分

编码器部分由N个编码器层堆叠而成。每个编码器层由2个子层连接：

子层1：多头自注意力层+规范化层+残差连接

子层2：前馈全连接层+规范化层+残差连接

2.解码器部分

解码器部分由N个解码器层堆叠而成。每个解码器层由3个子层连接：

子层1：带有掩码的多头注意力层+规范化层+残差连接

子层2：多头自注意力层+规范化层+残差连接

子层3：前馈全连接层+规范化层+残差连接

猜你喜欢

转载自blog.csdn.net/APPLECHARLOTTE/article/details/127204960

Transformer简介及架构介绍

Mybatis简介及架构介绍

Transformer简介

NLP：Transformer的简介(优缺点)、架构详解之详细攻略

Transformer介绍

Transformer介绍

ELK简介以及新旧版架构介绍

transformer模型简介

NLP中的Transformer 简介

【人工智能】LLM 大型语言模型和 Transformer 架构简介

Transformer模型架构解析

Transformer架构：位置编码

【Transformer】架构解析

Transformer架构解析

Transformer 架构解释

Transformer简要介绍

Swin Transformer介绍

Transformer详细介绍

huggingface transformer模型介绍

Monarch Mixer：介绍一种性能比Transformer更强的网络架构

KubeSphere简介，功能介绍，优势，架构说明及应用场景

Helm介绍（基本使用、架构简介、Hook机制）

Doris简介、部署、功能介绍以及架构设计

GPT模型的Transformer架构:了解 Transformer 架构的详细信息

深度学习 Transformer架构解析

经典网络架构学习-Transformer

学习Transformer：整体架构与实现

Vision Transformer(VIT 网络架构)

Transformer 模型实用介绍：BERT

架构简介

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)