ChatGPT技术基石之Transformer技术的简介（简单易懂）

企业开发 2023-04-06 17:57:45 阅读次数: 0

作为当下最先进的深度学习架构之一，Transformer被广泛应用于自然语言处理领域，它不但替代了以前流行的循环神经网络RNN和长短期记忆网络LSTM，并且以它为基础衍生出了诸如BERT、GPT-3、T5等著名架构，下面对它的原理进行讲解

Transformer简介

循环神经网络和长短期记忆网络已经广泛应用于时序任务，比如文本预测，机器翻译，文章生成等等，然而它们面临的一大问题就是如何记录长期依赖

为了解决这个问题，一个名为Transformer的新架构应运而生，从那以后，Transformer被应用到多个自然语言处理方向，到目前位置还未有新的架构能够将其替代，可以说它的出现是自然语言处理领域的突破，并为新的革命性架构打下了理论基础

Transformer完全依赖于注意力机制，并摒弃了循环，它使用的是一种特殊的注意力机制，称为自注意力

让我们通过一个文本翻译实例来了解Transformer是如何工作的，Transformer由编码器和解码器两部分组成，首先向编码器输入一句话，让其学习这句话的特征（特征可以有多种表示形式，它既可以为单一数值，也可以为向量或者矩阵）再将特征作为输入传输给解码器，最后此特出会通过解码器生成输出句子

假设我们需要将一个句子从英文翻译为法文，如下图所示，首先我们需要将这个英文句子输入进去编码器，编码器将提取英文句子的特征并提供给解码器，最后解码器通过特征完成法文句子的翻译

创作不易觉得有帮助请点赞关注收藏~~~

猜你喜欢

转载自blog.csdn.net/jiebaoshayebuhui/article/details/129740360

ChatGPT技术基石之Transformer技术的简介（简单易懂）

【EasyPoi】Excel导入导出技术，简单易懂

【GPT】你需要了解的 ChatGPT的技术原理- Transformer架构及NLP技术演进

Transformer模型技术长文

火遍全球的ChatGPT技术简介与主干网络代码

ChatGPT 原理与核心技术介绍（自然语言处理NLP的发展与Transformer的概念）

通俗易懂的Docker容器技术简单解释

Servlet技术简介以及简单实践

Docker简介与简单使用 | 技术头条

通俗易懂的ChatGPT的原理简介

NLP：Transformer在NLP自然语言领域的简介(预训练技术)、NLP模型发展(ELmo/GPT/BERT/MT-DNN/XLNet/RoBERTa/ALBERT)、经典案例之详细攻略

编译技术之简单了解

(12)虚拟化技术之虚拟化技术简介

ChatGPT技术介绍

ChatGPT的技术路线

ChatGPT技术链

ChatGPT的技术体系总结

ChatGPT发展与技术基础

了解ChatGPT的技术原理

ChatGPT安全技术

ChatGPT技术原理

ChatGPT技术解构

虚拟化技术之Docker简介

IPFS未来区块世界的技术基石

搞懂容器技术的基石： namespace （上）

彻底搞懂容器技术的基石： namespace （下）

【原创】理解ChatGPT之Transformer工作原理

高并发基石|深入理解IO复用技术之epoll

《论文阅读》ChatGPT相关技术之思维链（CoT in LLMs）

AIGC：ColossalChat(基于LLM和RLHF技术的类似ChatGPT的聊天机器人)的简介、安装、使用方法之详细攻略

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)