人工智能 LLM 革命前夜：一文读懂ChatGPT缘起的自然语言处理模型Transformer - 代码天地

人工智能 LLM 革命前夜：一文读懂ChatGPT缘起的自然语言处理模型Transformer

业界资讯 2023-08-06 19:16:32 阅读次数: 0

作者：钟超阿里集团大淘宝团队

[01] https://web.stanford.edu/~jurafsky/slp3/3.pdf

[02] https://ai.googleblog.com/2017/08/transformer-novel-neural-network.html

[03] 《自然语言处理：基于预训练模型的方法》车万翔等著

[04] https://cs.stanford.edu/people/karpathy/convnetjs/

[05] https://arxiv.org/abs/1706.03762

[06] https://arxiv.org/abs/1512.03385

[07] https://github.com/Kyubyong/transformer/

[08] http://jalammar.github.io/illustrated-transformer/

[09] https://towardsdatascience.com/this-is-how-to-train-better-transformer-models-d54191299978

[10] 《自然语言处理实战：预训练模型应用及其产品化》安库·A·帕特尔等著

[11] https://lilianweng.github.io/posts/2018-06-24-attention/

[12] https://github.com/lilianweng/transformer-tensorflow/

[13] 《基于深度学习的道路短期交通状态时空序列预测》崔建勋著

[14] https://www.zhihu.com/question/325839123

[15] https://luweikxy.gitbook.io/machine-learning-notes/self-attention-and-transformer

[16] 《Python 深度学习（第 2 版）》弗朗索瓦·肖莱著

[17] https://en.wikipedia.org/wiki/Attention_(machine_learning)

[18] https://zhuanlan.zhihu.com/p/410776234

[19] https://www.tensorflow.org/tensorboard/get_started

[20] https://paperswithcode.com/method/multi-head-attention

[21] https://zhuanlan.zhihu.com/p/48508221

[22] https://www.joshbelanich.com/self-attention-layer/

[23] https://learning.rasa.com/transformers/kvq/

[24] http://deeplearning.stanford.edu/tutorial/supervised/ConvolutionalNeuralNetwork/

[25] https://zhuanlan.zhihu.com/p/352898810

[26] https://towardsdatascience.com/beautifully-illustrated-nlp-models-from-rnn-to-transformer-80d69faf2109

[27] https://medium.com/analytics-vidhya/understanding-q-k-v-in-transformer-self-attention-9a5eddaa5960

猜你喜欢

转载自blog.csdn.net/AlibabaTech1024/article/details/129057732

人工智能 LLM 革命前夜：一文读懂ChatGPT缘起的自然语言处理模型Transformer

人工智能 LLM 革命前夜：一文读懂横扫自然语言处理的 Transformer 模型

【AI人工智能】NLP（自然语言处理）和 LLM（大语言模型）详细对比

【人工智能】LLM 大型语言模型和 Transformer 架构简介

【AI人工智能】LLM 开源中文大语言模型集合

人工智能的新篇章：深入了解大型语言模型(LLM)的应用与前景

【人工智能】大模型LLM技术生态全景图 | The Foundation Large Language Model (LLM) & Tooling Landscape

人工智能LLM模型：奖励模型的训练、PPO 强化学习的训练、RLHF

100个人工智能 LLM 大模型基础术语

【人工智能】浅谈LLM大模型对程序员的冲击和影响

【人工智能】大模型（LLM）与人类大脑的结构及运行机制的关系

人工智能海洋中的塞壬之歌：大型语言模型LLM中的幻觉研究综述（一）

硬核课程全网首发！高级人工智能：多模态大模型LLM与AIGC前沿技术实战

人工智能大模型（LLM）的核心能力、具体的应用场景和具体的落地步骤

人工智能-自然语言处理

一文读懂人工智能

【人工智能】GPT-4 的使用成本，竟然是GPT-3.5的50倍之多 —— 大语言模型（LLM）开发者必须知道的数字

人工智能-算法篇50篇-自然语言处理之Transformer模型学习

人工智能大模型 LLM 赋能的研发效能：探索AI大模型+软件开发新工序的各种可能性

【人工智能】LLM大模型中的词嵌入和上下文理解技术实例讲解，附具体的代码例子

【人工智能】如何基于向量数据库+LLM（大语言模型），打造更懂你的企业专属Chatbot？—— AnalyticDB(ADB)+LLM：构建AIGC时代下企业专属 Chatbot

人工智能革命(1)

浅谈ChatGPT（人工智能）

人工智能——语音处理

从大型语言模型LLM走向人工通用智能AGI的改进方向（public）

简述人工智能（一）

人工智能-实验一

自然语言处理技术：让人工智能“听懂人话”

人工智能-自然语言处理-知识解构

【人工智能】深度学习与自然语言处理

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)