读懂ChatGPT需要掌握哪些知识

ChatGPT的知识主要涉及自然语言处理和强化学习。自然语言处理的历史发展脉络是从词向量到RNN、注意力、Transformer、GPT、ChatGPT等。

第一章 自然语言处理概述

1.1.什么是自然语言处理
人工智能一个重要分支
1.1.1.机器学习、人工智能
1.1.2.自然语言处理
1.2.自然语言处理应用场景
1.2.1.文本分类与分析
1.2.2.翻译
1.2.3.智能问答
1.3.自然语言处理发展历程
1.3.1.深度学习之前
统计语言模型、TF-IDF
1.3.2.深度学习时代
从词向量到RNN、注意力、Transformer、GPT、ChatGPT。
1.4.自然语言处理流水线
1.4.1.数据预处理
1.4.2.构建模型
1.4.3.实验评估
1.5.小结

第二章 词向量

2.1.构建词汇表
2.2.Token
2.3.词的One-hot表示
2.4.词的向量表示(Embedding)
2.5.小结

第三章 初识自然语言处理神经网络

3.1.一个NLP神经网络例子
3.1.1.如何进行文本分类
先来一个简单的文本分类神经网络例子。词向量输入分类函数。
3.1.2.分类函数
单分类、多分类。
3.2.神经网络
3.2.1.神经网络概述
3.2.2.目标函数
3.2.3.神经元
3.2.4.梯度
梯度消失(gradient vanishing)和梯度爆炸(gradient explosion)
3.2.5.反向传播
3.2.6.训练、验证与预测
3.3.小结

第四章 自然语言处理的训练方法

4.1.监督学习
4.2.非监督学习
Zero-Shot
4.3.半监督学习
Few-Shot (FS)、One-Shot (1S)、
4.3.1.预训练
4.3.2.微调
4.4.小结

第五章 循环神经网络

5.1.RNN
5.1.1.RNN简介
5.1.2.LSTM简介
遗忘门、更新门、输出门
5.1.3.GRU简介
5.1.4.使用RNN进行文本分类
文本分类
5.2.5.2 seq2seq模型
5.2.1.seq2seq模型概述
5.2.2.编码器Encoder

5.2.3.解码器Decoder
5.2.4.智能问答:seq2seq例子
5.3.5.3 小结

第六章 注意力机制的兴起

6.1.注意力机制
6.1.1.注意力机制的起源
6.1.2.注意力机制的原理
6.1.3.注意力机制的好处
6.2.seq2seq与注意力机制的结合
6.2.1.RNNsearch
6.2.2.全局注意力与局部注意力
6.3.智能问答:seq2seq与注意力机制的例子
6.4.小结

第七章 纯注意力模型Transformer

7.1.Transformer整体结构
7.2.自注意力机制
7.3.多头注意力机制
7.4.位置编码
7.5.Decoder
7.6.Encoder
7.7.智能问答:Transformer例子
7.8.小结

第八章 GPT

8.1.GPT-1
8.1.1.GPT-1模型结构
8.1.2.预训练阶段
8.1.3.微调阶段
8.1.4.训练资源与时间
8.1.5.使用GPT-1进行智能问答
8.2.GPT-2
8.2.1.GPT-2与GPT-1的差异
8.2.2.训练资源与时间

8.3.GPT-3
8.3.1.GPT-3概述
8.3.2.Few-Shot (FS)
8.3.3.One-Shot (1S)
8.3.4.Zero-Shot
8.3.5.训练资源与时间

8.4.GPT-3.5
8.4.1.GPT-3.5概述
8.4.2.GPT-3.5的写代码能力
8.5.GPT的竞争对手
8.5.1.AR与AE模型
8.5.2.BERT系列模型
Autoregressive(AR)语音模型和Autoencoding(AE)

8.6.小结

第九章 强化学习

9.1.强化学习概述
9.1.1.强化学习基本概念
9.1.2.强化学习都有哪些
9.1.3.基于策略的强化学习
9.1.4.基于价值的强化学习
9.1.5.演员-评论家的强化学习

9.2.ChatGPT中的强化学习
ChatGPT使用的强化学习方法是PPO,同时PPO目前也是OpenAI团队默认的强化学习方法。从基于策略的方法发展出了TRPO算法,接着是PPO算法。

9.2.1.TRPO算法

9.2.2.PPO算法
OpenAI 默认的强化学习算法

9.3.强化学习应用于智能问答

第十章 InstructGPT

10.1.InstructGPT模型基本结构
10.2.InstructGPT的监督预训练
10.3.InstructGPT的奖励模型
10.4.InstructGPT的强化学习
10.5.InstructGPT训练资源与时间

10.6.InstructGPT实验结果
10.7.小结

第十一章 ChatGPT

11.1.ChatGPT与InstructGPT差异
11.2.ChatGPT的优势
11.3.ChatGPT的不足
11.4.ChatGPT体验
11.5.ChatGPT的应用场景
11.6.ChatGPT的未来发展
11.7.小结

猜你喜欢

转载自blog.csdn.net/zephyr_wang/article/details/129795754