读懂ChatGPT需要掌握哪些知识

ChatGPT的知识主要涉及自然语言处理和强化学习。自然语言处理的历史发展脉络是从词向量到RNN、注意力、Transformer、GPT、ChatGPT等。

第一章自然语言处理概述

1.1.什么是自然语言处理
人工智能一个重要分支
1.1.1.机器学习、人工智能
1.1.2.自然语言处理
1.2.自然语言处理应用场景
1.2.1.文本分类与分析
1.2.2.翻译
1.2.3.智能问答
1.3.自然语言处理发展历程
1.3.1.深度学习之前
统计语言模型、TF-IDF
1.3.2.深度学习时代
从词向量到RNN、注意力、Transformer、GPT、ChatGPT。
1.4.自然语言处理流水线
1.4.1.数据预处理
1.4.2.构建模型
1.4.3.实验评估
1.5.小结

第二章词向量

2.1.构建词汇表
2.2.Token
2.3.词的One-hot表示
2.4.词的向量表示（Embedding）
2.5.小结

第三章初识自然语言处理神经网络

3.1.一个NLP神经网络例子
3.1.1.如何进行文本分类
先来一个简单的文本分类神经网络例子。词向量输入分类函数。
3.1.2.分类函数
单分类、多分类。
3.2.神经网络
3.2.1.神经网络概述
3.2.2.目标函数
3.2.3.神经元
3.2.4.梯度
梯度消失（gradient vanishing）和梯度爆炸（gradient explosion）
3.2.5.反向传播
3.2.6.训练、验证与预测
3.3.小结

第四章自然语言处理的训练方法

4.1.监督学习
4.2.非监督学习
Zero-Shot
4.3.半监督学习
Few-Shot (FS)、One-Shot (1S)、
4.3.1.预训练
4.3.2.微调
4.4.小结

第五章循环神经网络

5.1.RNN
5.1.1.RNN简介
5.1.2.LSTM简介
遗忘门、更新门、输出门
5.1.3.GRU简介
5.1.4.使用RNN进行文本分类
文本分类
5.2.5.2 seq2seq模型
5.2.1.seq2seq模型概述
5.2.2.编码器Encoder

5.2.3.解码器Decoder
5.2.4.智能问答：seq2seq例子
5.3.5.3 小结

第六章注意力机制的兴起

6.1.注意力机制
6.1.1.注意力机制的起源
6.1.2.注意力机制的原理
6.1.3.注意力机制的好处
6.2.seq2seq与注意力机制的结合
6.2.1.RNNsearch
6.2.2.全局注意力与局部注意力
6.3.智能问答：seq2seq与注意力机制的例子
6.4.小结

第七章纯注意力模型Transformer

7.1.Transformer整体结构
7.2.自注意力机制
7.3.多头注意力机制
7.4.位置编码
7.5.Decoder
7.6.Encoder
7.7.智能问答：Transformer例子
7.8.小结

第八章 GPT

8.1.GPT-1
8.1.1.GPT-1模型结构
8.1.2.预训练阶段
8.1.3.微调阶段
8.1.4.训练资源与时间
8.1.5.使用GPT-1进行智能问答
8.2.GPT-2
8.2.1.GPT-2与GPT-1的差异
8.2.2.训练资源与时间

8.3.GPT-3
8.3.1.GPT-3概述
8.3.2.Few-Shot (FS)
8.3.3.One-Shot (1S)
8.3.4.Zero-Shot
8.3.5.训练资源与时间

8.4.GPT-3.5
8.4.1.GPT-3.5概述
8.4.2.GPT-3.5的写代码能力
8.5.GPT的竞争对手
8.5.1.AR与AE模型
8.5.2.BERT系列模型
Autoregressive（AR）语音模型和Autoencoding（AE）

8.6.小结

第九章强化学习

9.1.强化学习概述
9.1.1.强化学习基本概念
9.1.2.强化学习都有哪些
9.1.3.基于策略的强化学习
9.1.4.基于价值的强化学习
9.1.5.演员-评论家的强化学习

9.2.ChatGPT中的强化学习
ChatGPT使用的强化学习方法是PPO，同时PPO目前也是OpenAI团队默认的强化学习方法。从基于策略的方法发展出了TRPO算法，接着是PPO算法。

9.2.1.TRPO算法

9.2.2.PPO算法
OpenAI 默认的强化学习算法

9.3.强化学习应用于智能问答

第十章 InstructGPT

10.1.InstructGPT模型基本结构
10.2.InstructGPT的监督预训练
10.3.InstructGPT的奖励模型
10.4.InstructGPT的强化学习
10.5.InstructGPT训练资源与时间

10.6.InstructGPT实验结果
10.7.小结

第十一章 ChatGPT

11.1.ChatGPT与InstructGPT差异
11.2.ChatGPT的优势
11.3.ChatGPT的不足
11.4.ChatGPT体验
11.5.ChatGPT的应用场景
11.6.ChatGPT的未来发展
11.7.小结