大规模语言模型从理论到实践:模型基础、数据、强化学习、应用、评估

 推荐张奇、桂韬、郑锐、⻩萱菁合著的一本讲述大模型从理论到实践的书。关注公众号,可领取电子版。

89d3cfedbb27322c217b85104e7c6385.png

全书目录

1 绪论

    1.1 大规模语言模型基本概念

    1.2 大规模语言模型发展历程 

    1.3 大规模语言模型构建流程

    1.4 本书的内容安排

2 大语言模型基础

    2.1 Transformer 模型

    2.2 生成式预训练语言模型 GPT

    2.3 大语言模型结构

3 语言模型训练数据

    3.1 数据来源

    3.2 数据处理

    3.3 数据影响分析

    3.4 开源数据集合

4 分布式训练

    4.1 分布式训练概述

    4.2 分布式训练并行策略

    4.3 分布式训练的集群架构

    4.4 DeepSpeed 实践

5 有监督微调

    5.1 提示学习和语境学习

    5.2 高效模型微调

    5.3 模型上下文窗口扩展

    5.4 指令数据构建

    5.5 Deepspeed-Chat SFT 实践

6 强化学习

    6.1 基于人类反馈的强化学习

    6.2 奖励模型

    6.3 近端策略优化

    6.4 MOSS-RLHF 实践

7 大语言模型应用

    7.1 推理规划

    7.2 综合应用框架

    7.3 智能代理

    7.4 多模态大模型

    7.5 大语言模型推理优化

8 大语言模型评估

    8.1 模型评估概述

    8.2 大语言模型评估体系

    8.3 大语言模型评估方法

    8.4 大语言模型评估实践

电子书领取:关注公众号,自动回复“AI学习资料”网盘地址,进入“1.入门必读”目录,下载《大规模语言模型-从理论到实践-张奇-LLM-TAP.pdf》。

阅读推荐:

AI技术的思考与实践:AI大模型、技术细节、应用发展

AI大模型LLM可以帮助企业做什么?

推荐一个金融分析的开源大模型项目FinGLM

逆转诅咒|大模型的最大BUG!A=B 训练的大模型LLM无法学会 B=A?国内模型说可以

万字长文带你全面解读视觉大模型

拥抱未来,学习 AI 技能!关注我,免费领取 AI 学习资源。

猜你喜欢

转载自blog.csdn.net/fogdragon/article/details/133565322