大规模语言模型从理论到实践：模型基础、数据、强化学习、应用、评估 - 代码天地

大规模语言模型从理论到实践：模型基础、数据、强化学习、应用、评估

业界资讯 2023-10-05 03:43:53 阅读次数: 0

“ 推荐张奇、桂韬、郑锐、⻩萱菁合著的一本讲述大模型从理论到实践的书。关注公众号，可领取电子版。”

全书目录

1 绪论

1.1 大规模语言模型基本概念

1.2 大规模语言模型发展历程

1.3 大规模语言模型构建流程

1.4 本书的内容安排

2 大语言模型基础

2.1 Transformer 模型

2.2 生成式预训练语言模型 GPT

2.3 大语言模型结构

3 语言模型训练数据

3.1 数据来源

3.2 数据处理

3.3 数据影响分析

3.4 开源数据集合

4 分布式训练

4.1 分布式训练概述

4.2 分布式训练并行策略

4.3 分布式训练的集群架构

4.4 DeepSpeed 实践

5 有监督微调

5.1 提示学习和语境学习

5.2 高效模型微调

5.3 模型上下文窗口扩展

5.4 指令数据构建

5.5 Deepspeed-Chat SFT 实践

6 强化学习

6.1 基于人类反馈的强化学习

6.2 奖励模型

6.3 近端策略优化

6.4 MOSS-RLHF 实践

7 大语言模型应用

7.1 推理规划

7.2 综合应用框架

7.3 智能代理

7.4 多模态大模型

7.5 大语言模型推理优化

8 大语言模型评估

8.1 模型评估概述

8.2 大语言模型评估体系

8.3 大语言模型评估方法

8.4 大语言模型评估实践

电子书领取：关注公众号，自动回复“AI学习资料”网盘地址，进入“1.入门必读”目录，下载《大规模语言模型-从理论到实践-张奇-LLM-TAP.pdf》。

阅读推荐：

AI技术的思考与实践：AI大模型、技术细节、应用发展

AI大模型LLM可以帮助企业做什么？

推荐一个金融分析的开源大模型项目FinGLM

逆转诅咒｜大模型的最大BUG！A=B 训练的大模型LLM无法学会 B=A？国内模型说可以

万字长文带你全面解读视觉大模型

拥抱未来，学习 AI 技能！关注我，免费领取 AI 学习资源。

猜你喜欢

转载自blog.csdn.net/fogdragon/article/details/133565322

大规模语言模型从理论到实践：模型基础、数据、强化学习、应用、评估

解码大语言模型奥秘：《大规模语言模型：从理论到实践》震撼上市！

ICLR2023 | PromptPG：当强化学习遇见大规模语言模型

强化学习模型

强化学习（一）模型基础

强化学习一：模型基础

模型训练基础：什么是强化学习？

人工智能大模型原理与应用实战：强化学习理论

外卖广告大规模深度学习模型工程实践

R语言 RevoScaleR的大规模数据集决策树模型应用案例

LLM 大规模语言模型综述

python深度强化学习模型的原理、应用！

模型并行 | 大规模语言模型架构 Megatron

大语言模型和大规模预训练模型的区别

GPT大语言模型引爆强化学习与语言生成模型的热潮、带你了解RLHF。

【学习】深度强化学习、模型压缩

大规模语言训练模型应用，如何让文档问答系统快速拥有“高智商”？

【ICLR2019】基于模型的深度强化学习算法框架，具有理论保证

模型剪枝在大规模数据处理中的应用：让数据处理更高效

《强化学习》模型无关方法

基于世界模型的深度强化学习

强化学习的N臂匪徒模型

强化学习：基于模型的动态规划

强化学习中的无模型预测

强化学习中的无模型控制

强化学习模型研讨班

MBRL基于模型的强化学习

大模型强化学习：RLHF、PPO

强化学习（二）马尔科夫决策过程(MDP) 强化学习（一）模型基础

【转载】强化学习（二）马尔科夫决策过程(MDP) 强化学习（一）模型基础

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)