GPT实战系列-探究GPT等大模型的文本生成 - 代码天地

GPT实战系列-探究GPT等大模型的文本生成

业界资讯 2024-01-08 22:54:08 阅读次数: 0

GPT实战系列-探究GPT等LLM文本生成

GPT专栏文章：

GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客

GPT实战系列-GPT训练的Pretraining，SFT，Reward Modeling，RLHF-CSDN博客

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

LLM文字创作与人类有什么不同？

人类是如何进行文字创作的？一个有趣的例子就是：写文章。大致有思考兴趣点，构思，篇章与逻辑整理，落笔，修改等过程。过程中一步接一步思考，甚至借用外部工具，搜索资料，计算，验证等过程。回答问题，说话之前往往也会再三思考。
LLM语言模型生成文本的方式，依据上下文条件，逐步生成下一个 token，每个 token 计算时间一样，不确定生成的正确性。缺乏前后思考。

思考链（Chain of thought，CoT）

需要推理的任务可以使用 CoT，构造一种思考范式，指明文本生成方向，划分槽位，transformer 需要更多上下文来思考。以 few-shot prompt 为例，让模型以 step-by-step 方式生成。目前也有 zero-shot-CoT，最经典的方式就是使用 Let’s think step by step 作为提示词。

一致性（self-consistency）

一致性，有时候生成也会掉到坑里，出不来。比如 transformer 在采样到一个不好的 token 后就很难恢复。

反省（Ask for reflection）

通过灵魂拷问，问 “你完成任务了吗？” 这个问题，让 ChatGPT 对不好的问题进行反思并生成更好的回复。

思考系统2

在《快思考，慢思考》中提到有快思考系统和慢思考系统，Tree of Thoughts（思考树）：建议为给定的 prompt 生成多个思路，然后对它们进行评分，并保留好的思路。

扩展LLM能力

代理Chains/Agents

React：将任务分解成一系列思考、行动、观察、思考、行动、观察的过程，通过思考来进行问题回复，过程中允许调用外部工具完成任务，比如 google 搜索 API。

使用工具 ( Plugins)

为 ChatGPT，等LLM大模型提供计算器、代码解释器、搜索等工具，协助做 LLM 不擅长的任务。需要调用外部工具的地方需要人为标注出来。

基于检索增强 LLM 能力

获取相关文档，将文档分为块，提取得到数据的 embedding 向量，存储到向量库中。
在测试时，查询向量存储，获取与相关的文档，获得搜索结果。

约束提示（Constrained prompting）

在 LLM 的输出中强制使用特定格式生成的技术。比如，让 LLM 填写一个 json 模板中的内容，其中 json 的 key 是写死的，LLM 负责填补一些空白的 key，这些 key 可以提前进行一些约束，让 LLM 的采样空间受到限制，即能让 LLM 的输出符合预设定的格式。

点个赞点个赞点个赞

觉得有用 收藏收藏收藏

End

GPT专栏文章：

GPT实战系列-Baichuan2等大模型的计算精度与量化-CSDN博客

GPT实战系列-GPT训练的Pretraining，SFT，Reward Modeling，RLHF-CSDN博客

扫描二维码关注公众号，回复： 17344329 查看本文章

GPT实战系列-GPT训练的Pretraining，SFT，Reward Modeling，RLHF

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(二)

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(一)

GPT实战系列-ChatGLM3本地部署CUDA11+1080Ti+显卡24G实战方案

GPT实战系列-ChatGLM2模型的微调训练参数解读

GPT实战系列-如何用自己数据微调ChatGLM2模型训练

GPT实战系列-ChatGLM2部署Ubuntu+Cuda11+显存24G实战方案

GPT实战系列-Baichuan2本地化部署实战方案

决策引擎专栏：
Falcon构建轻量级的REST API服务

决策引擎-利用Drools实现简单防火墙策略

猜你喜欢

转载自blog.csdn.net/Alex_StarSky/article/details/83933148

GPT实战系列-探究GPT等大模型的文本生成

GPT从入门到精通之如何使用 GPT 模型进行文本生成

GPT 内部 — I ：了解文本生成

【GPT】文本生成任务（生成摘要、文本纠错、机器翻译等的模型微调）

基于单机最高能效270亿参数GPT模型的文本生成与理解

使用Paddle2.0构建一个经典的文本生成模型GPT-2

GPT实战系列-大话LLM大模型训练

gpt2中文训练教程-gpt2文本生成

使用深度学习模型创作动漫故事，比较LSTM和GPT2的文本生成方法

AI大模型应用入门实战与进阶：GPT系列模型的应用与创新

文本生成模型-适用场景：小模型【（GPT-1、Bart、T5）用于有数据集且要求精度较高，先微调再推理】、大模型【（GPT-3、中文PLUG、Palm、OPT用于多生成任务场景，且没有数据或少数据）】

自然语言处理实战9-大语言模型的训练与文本生成过程

GPT系列模型

GPT实战系列-Baichuan2等大模型的计算精度与量化

GPT2中文文本生成对话应用尝试

学习如何使用GPT2进行文本生成（torch+transformers）

国内版ChatGPT来临：一步体验基于GPT的文本生成技术

基于GPT-2的新闻文本生成——News Creator，使用MindSpore实现

【LLM系列之GPT】GPT（Generative Pre-trained Transformer）生成式预训练模型

大模型、AI大模型、GPT模型

textgenrnn 文本生成实战

探索aitextgen: 利用Python, PyTorch和Hugging Face实现基于OpenAI GPT-2及EleutherAI GPT Neo的高效文本生成技术指南

GPT实战系列-大模型为我所用之借用ChatGLM3构建查询助手

chatgpt3中文辅助写作-gpt2中文文本生成

中文版GPT3——CPM(2.6B)微调长短文本生成(对应小说歌词)

GPT实战系列-GPT训练的Pretraining，SFT，Reward Modeling，RLHF

T5或GPT等生成模型，如何计算模型输出特定文本的概率？

GPT大语言模型引爆强化学习与语言生成模型的热潮、带你了解RLHF。

keras实战教程三(文本生成)

RLHF文本生成图模型

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)