ChatGPT 精简总结：Chat Generative Pre-trained Transformer - 代码天地

ChatGPT 精简总结：Chat Generative Pre-trained Transformer

其他 2023-07-21 01:37:29 阅读次数: 0

⭐ ChatGPT其实用的方法和InstructGPT一样，不同的是数据集和应用场景。

InstructGPT的训练目标是根据给定的指令生成满足条件的内容。在训练时，InstructGPT使用了带有指令或约束条件的数据来训练模型（指令微调SFT，奖励模型RM，强化学习PPO）。因此，InstructGPT主要用于生成满足特定要求的文本，例如生成问题答案、摘要、代码等。
ChatGPT的训练目标则是生成自然流畅的对话，使得机器可以与人类进行自然的对话交互。在训练时，ChatGPT使用了大规模的对话数据来训练模型（指令微调SFT，奖励模型RM，强化学习PPO），以便使其能够理解自然语言的语法、语义和上下文信息，从而能够生成自然流畅的对话。因此，ChatGPT主要用于生成对话，例如与聊天机器人。
因此，虽然InstructGPT和ChatGPT都是基于GPT模型的语言生成模型，但它们的训练数据和应用场景有所不同，主要是根据不同的输入数据进行训练，生成的输出结果也有所不同。
InstructGPT精简总结：点击进入

⭐ 动机：

在GPT-1/2/3中，他们的主要任务还是续写即文字接龙，不太擅长与听你指令干活。比如，你输入“给我写一份方案”，GPT很可能输出的是“主题是关于如何入门深度学习”，而不是给你生成出一份方案。
和Instruct-GPT类似，ChatGPT也是为了解决这个问题，但因为场景是对话，所以使用了大规模的对话数据来训练模型（指令微调SFT，奖励模型RM，强化学习PPO）。

猜你喜欢

转载自blog.csdn.net/weixin_43646592/article/details/130864377

ChatGPT 精简总结：Chat Generative Pre-trained Transformer

chatGTP的全称Chat Generative Pre-trained Transformer

springboot整合Chat Generative Pre-trained Transformer

BioGPT: generative pre-trained transformer for biomedical text generation and mining

《BioGPT: Generative Pre-trained Transformer for Biomedical Text Generation and Mining》 ---- 译文与PPT解释

【LLM系列之GPT】GPT（Generative Pre-trained Transformer）生成式预训练模型

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：基础知识

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：在不同任务中使用GPT

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：GPT-3与Few-shot Learning

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：GPT-2与Zero-shot Learning

超分算法IPT：Pre-Trained Image Processing Transformer

CPM:A large-scale generative chinese pre-trained lanuage model

【自监督论文阅读笔记】Integrally Pre-Trained Transformer Pyramid Networks （2022）

pre-trained的理解

论文阅读9-Fine-tuning Pre-Trained Transformer Language Models to(远程监督关系抽取,ACL2019,GPT,长尾关系,DISTRE）

Pre-trained ViT 合集

Pre-trained models fo HumanPose Estiamtion

ChatGPT1论文解读《Improving Language Understanding by Generative Pre-Training》

关于对pre-trained模型的使用和理解

Using pre-trained word embeddings in a Keras model

Pre-trained Convolutional Neural Network学习笔记

论文阅读 | Pre-trained Models for Natural Language Processing: A Survey

Pre-trained Models for Natural Language Processing: A Survey

ChatGPT 的组件：Transformer 模型结构

transformer总结

Transformer：让ChatGPT站在肩膀上的巨人？

【原创】理解ChatGPT之Transformer工作原理

RGB-D object recognition and pose estimation based on pre-trained convolutional neural network 阅读记录

Darknet: Open Source Neural Networks in C - Classifying With Pre-Trained Models

深度学习之---为什么pre-trained会起作用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)