微软的 Orca 从 GPT-4 的复杂解释痕迹中学习，以显着增强较小的模型 - 代码天地

微软的 Orca 从 GPT-4 的复杂解释痕迹中学习，以显着增强较小的模型

业界资讯 2023-06-12 08:26:29 阅读次数: 0

在这里插入图片描述
ChatGPT 和 GPT-4 等大型基础模型 (LFM) 在广泛的任务中展示了令人印象深刻的零样本学习能力。他们的成功可以归功于模型和数据集大小的缩放，以及使它们与用户内容保持一致的微调过程。

随着这些模型继续蓬勃发展，一个有趣的问题出现了：这些模型能否在没有太多人为干预的情况下监督自己的行为或其他模型？

为了回答这个问题，大量研究涌入了使用 LFM 作为教师来生成数据集来训练较小模型的研究。然而，与他们的老师相比，生成的学生模型通常具有较差的推理和理解能力。

为了解决这个问题，在一篇新论文Orca: Progressive Learning from Complex Explanation Traces of GPT-4中，微软研究团队介绍了 Orca，这是一个学习解释轨迹的 130 亿参数模型；循序渐进的思维过程；以及来自 GPT-4 的复杂指令，这显着提高了现有最先进的指令调优模型的性能。

该团队做出了三个关键贡献，包括解释调整、扩展任务和指令以及评估，以解决指令调整模型在任务多样性、查询复杂性和数据扩展方面的当前挑战。

在这里插入图片描述
在解释调整中，研究人员从 GPT-4 中查询和响应对可以为学生模型学习提供有价值的信号。因此，他们用详细的回应来增加对，以更好地解释教师在产生回应时的推理过程。

在扩展任务和指令时，他们利用 Flan 2022 Collection 从其任务集合中采样以获得多样化的任务组合ÿ

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/131152397

微软的 Orca 从 GPT-4 的复杂解释痕迹中学习，以显着增强较小的模型

Orca：微软测试新的人工智能模型

极大提升GPT-4等模型推理效率，微软、清华开源全新框架

LLMs：《Orca: Progressive Learning from Complex Explanation Traces of GPT-4》翻译与解读

微软最新研究成果：使用GPT-4合成数据来训练AI模型，实现SOTA！

微软发布Orca2，“调教式”教会小规模大语言模型如何推理！

【GPT4】微软 GPT-4 测试报告（4）GPT4 的数学能力

【GPT4】微软 GPT-4 测试报告（3）GPT4 的编程能力

微软New Bing（GPT-4）写的Delphi诗歌

【GPT-4】GPT-4 是否已经显示出通用人工智能的迹象？——微软已经为 OpenAI 的 GPT-4 创建了一系列测试，它声称表明人工智能模型已经显示出通用智能的“火花”

【GPT4】微软 GPT-4 测试报告（7）判别能力

【GPT4】微软 GPT-4 测试报告（9）结论与展望

【GPT4】微软 GPT-4 测试报告（2）多模态与跨学科的组合

【GPT4】微软 GPT-4 测试报告（1）总体介绍

【GPT4】微软 GPT-4 测试报告（5）与外界环境的交互能力

【GPT4】微软 GPT-4 测试报告（6）与人类的交互能力

微软也搞起了开源小模型！利用OpenAI的ChatGPT和GPT-4 训练，实力碾压当前最强开源模型

如何免费使用GPT-4模型

GPT-4：新的 OpenAI 模型

GPT-4 模型详细教程

谷歌打响全面反击战！官宣AI重构搜索、新模型比肩GPT-4，朝着ChatGPT微软开炮

微软提出Control-GPT：用GPT-4实现可控文本到图像生成！

【GPT4】微软 GPT-4 测试报告（8）局限性与社会影响

微软154页论文刷屏：GPT-4能力接近人类！初版AGI就快来了...

微软推出 GPT-4 AI 驱动的Security Copilot工具，为防御者提供支持

【OpenAI 多模态预训练】VideoGPT？微软透露GPT-4或将在下周发布

微软开放搭载GPT-4全新Bing——人人皆可用，不用再排队！

GPT-4与人工智能的未来：微软CTO对话比尔·盖茨

声称或超越GPT-4！谷歌PaLM 2：全面向ChatGPT微软开炮

微软 x OpenAI 祭出杀招！GPT-4 全面进入 Windows 11

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)