Orca:微软测试新的人工智能模型

几周前,微软研究院发布了一篇题为Orca: Progressive Learning from Complex Explanation Traces of GPT-4 的论文。该论文描述了一种新的人工智能模型的开发,旨在解决具有挑战性的问题并向人类解释其推理过程。我发现这篇论文最有趣的是对案例研究的描述,这些案例研究比较了四种人工智能模型在响应要求解决的问题时的性能。论文中描述了其中十二个实验。

研究人员表示,Orca 是一个拥有 130 亿个参数的模型,可以处理多样化且具有挑战性的任务,并向人类解释其推理过程。它使用解释轨迹作为学习材料,并利用名为 Flan 2022 的海量集合(包含 1,000 多个任务和 10,000 条指令)来获取复杂的任务。在论文描述的实验中,Orca 在大多数领域都比其他开源模型表现良好,并且在自然语言推理和图像字幕等任务中与 GPT-4 相匹配。这可能证明基于解释的学习的潜力。

测试

在测试中,研究人员将 Orca 与以下 AI 模型进行了比较:

Text-Davinci-003:它是一个功能强大的模型,旨在以更好的质量、更长的输出和多种语言一致的指令遵循来完成语言任务。

ChatGPT:最强大的 GPT-3.5 模型以及 text-davinci-003 的改进。它针对聊天进行了优化,并使用与人类的对话进行训练。

GPT-4:GPT 系列的最新型号,在各种专业和学术基准上展现出人类水平的表现。它针对聊天进行了优化,可以执行更复杂的任务。

Vicuna:一种开源聊天机器人,通过对从 ShareGPT 收集的用户共享对话进行微调 LLaMA 进行训练。它已成为领先的开源语言模型。

实验结果

三角问题求解 —已知直角三角

猜你喜欢

转载自blog.csdn.net/iCloudEnd/article/details/131372231