微软推出小模型 Phi-2，性能优于 Llama 2/Mistral 7B - 代码天地

微软推出小模型 Phi-2，性能优于 Llama 2/Mistral 7B

业界资讯 2023-12-13 17:04:36 阅读次数: 0

微软宣布推出一个 27 亿参数的语言模型 Phi-2，并声称其性能可与大 25 倍的模型相匹配或优于。“展示了出色的推理和语言理解能力，展示了参数少于 130 亿的基础语言模型中最先进的性能。”

其基准测试结果表明，只需 27 亿个参数，Phi-2 就能在各种综合基准测试中超越 Mistral 和 Llama-2 模型在 7B 和 13B 参数下的性能。与大 25 倍的 Llama-2-70B 模型相比，Phi-2 在多步推理任务（即编码和数学）上实现了更好的性能。

此外，Phi-2 的性能与最近发布的 Google Gemini Nano 2 不相上下，甚至更胜一筹。

且与经过调整的现有开源模型相比，Phi-2 响应中的“毒性”和偏差也要更少。

此前，谷歌发布的 Gemini 演示视频曾展示了其解决复杂物理问题，以及对学生进行纠错的能力。微软研究人员也将 Phi-2 进行了同样的测试，并表示它同样能够正确回答问题，和使用相同的提示纠错。

Phi-2 是微软“小语言模型（SLM）”系列中的最新版本。第一个版本是拥有 13 亿参数的 Phi-1，针对基本的 Python 编码任务进行了微调。9 月，该公司将重点扩展到常识推理和语言理解，推出了一个新的 13 亿参数模型 Phi-1.5，性能可与大 5 倍的模型相媲美。

微软表示，Phi-2 的效率使其成为想要探索增强人工智能安全性、可解释性和语言模型道德发展等领域的研究人员的理想平台。目前，Phi-2 现已通过 Microsoft Azure AI Studio 的模型目录发布。

更多详情可查看官方博客。

猜你喜欢

转载自www.oschina.net/news/270831/microsoft-phi-2-small-language-model

微软推出小模型 Phi-2，性能优于 Llama 2/Mistral 7B

微软Phi-2震撼发布：27亿参数，性能超越Mistral、Llama-2

Mistral 7B 大型语言模型 — 小而强大（比 LLAMA2 13B 更好！）探索 Mistral 7B LLM 独特的架构以及 GGLU(CPU) 和 GPU 版本无与伦比的性能

打起来了~ 最小SOTA模型：Mistral 7B，各方面碾压LLaMA2 13B和LLaMA1 34B

超越边界：Mistral 7B挑战AI新标准，全面超越Llama 2 13B

Mistral AI 发布 73 亿参数模型，“碾压” Llama 2 13B

微调 Llama-2 7B 模型以生成 Python 代码有关如何使用 PEFT、QLoRa 和 Huggingface 实用程序微调新 Llama-2 的演示

只有27亿参数，性能却高25倍！微软发布Phi-2

通用多模态工具LLaMA-Adapter，微调7B模型只用单GPU！

如何使用LoRA和PEFT微调 Mistral 7B 模型

Mistral AI发布一个拥有 73 亿参数模型Mistral 7B

llama2模型下载

只有 27 亿参数，微软发布全新 Phi-2 模型！

LLaMA：7B参数量的Baby版ChatGPT窥探

基于Llama2模型的开源模型

七月论文审稿GPT第2版：从Meta Nougat、GPT4审稿到Mistral、LongLora Llama

Llama 2：开源语言模型的未来

[NLP]llama2模型下载地址

Llama 2｜Meta开源语言模型

一文就懂大语言模型Llama2 7B+中文alpace模型本地部署

LLaMa2

Llama2~baby

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

阿里云通义千问14B模型开源！性能超越Llama2等同等尺寸模型

Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型

Danswer 接入 Llama 2 模型｜免费在 Google Colab 上托管 Llama 2 API

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

llama.cpp LLM模型 windows cpu安装部署；运行LLaMA2模型测试

Meta 开源基于 Llama 2 的 AI 代码生成大模型：Code Llama

Code Llama 是Meta 开源基于 Llama 2 的 AI 代码生成大模型

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)