UC 伯克利发布大语言模型排行榜，清华 ChatGLM 冲进前 5 - 代码天地

UC 伯克利发布大语言模型排行榜，清华 ChatGLM 冲进前 5

企业开发 2023-07-11 23:18:25 阅读次数: 0

近日，UC伯克利发起了大语言模型版排位赛，让大语言模型随机进行battle，并根据它们的Elo得分进行排名。「LLM 排位赛」就是让一群大语言模型随机进行 battle，并根据它们的 Elo 得分进行排名。

排行榜数据显示，Vicuna以1169分排名第一，Koala位列第二。这两个模型都有130亿参数。LAION的Open Assistant排在第三。

清华提出的ChatGLM，虽然只有60亿参数，但依然冲进了前五，只比130亿参数的Alpaca落后了23分。

相比之下，Meta 原版的 LLaMa 只排到了第八（倒数第二），而 Stability AI 的 StableLM 则获得了唯一的 800 + 分，排名倒数第一。

在这次的评估中，UC伯克利选择了目前比较出名的 9 个开源聊天机器人。

每次 1v1 对战，系统都会随机拉两个上场 PK。用户则需要同时和这两个机器人聊天，然后决定哪个聊天机器人聊的更好。

这个排位赛可以让人们更好地了解各个聊天机器人的表现，同时也能促进大语言模型的发展。该排位赛会把国内和国外的这些「闭源」模型都搞进来。目前，所有的评估代码以及数据分析均已公布。

猜你喜欢

转载自blog.csdn.net/haisendashuju/article/details/130859176

UC 伯克利发布大语言模型排行榜，清华 ChatGLM 冲进前 5

UC伯克利发布大语言模型排行榜！Vicuna夺冠，清华ChatGLM进前5

【ChatGPT】大语言模型排行榜：Vicuna 夺冠，清华 ChatGLM 进前五

TIOBE 5月编程语言排行榜：C#最受欢迎，C++即将冲进前三

谷歌PaLM 2弱爆：LLM大排名屈居第六，准中文倒数第二｜UC伯克利排行榜新鲜榜出炉...

RedMonk 2020 年 Q1 编程语言排行：Python 冲进前二，Dart 值得关注

TIOBE 发布 3 月编程语言榜单：Go 冲进前十，Delphi 没落

UC伯克利LLM排行榜（Chatbot Arena Leaderboard）再更新！GPT-4稳居第一，Vicuna-33B登顶开源模型第一

130亿参数，8个A100训练，UC伯克利发布对话模型Koala

用语言建模世界！UC伯克利多模态世界模型利用语言预测未来

强化学习与视觉语言模型之间的碰撞，UC伯克利提出语言奖励调节LAMP框架

【ChatGLM】大模型之 ChatGLM 部署

【ChatGLM】大模型之 ChatGLM 微调

计算机视觉GPT时刻！UC伯克利三巨头祭出首个纯CV大模型，推理惊现AGI火花

清华 chatglm 本地部署

ChatGLM模型部署分享

ChatGLM

CoinTime×UC伯克利：走进美国高校 “区块链之门” 即将开启

UC伯克利计算机系是如何培养计算机人才的？

行业现状令人失望，工作之后我又回到UC伯克利读博了

开源“模仿”ChatGPT，居然效果行？UC伯克利论文，劝退，还是前进？

实时追踪科研动态丨UC伯克利、谷歌、微软等机构精选新论文

自学大语言模型之ChatGLM(一)

记录部署ChatGLM大语言模型过程

UC伯克利发布一个低成本家居机器人，会叠衣服、会泡咖啡

UC伯克利 NIPS2018 Spotlight论文：依靠视觉想象力的多任务强化学习

【大模型】chatglm-6b的demo

ChatGLM 大模型应用构建 & Prompt 工程

大模型lora微调-chatglm2

【ChatGLM-6B】清华开源的消费级显卡大语言模型，本地部署与测试

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)