快手自研大模型「快意」亮相,在多个大模型榜单上表现优异

d6026fe59955c7524f1f31106ae49679.jpeg

快手大模型浮出水面。

作者 | 拉风的极客

来自 | 极客公园

进NLP群—>加入NLP交流群

近日,在多个知名大模型排行榜上,一个新面孔 KwaiYii-13B 表现亮眼,并一举跃居 CMMLU 中文向排名首位,引发了广泛关注。据极客公园了解,这是来自快手 AI 团队从零到一独立自研的大模型——「快意」(KwaiYii)。

1b38b669fdbf95b6dc31dc4fc7ec6eed.pngKwaiYii-13B 在 CMMLU 中文向排名第一

根据其 GitHub 主页介绍,「快意」是由快手 AI 团队研发的大规模语言模型,而本次引发关注的正是其新版本 KwaiYii-13B。该模型在多个 Benchmark 上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

其中,KwaiYi-13B-Base 预训练模型具备优异的通用技术底座能力,在 MMLU、CMMLU、C-Eval、HumanEval 等 Benchmark 上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。

9626944b5c227a65bcaf04e7beb0f999.png

KwaiYii-13B-Base 在 Benchmark 上的效果

而 KwaiYii-13B-Chat 对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明 KwaiYi-13B-Chat 超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近 ChatGPT(3.5) 同等水平。

8b7ce8fc45bec845e40349952794579b.png

KwaiYii-13B-Chat 在人工评测上的效果

据悉,目前「快意」已经开启内测,并为业务团队提供了标准 API 和定制化项目合作方案,以便在各种业务场景中进行测试和验证。

2e7215b28a2364f676881db710de8783.png正在内测的「快意」对话平台

一直以来,快手 AI 团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022 年至今,快手 AI 团队已发表 130 多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等顶级会议。

此前,已有消息表明快手在大模型落地方面进展迅速。7 月 8 日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。「快手 AI 对话」以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

8 月 18 日,「快手 AI 对话」功能已经在快手 APP 安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角 AI 图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。

591ad695f6a69e25116d81b808a53b94.png快手 App 已内测 AI 对话功能

据称,快手 AI 团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力,另一方面也在推进更多 C 端与 B 端业务场景下的落地。可以预见,随着如「快意」等大模型的不断发展,AI 的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。


进NLP群—>加入NLP交流群

极客一问

你如何看待「快意」大模型?

猜你喜欢

转载自blog.csdn.net/qq_27590277/article/details/132440019