小米 AI 大模型 MiLM-6B：64 亿参数，C-Eval 总榜排名第 10 - 代码天地

小米 AI 大模型 MiLM-6B：64 亿参数，C-Eval 总榜排名第 10

业界资讯 2023-08-12 17:04:09 阅读次数: 0

小米 AI 大模型 MiLM-6B 首次曝光。

MiLM-6B 是由小米开发的一个大规模预训练语言模型，参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

根据 C-Eval 给出的信息，MiLM-6B 模型在具体各科目成绩上，在 STEM（科学、技术、工程和数学教育）全部 20 个科目中，计量师、物理、化学、生物等多个项目获得了较高的准确率。

据悉，MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度，不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中，还有一定进步空间。

在 10 个“社会科学”测试科目中，除“教育学和地理”外，该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中，MiLM-6B 则在“历史与法律”基础上有着不错的准确率表现。

虽然小米 AI 大模型 MiLM-6B 当下才首次曝光，不过完成度已经较高，在未来该模型可能会被用于小米旗下“小爱同学”等虚拟助理服务中。

猜你喜欢

转载自www.oschina.net/news/253387/xiaomi-milm-6b

小米 AI 大模型 MiLM-6B：64 亿参数，C-Eval 总榜排名第 10

AI商业 - 阿里等大厂豪掷50亿美元买英伟达芯片；寒武纪被爆裁员，硬件部分只保留少数员工；小米曝光64亿参数AI大模型｜AI一周资讯

【AI大模型】SuperCLUE 中文大模型排行榜 (2023年6月) —— 最新大模型排名！中文大模型评测基准SuperCLUE发布6月榜单

【AI开源大模型】Falcon 40B——排名第一的AI模型（比 GPT-3 以及 DeepMind 和谷歌的模型更便宜、运行速度更快）

小米大模型，重铸AI能力新范式

C-Eval: 构造中文大模型的知识评估基准

中文大模型评估数据集——C-Eval

大模型评测数据集：MMLU、MMCU、C-Eval

Falcon 40B——全球排名第一的AI模型现在已免费授权

WAIC 2023 | 拥抱大模型，助力无障碍，小米展望AI新业态

雷军宣布小米小爱同学升级 AI 大模型

2020年手机性能榜大洗牌：小米10 Pro勇夺第一！

AI大模型，正在杀死 to B软件？

盘点国内10家互联网AI大模型

2023 AI大语言模型TOP10

AI大模型参数介绍中的5B、7B是何意？

【GPT】中文大语言模型梳理与测评（C-Eval 、AGIEval、MMLU、SuperCLUE）

Android版ChatGPT将于本周发；C-Eval中文大模型排名公布；我国发布首份汽车标准必要专利研究报告丨每日大事件...

华为上半年收入3109亿，净利润466亿；我国成功发射首颗AI卫星；小米大模型首次曝光丨每日大事件...

小米10TPro参数配置

小米任命AI实验室大模型团队负责人雷军：全力以赴，坚决拥抱大模型

巴比特 | 元宇宙每日必读：华为、小米大模型露出水面，荣耀跃跃欲试，AI大模型即将掀起手机江湖「新战事」？...

【AI实战】开源中文 llama2 来了，30 分钟搭建 130 亿参数大模型 Llama2-Chinese-13b-Chat

一周 AIGC 丨北上深蓉出台 AI 政策，百度斥资 10 亿设立人工智能大模型基金

7月热门论文丨Llama 2开源横扫大模型世界，AI自己开发软件，Transformer扩展至10亿Token

雷军亲曝小米 10 四大猛料！

大模型、AI大模型、GPT模型

参数是ChaGPT的近6倍！英特尔公布AI大模型Aurora genAI，具备1万亿参数

AI大模型

AI大模型安装

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)