书生·浦语2.0（InternLM2）大语言模型正式开源 - 代码天地

书生·浦语2.0（InternLM2）大语言模型正式开源

业界资讯 2024-01-17 17:03:58 阅读次数: 0

1月17日，书生·浦语2.0（InternLM2）发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0（InternLM2）。

开源地址

Github：https://github.com/InternLM/InternLM

HuggingFace：https://huggingface.co/internlm

ModelScope：https://modelscope.cn/organization/Shanghai_AI_Laboratory

据介绍，InternLM2是在2.6万亿token的高质量语料上训练得到的。沿袭第一代书生·浦语（InternLM）的设定，InternLM2包含7B及20B两种参数规格及基座、对话等版本，满足不同复杂应用场景需求。秉持“以高质量开源赋能创新”理念，上海AI实验室继续提供InternLM2免费商用授权。

InternLM2 的核心理念在于回归语言建模的本质，致力于通过提高语料质量及信息密度，实现模型基座语言建模能力获得质的提升，进而在数理、代码、对话、创作等各方面都取得长足进步，综合性能达到同量级开源模型的领先水平。其支持200K token的上下文，一次性接收并处理约30万汉字的输入内容，准确提取关键信息，实现长文本中“大海捞针”。

此外，InternLM2的各项能力获得全面进步，相比于初代InternLM，在推理、数学、代码等方面的能力提升尤为显著，综合能力领先于同量级开源模型。

根据大语言模型的应用方式和用户关注的重点领域，研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度，在55个主流评测集上对多个同量级模型的表现进行了综合评测。评测结果显示，InternLM2的轻量级（7B）及中量级（20B）版本性能在同量级模型中表现优异。

猜你喜欢

转载自www.oschina.net/news/276033/shanghai-ai-lab-internlm2

书生·浦语2.0（InternLM2）大语言模型正式开源

书生·浦语 200 亿参数模型 InternLM-20B 开源

【全球首发】书生·浦语200亿参数模型InternLM-20B开源了！

书生·浦语-对话-20B 书生大模型

书生·浦语大模型全链路开源开放体系

上海AI实验室与商汤科技等发布“书生·浦语”大语言模型

轻松玩转书生·浦语大模型趣味Demo

LLM系列 | 23：多模态大模型：浦语·灵笔InternLM-XComposer解读、实战和思考

书生·浦语大模型实战营——两周带你玩转微调部署评测全链路

AI技术快讯：清华开源ChatGLM2双语对话语言模型

LLM - 大模型速递 InternLM-20B 快速入门

Baichuan2开源大模型正式发布，王小川：性能超过LLaMA2

LLM InternLM-Chat-7B书生模型、Baichuan-13B-Chat百川模型简单使用

免费商用 Meta 发布开源大语言模型 Llama 2

思必驰DFM-2语言大模型正式发布

【时空序列】全球气象预测大模型 OpenCastKit 正式开源

蚂蚁集团正式开源 CodeFuse 代码大模型

北大正式发布中文法律大模型ChatLaw，并开源

大语言模型系列-中文开源大模型

开源大语言模型完整列表

开源语言大模型的正确姿势

在英特尔锐炫™独立显卡运行类ChatGPT的开源大语言模型（LLM) Dolly 2.0

Meta 放大招：发布开源大语言模型 Llama 2，可免费商用

开源语言大模型演进史：向LLaMA 2看齐

如何让 Llama2、通义千问开源大语言模型快速跑在函数计算上？

TDengine 2.0正式上线，集群功能开源，不用再为高可靠、数据规模大而发愁了

Llama 2：开源语言模型的未来

Llama 2｜Meta开源语言模型

Cemu 2.0 发布，项目正式开源

阿里云PAI-灵骏大模型训练工具Pai-Megatron-Patch正式开源！

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)