智谱 AI 官宣：ChatGLM2-6B 可免费商用 - 代码天地

智谱 AI 官宣：ChatGLM2-6B 可免费商用

业界资讯 2023-07-15 15:20:48 阅读次数: 0

中英双语大模型 ChatGLM2-6B 开发团队——智谱AI&清华KEG昨晚宣布，即日起 ChatGLM-6B 和 ChatGLM2-6B 权重对学术研究完全开放，并且在完成企业登记获得授权后，允许免费商业使用。

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上，ChatGLM2-6B 引入了如下新特性：

更强大的性能：基于 ChatGLM 初代模型的开发经验，全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数，经过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果显示，相比于初代模型，ChatGLM2-6B 在 MMLU（+23%）、CEval（+33%）、GSM8K（+571%）、BBH（+60%）等数据集上的性能取得了大幅度的提升，在同尺寸开源模型中具有较强的竞争力。
更长的上下文：基于 FlashAttention 技术，项目团队将基座模型的上下文长度（Context Length）由 ChatGLM-6B 的 2K 扩展到了 32K，并在对话阶段使用 8K 的上下文长度训练，允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限，我们会在后续迭代升级中着重进行优化。
更高效的推理：基于 Multi-Query Attention 技术，ChatGLM2-6B 有更高效的推理速度和更低的显存占用：在官方的模型实现下，推理速度相比初代提升了 42%，INT4 量化下，6G 显存支持的对话长度由 1K 提升到了 8K。

示例对比

相比于初代模型，ChatGLM2-6B 多个维度的能力都取得了提升，以下是一些对比示例。

数理逻辑

知识推理

长文档理解

猜你喜欢

转载自www.oschina.net/news/249475

智谱 AI 官宣：ChatGLM2-6B 可免费商用

智谱AI推出第三代基座大模型ChatGLM3

清华智谱AI大模型ChatGLM-Pro申请开通教程

基于Laravel通用型内容建站企业官网系统源码可免费商用

Meta 放大招：发布开源大语言模型 Llama 2，可免费商用

[Unity+智谱AI开放平台]调用ChatGLM Tuobo模型驱动AI小姐姐数字人

【AI实战】ChatGLM2-6B 微调：AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘

【AI】清华开源中英双语对话模型ChatGLM2-6B本地安装笔记

AI 智能对话 - ChatGLM2-6B 本地搭建入门

AI 智能对话 - 基于 ChatGLM2-6B 训练对话知识库

智谱AI CEO张鹏：ChatGLM全球超过百万下载，为行业智能化降本增效｜中国AIGC产业峰会...

【chatglm3】（4）：如何设计一个知识库问答系统，参考智谱AI的知识库系统，

Meta被曝明年发布「开源版GPT-4级」全新大模型！参数量比Llama 2大数倍，可免费商用

【腾讯云 HAI域探秘】——即时职场生存指南小游戏以及【自行搭建Stable Diffusion图片AI绘制 | ChatGLM2-6B AI进行智能对话 | Pytorch2.0 AI框架视频处理】

【人工智能】智谱研究报告：揭秘ChatGPT背后的AI“梦之队”

幂律智能联合智谱AI发布千亿参数级法律垂直大模型PowerLawGLM

美团投资大模型公司智谱 AI，占股超 10%

智谱 AI：2023 年已完成超 25 亿元融资

国产AI大模型：智谱清言 vs. 文心一言

ChatGLM2-6B 本地部署

ChatGLM2-6B，部署及微调

启明星 | 认知智能领跑者智谱AI完成数亿元B轮融资，持续打造高性能千亿级普惠大模型

阿里云“通义千问”开源，可免费商用

【腾讯云 HAI域探秘】基于高性能应用服务器HAI部署的 ChatGLM2-6B模型，我开发了AI办公助手，公司行政小姐姐用了都说好！

【人工智能AI2.0】国产开源 ChatGPT: ChatGLM-6B 搭建属于你的永远免费的本地 ChatGPT

官宣了！受疫情影响，程序员可免费领这些！

AI配音 | 收藏了3个国内能用靠谱还纯免费的AI配音方法

微软开放内部AI系列培训课程：10大技能，edX可免费注册

2023年含：GPT-4的可免费使用语言模型AI平台推荐

分享一个 ChatGPT可免费使用的AI助手

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)