AI技术快讯：清华开源ChatGLM2双语对话语言模型 - 代码天地

AI技术快讯：清华开源ChatGLM2双语对话语言模型

企业开发 2023-08-01 17:34:55 阅读次数: 0

在这里插入图片描述

ChatGLM2-6B是一个开源项目，提供了ChatGLM2-6B模型的代码和资源。根据提供的搜索结果，以下是对该项目的介绍：

论文：https://arxiv.org/pdf/2103.10360.pdf
在这里插入图片描述

ChatGLM2-6B是一个开源的双语对话语言模型，是ChatGLM-6B模型的第二代版本。它保留了初代模型的对话流畅和部署门槛较低的特点，并引入了一些新的特性和改进。

ChatGLM2-6B具有以下特点和功能：

更强大的性能：ChatGLM2-6B使用了GLM的混合目标函数，并经过了大规模的预训练和人类偏好对齐训练。评测结果显示，在多个数据集上，ChatGLM2-6B相比初代模型在性能上有了显著的提升，具有较强的竞争力。

更长的上下文：通过引入FlashAttention技术，ChatGLM2-6B将基座模型的上下文长度从ChatGLM-6B的2K扩展到了32K，并在对话阶段使用8K的上下文长度进行训练。这使得ChatGLM2-6B能够处理更长的上下文信息。

更高效的推理：基于Multi-Query Attention技术，ChatGLM2-6B具有更高效的推理速度和更低的显存占用。在官方的模型实现下，ChatGLM2-6B相比初代模型的推理速度提升了42%，并且在INT4量化下，6G显存支持的对话长度从1K提升到了8K。

开放的协议：ChatGLM2-6B的权重对学术研究完全开放，并且在填写问卷进行登记后，也允许免费商业使用。

源码：https://github.com/THUDM/ChatGLM2-6B

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41194129/article/details/132031361

AI技术快讯：清华开源ChatGLM2双语对话语言模型

【AI】清华开源中英双语对话模型ChatGLM2-6B本地安装笔记

【ChatGLM-6B】清华开源的消费级显卡大语言模型，本地部署与测试

清华开源语言大模型ChatGLM3部署实战

VisualGLM - 多模态中英双语对话语言模型

清华开源语言大模型ChatGLM3联通one-api实现快速部署

基于ChatGLM-6B的双语开源对话模型

LLaMA ChatGLM2 BLOOM模型技术分析对比

重磅！清华ChatGLM2开源！中文榜居首，碾压GPT-4！

使用anaconda部署清华开源ChatGLM-6B

大模型lora微调-chatglm2

【ChatGLM】本地版ChatGPT ？6G显存即可轻松使用！ChatGLM-6B 清华开源模型本地部署教程

Flask在线部署ChatGLM2大模型

ChatGLM：清华开源本地部署（2023/05/06更新）

清华第二代60亿参数ChatGLM2开源！中文榜居首，碾压GPT-4，推理提速42%

手把收带你调用大模型+附上清华大学云盘：chatglm2位置

ChatGLM2发布！中文榜单开源模型排名第一！8-32k上下文，推理提速42%

多模态对话语言模型-VisualGLM-6B

基于MiniGPT-4的支持图文的双语开源对话模型

ChatGLM2-6B：性能大幅提升，8-32k上下文，推理提速42% —— 开源中英双语对话模型 ChatGLM-6B 的第二代来了！更强大的性能，更长的上下文，更高效的推理，更开放的协议！

Chatglm2使用及微调教程

ChatGLM2 源码解析：`GLMTransformer`

ChatGLM2 源码解析：`ChatGLMModel`

ChatGLM2 源码解析：`MLP`

ChatGLM2 源码解析：`GLMBlock`

使用清华开源镜像安装tensorflow

极大提升GPT-4等模型推理效率，微软、清华开源全新框架

他们开源了GitHub上最火的双语对话模型，还说AI胡说八道不需要被纠正

GPT实战系列-P-Tuning本地化训练ChatGLM2等LLM模型，到底做了什么？(二)

ChatGLM2 大模型微调过程中遇到的一些坑及解决方法(更新中)

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)