清华开源语言大模型ChatGLM3部署实战 - 代码天地

清华开源语言大模型ChatGLM3部署实战

企业开发 2023-12-17 11:34:06 阅读次数: 0

清华开源语言大模型ChatGLM3部署实战

安装环境
下载模型文件
测试是否安装成功

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。
项目库地址：https://github.com/THUDM/ChatGLM3

安装环境

建议使用虚拟环境

git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3
pip install -r requirements.txt

其中 transformers 库版本推荐为 4.30.2，torch 推荐使用 2.0 及以上的版本，以获得最佳的推理性能。

下载模型文件

git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

需等待较长时间
在这里插入图片描述

测试是否安装成功

推理时将THUDM/chatglm3-6b改为自己下载模型的路径

gpu推理

推理需13g以上显存

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True, device='cuda')
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

cpu推理

推理需32g以上内存

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True,.float()
)
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

量化推理

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm3-6b",trust_remote_code=True).quantize(4).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

如果遇到什么问题欢迎评论区交流
群内交流更多技术
130856474

猜你喜欢

转载自blog.csdn.net/Silver__Wolf/article/details/134247535

清华开源语言大模型ChatGLM3部署实战

清华开源语言大模型ChatGLM3联通one-api实现快速部署

【ChatGLM-6B】清华开源的消费级显卡大语言模型，本地部署与测试

【大语言模型】Docker部署清华大学ChatGLM3教程

AI技术快讯：清华开源ChatGLM2双语对话语言模型

使用anaconda部署清华开源ChatGLM-6B

部署清华智谱ChatGLM3对话预训练模型

【大模型实践】ChatGLM3微调对话模型（五）

开源语言大模型的正确姿势

【ChatGLM】本地版ChatGPT ？6G显存即可轻松使用！ChatGLM-6B 清华开源模型本地部署教程

【大模型实践】ChatGLM3安装及体验（四）

ChatGLM：清华开源本地部署（2023/05/06更新）

【AI】清华开源中英双语对话模型ChatGLM2-6B本地安装笔记

GPT实战系列-大模型为我所用之借用ChatGLM3构建查询助手

为什么开源语言大模型很重要？

开源语言大模型演进史：早期革新

【大模型知识库】（1）：系统架构设计思考/调研。开源项目llm-knowledge-system，部署mysql，seilisearch，milvus，fastchat的ChatGLM3，BGE-zh

【大模型知识库】（4）：本地环境运行dity+fastchat的ChatGLM3模型，可以使用chat/completions接口调用chatglm3模型

【大模型实践】ChatGLM3微调输入-输出模型（六）

清华大学开源的chatGLM-6B部署实战

智谱AI推出第三代基座大模型ChatGLM3

【大模型知识库】（2）：开源大模型+知识库方案，docker-compose部署本地知识库和大模型，毕昇+fastchat的ChatGLM3，BGE-zh模型，通过拖拽/配置方式实现大模型编程

记录部署ChatGLM大语言模型过程

ChatGLM3简介

Llama 2：开源语言模型的未来

Meta｜LLaMA开源语言模型

Llama 2｜Meta开源语言模型

ChatGLM3 本地部署的解决方案

开源语言大模型演进史：高质量基础模型竞赛

开源监控软件Zabbix5部署实战

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)