ChatGLM2-6B，部署及微调 - 代码天地

ChatGLM2-6B，部署及微调

企业开发 2023-12-17 10:24:48 阅读次数: 0

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、模型部署
二、微调

前言

代码地址：https://github.com/THUDM/ChatGLM2-6B
模型地址：https://huggingface.co/THUDM/chatglm2-6b
安装环境：Ubuntu_VM-GPU，3090

一、模型部署

1. 下载代码

提示：git clone https://github.com/THUDM/ChatGLM2-6B 有时候连不到github
因此，直接下载代码，上传到服务器去解压

2. 下载模型

① 首次运行程序，程序会自动从huggingface拉取，放入缓存文件夹中
② 同代码一样，先从网上下载再传到服务器。

3. 建立conda的虚拟环境

下面展示一些 内联代码片。

conda create -n chatglm python=3.10

conda activate chatglm

4. 安装环境依赖

进入到代码目录中，目录中有requirement.txt

pip install -r requirement.txt

5. 修改模型配置

打开web_demo.py

vim web_demo.py

修改代码中的模型地址，

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)
 model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).cuda()

将THUDM/chatglm2-6b换成模型上传的文件夹

6. 执行web_demo.py

python web_demo.py

加载模型后会给出web服务的地址

Running on local URL: http://127.0.0.1:7860
Running on public URL: https://8d65029a7d3a5a79fc.gradio.live

提示：要显示公共地址，需要在执行的代码的最后一行将share参数从False改成True

demo.queue().launch(share=True, inbrowser=True)

二、微调

猜你喜欢

转载自blog.csdn.net/rexxa/article/details/131605344

ChatGLM2-6B，部署及微调

ChatGLM2-6B 本地部署

ChatGLM2-6B在Windows下的微调

中文模型的奋起直追：MOSS、baichuan-7B和ChatGLM2-6B的原理、部署与微调

Ubuntu部署ChatGLM2-6B踩坑记录

【AI实战】ChatGLM2-6B 微调：AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘

chatglm2-6b在P40上做LORA微调 | 京东云技术团队

使用ChatGLM2-6b微调解决文本二分类任务

基于 P-Tuning的高效微调ChatGLM2-6B

基于 P-Tuning v2 进行 ChatGLM2-6B 微调实践 | 京东云技术团队

手把手带你实现ChatGLM2-6B的P-Tuning微调

ChatGLM-6B微调与部署

将 ChatGLM2-6B 部署成 OpenAI API 服务

整合包：Windows下一键部署chatglm2-6b

AIGC大模型ChatGLM2-6B：国产版chatgpt本地部署及体验

在个人电脑上部署ChatGLM2-6B中文对话大模型

使用Triton部署chatglm2-6b模型 | 京东云技术团队

ChatGLM2-6B 训练参数解释

Chatbot UI 和 ChatGLM2-6B 的集成

Chatglm2-6b模型相关问题

ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战

LLMs之ChatGLM2：ChatGLM2-6B本地部署之单机推理(API/CLI/GUI)、低成本部署(GPU量化部署/CPU及其量化部署/Mac部署/多卡部署)、有限资源下高效微调(全参/P-t

Windows10下ChatGLM2-6B模型本地化安装部署教程图解

chatglm2-6b模型在9n-triton中部署并集成至langchain实践 | 京东云技术团队

学习实践ChatGLM-6B（部署+运行+微调）

ChatGLM-6B 部署与 P-Tuning 微调实战

GLM 130B和chatGLM2-6B模型结构

【大模型AIGC系列课程 3-6】ChatGLM2-6B的应用

LLM - 第2版 ChatGLM2-6B (General Language Model) 的工程配置

ChatGLM2-6B安装详解（Windows/Linux）及遇到的问题解决办法

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)