【大语言模型】使用ChatGLM-6B模型训练自己的数据集

企业开发 2023-07-02 00:49:13 阅读次数: 0

使用ChatGLM-6B模型训练自己的数据集

使用ChatGLM-6B训练自己的数据集
总结

本项目实现了对于 ChatGLM-6B 模型基于 P-Tuning v2 的微调。P-Tuning v2 将需要微调的参数量减少到原来的 0.1%，再通过模型量化、Gradient Checkpoint 等方法，最低只需要 7GB 显存即可运行。

下面以 ADGEN (广告生成) 数据集为例介绍代码的使用方法。

使用ChatGLM-6B训练自己的数据集

1. 安装软件依赖

## 运行微调需要4.27.1版本的

猜你喜欢

转载自blog.csdn.net/ARPOSPF/article/details/131386242

【大语言模型】使用ChatGLM-6B模型训练自己的数据集

ChatGLM2-6B、ChatGLM-6B 模型训练自己数据集实战

ChatGLM-6B 模型介绍及训练自己数据集实战

基于chatGLM-6B模型预训练，添加自己的数据集微调（linux版）（ptuning & lora）

TigerBot和ChatGLM-6B大语言模型

【大模型】chatglm-6b的demo

ChatGLM-6B模型使用

解锁ChatGLM-6B的潜力：优化大语言模型训练，突破任务困难与答案解析难题

chatglm-6b，搭建自己的AI模型

ChatGLM-6B大模型微调实战总结

快速部署ChatGLM-6B大模型实战总结

【ChatGLM-6B】清华开源的消费级显卡大语言模型，本地部署与测试

【大语言模型】10分钟快速了解并部署ChatGLM-6B

模型训练系列：1、用清华ChatGLM-6B模型部署自己的本地AI助手

【自然语言处理】【大模型】ChatGLM-6B模型结构代码解析(单机版)

chatglm-6B基础环境、模型下载、微调训练详细介绍

LLM：ChatGLM-6B模型进行P-Tunning训练记录及参数讲解

ChatGLM-6B 类似ChatGPT功能型对话大模型部署实践

ChatGLM-6B —— 80%替换ChatGPT的开源对话大模型介绍（GLM，General Language Model ）

如何优化ChatGLM-6B？一行代码就行 | 最“in”大模型

玩转大模型！在GPU云平台部署ChatGLM-6B

ChatGLM-6B：颠覆聊天AI的全新模型

ChatGLM-6B模型结构组件源码阅读

基于ChatGLM-6B的双语开源对话模型

huggingface_hub优雅下载ChatGLM-6B模型

如何使用chatglm-6b实现多卡训练

【ChatGPT】预训练模型微调及其应用（ChatGLM-6B、duckduckgo_search、GPT在科研的应用等）

LLM：ChatGLM-6B模型文件modeling_chatglm.py讲解

【ChatGLM】ChatGLM-6B模型Win+4GB显卡本地部署笔记

【ChatGLM】本地版ChatGPT ？6G显存即可轻松使用！ChatGLM-6B 清华开源模型本地部署教程

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)