【NLP，Huggingface，Colab】使用 Trainer 训练模型，并保存模型参数

企业开发 2023-08-01 20:57:18 阅读次数: 0

【NLP，Huggingface，Colab】使用 Trainer 训练模型，并保存模型参数

前置知识
上代码

前置知识

Colab 的使用
Huggingface 官网和一些基础API

上代码

首先，建议保存代码到 VSCode，这样双击关键类，F12可以进入查看具体接口参数及其含义。
然后，建议代码在 Colab 运行，第一个是有默认 GPU 资源，第二个是否则会产生各种 ConnectionError, OSError 等错误…
重点可以看注释。自行摸索了一些额外的参数，大多数人都没有讲训练中/后需要保存模型参数…

"""
首先运行如下代码安装库
然后直接运行改代码即可
!pip install datasets transformers
!pip install accelerate -U
"""

from datasets import load_dataset
from transformers import (
    AutoTokenizer,
    DataCollatorWithPadding,
    TrainingArguments,
    AutoModelForSequenceClassification,
    Trainer,
)

# 加载数据集，并加载对应模型的分词器
raw_datasets = load_dataset("glue", "mrpc")
checkpoint = "bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)


def tokenize_function(example):
    return tokenizer(example["sentence1"], example["sentence2"], truncation=True)

# 数据集分词并打包，传给data_collator
tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)
data_collator = DataCollatorWithPadding(tokenizer=tokenizer)

# 设置训练参数，这里我选择训练1poch，每处理20%steps就保存，注意最后100%时不保存。
training_args = TrainingArguments(
    "test-trainer",
    num_train_epochs=1,
    save_strategy="steps",
    save_steps=0.2,
)

# 设置模型
model = AutoModelForSequenceClassification.from_pretrained(checkpoint, num_labels=2)

# 设置训练器，提供各种必要参数。
trainer = Trainer(
    model,
    training_args,
    train_dataset=tokenized_datasets["train"],
    eval_dataset=tokenized_datasets["validation"],
    data_collator=data_collator,
    tokenizer=tokenizer,
)

# 训练，结束后保存模型
trainer.train()

model.save_pretrained("./output_model")

最后文件夹如下，test-trainer 保存训练断点，output_model保存训练后参数模型。

猜你喜欢

转载自blog.csdn.net/weixin_45775438/article/details/131649332

【NLP，Huggingface，Colab】使用 Trainer 训练模型，并保存模型参数

NLP（六十六）使用HuggingFace中的Trainer进行BERT模型微调

huggingface ，Trainer() 函数是 Transformers 库中用于训练和评估模型的主要接口,Trainer()函数的参数如下：

HuggingFace学习笔记--Trainer的使用

如何使用transformers的trainer.train()函数如何训练自定义Bert的下游模型，并进行评估

在PyTorch里面利用transformers的Trainer微调预训练大模型

GPT-LLM-Trainer：如何使用自己的数据轻松快速地微调和训练LLM

Pytorch Lightning使用：【LightningModule、LightningDataModule、Trainer、ModelCheckpoint】

Pytorch基础训练库Pytorch-Base-Trainer(支持模型剪枝分布式训练)

pytorch_CRF应用——huggingface的transformers模块Trainer中使用CRF

笔记 - 模型训练：保存读取使用模型

PaddlePaddle在定义训练器是出现NameError: name 'Trainer' is not defined

如何在使用transformers.Trainer时关闭wandb

使用训练好的模型参数

使用huggingface微调预训练模型

[ pytorch ] ——基本使用：(2) 训练好的模型参数的保存以及调用

Colab配置: 使用gpu训练模型

（转）使用Tensorflow框架完美保存并实现调用训练好的模型（是模型不是参数哦、全网首篇）

Tensorflow对训练模型的保存以及使用

tensorflow 保存与使用训练好的模型

为什么trainer.train中没有feeding参数也可以保持数据输入与模型中input的关系

六、colab训练模型

NLP（四十一）使用HuggingFace翻译模型的一次尝试

NLP模型笔记2022-14：修改fastTex预训练模型的词语向量维度并保存模型

DeepFaceLab 模型预训练参数Pretrain的使用！

使用slim训练模型的参数介绍

【原创】吉他指板音名训练器 Guitar Tone Trainer

使用TF保存模型，恢复模型; 使用训练好的模型进行预测和特征提取

Tensorflow保存模型，恢复模型，使用训练好的模型进行预测和提取中间输出（特征）

使用tensorflow进行mnist数字识别【模型训练+预测+模型保存+模型恢复】

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)