在PyTorch里面利用transformers的Trainer微调预训练大模型 - 代码天地

在PyTorch里面利用transformers的Trainer微调预训练大模型

企业开发 2023-09-30 00:35:55 阅读次数: 0

背景

transformers提供了非常便捷的api来进行大模型的微调，下面就讲一讲利用Trainer来微调大模型的步骤

第一步：加载预训练的大模型

from transformers import AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased")

第二步：设置训练超参

from transformers import TrainingArguments

training_args = TrainingArguments(
    output_dir="path/to/save/folder/",
    learning_rate=2e-5,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=2,
)

比如这个里面设置了epoch等于2

第三步：获取分词器tokenizer

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased")

第四步：加载数据集

from datasets import load_dataset

dataset = load_dataset("rotten_tomatoes")  # doctest: +IGNORE_RESULT

第五步：创建一个分词函数，指定数据集需要进行分词的字段：

def tokenize_dataset(dataset):
    return tokenizer(dataset["text"])

第六步：调用map()来将该分词函数应用于整个数据集

dataset = dataset.map(tokenize_dataset, batched=True)

第七步：使用DataCollatorWithPadding来批量填充数据，加速填充过程：

from transformers import DataCollatorWithPadding

data_collator = DataCollatorWithPadding(tokenizer=tokenizer)

第八步：初始化Trainer

from transformers import Trainer

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset["train"],
    eval_dataset=dataset["test"],
    tokenizer=tokenizer,
    data_collator=data_collator,
)  # doctest: +SKIP

第九步：开始训练

trainer.train()

总结：

利用Trainer提供的api，只需要简简单单的九步，十几行代码就能进行大模型的微调，你要不要动手试一试？

猜你喜欢

转载自blog.csdn.net/duzm200542901104/article/details/133081182

在PyTorch里面利用transformers的Trainer微调预训练大模型

微调预训练模型huggingface，transformers

Pytorch对预训练好的VGG16模型进行微调

pytorch cv自带预训练模型再微调

主流大语言模型从预训练到微调的技术原理

微调预训练的 NLP 模型

多模态大模型(大模型基础、微调、视频理解多模态预训练)

Transformers 加载预训练模型 | 七

加载预训练模型遇到transformers的问题

Transformers预训练模型使用：翻译 Translation

【自然语言处理】PyTorch-Transformers预训练模型库的简单了解

【自然语言处理】PyTorch-Transformers预训练模型库的简单了解

NLP中的语言模型预训练&微调

CNN基础三：预训练模型的微调

Bert模型预训练和微调

使用huggingface微调预训练模型

resnet预训练模型以及微调

深度学习：pytorch用预训练pre-train模型微调参数

Pytorch使用BERT预训练模型微调文本分类，IMDb电影评论数据集

huggingface ，Trainer() 函数是 Transformers 库中用于训练和评估模型的主要接口,Trainer()函数的参数如下：

[AI医学] 医学领域几个微调&预训练大模型的项目

【报告】从GLM-130B到ChatGLM：大模型预训练与微调学习记录

大语言模型之十五-预训练和监督微调中文LLama-2

pytorch调用预训练模型

pytorch 预训练模型修改

预训练模型的应用（pytorch）

pytorch加载预训练模型

Pytorch预训练模型加载

pytorch 加载使用预训练模型和 fine tune 模型微调(冻结一部分层)实战

PyTorch预训练和微调：以VGG16为例

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)