迁移学习xlm-roberta-base模型应用于分类任务 - 代码天地

迁移学习xlm-roberta-base模型应用于分类任务

企业开发 2023-09-30 18:05:35 阅读次数: 0

下载模型

加载模型

这里不使用官网推荐的方式

from transformers import AutoTokenizer, AutoModelForMaskedLM

tokenizer = AutoTokenizer.from_pretrained("xlm-roberta-base")

model = AutoModelForMaskedLM.from_pretrained("xlm-roberta-base")

使用普通的加载方式
https://huggingface.co/docs/transformers/model_doc/xlm-roberta#transformers.XLMRobertaTokenizer

from transformers import XLMRobertaTokenizer, XLMRobertaModel, BertConfig

设置Config类

class Config(object):
    def __init__(self, dataset):
    # 还有很多自己设定的config，我这里没写，每个人都不一样
    self.num_classes = n # 设置n分类
    self.hidden_size = 768
    self.model_path = "/***/xlm-roberta-base"
    self.tokenizer = XLMRobertaTokenizer.from_pretrained("xlm-roberta-base")
    self.bert_config = BertConfig.from_pretrained(self.model_path + '/config.json')

设置分类模型

class Model(nn.Module):
    def __init__(self, config):
        super(Model, self).__init__()
        self.bert = XLMRobertaModel.from_pretrained(config.model_path, config=config.bert_config)
        self.fc = nn.Linear(config.hidden_size, config.num_classes)


    def forward(self, x):
        context = x  # 输入的句子
        _, pooled = self.bert(context, attention_mask=mask,return_dict=False)
        # 如果电脑又GPU，要加上return_dict=False，否则不用加
        out = self.fc(pooled)
        return out

剩下的训练函数很简单，自己写吧

猜你喜欢

转载自blog.csdn.net/weixin_46398647/article/details/124476171

迁移学习xlm-roberta-base模型应用于分类任务

训练用于序列分类任务的 RoBERTa 模型的适配器

如何将对比学习的思想应用于有标签的二分类任务中

python开发构建深度学习分类模型，探索AI在地震事件分类中的应用于可解释性分析

大模型应用于数字人

图解BERT，ELMo以及如何将其应用于迁移学习

【NLP】ELMo是个啥----将迁移学习应用于NLP

机器学习——SMO算法：应用于支持向量机分类

【深度学习】CNN应用于图像分类的建模全流程

学习redis应用于缓存准备

学习redis应用于缓存

Spyglass学习及应用于cdc

将视觉深度学习模型应用于非视觉领域

机器学习如何应用于使用自然语言处理技术的企业模型介绍

Tensorflow—CNN应用于MNIST数据集分类

生成对抗网络（GAN）应用于图像分类

将大模型应用于知识检索技术架构

GAN实现半监督学习 2、生成对抗网络（GAN）应用于图像分类

迁移学习概念、分类及应用

应用于实时视频通信的深度学习算法

TensorFlow学习笔记（2）——CNN应用于MNIST

应用于实时视频通信的深度学习算法研究

应用于语义分割问题的深度学习技术综述

强化学习应用于组合优化问题

将距离度量学习应用于购物问题

EVO应用于SLAM评估轨迹学习汇总

应用于生产环境的BASE64与MD5混合加密程序示例

mongodb应用于java

FFT应用于卷积

MATLAB算法实战应用案例精讲-【深度学习】预训练模型RoBERTa及ERINE系列

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)