huggingface的使用辛酸史

企业开发 2023-08-08 17:39:28 阅读次数: 0

huggingface模型的下载与加载

阿呆的开始
阿呆的加载
阿呆的使用

阿呆的开始

首先在官网上找到需要使用的预训练模型。

找到需要的模型，记住一定要下载这三个文件
在这里插入图片描述

阿呆的加载

使用 from_pretrained("xxxxx").方法加载，本地加载bert需要修改两个地方，一是tokenizer部分，二是model部分：

当下载上面的文件时
step1、导包： from transformers import BertModel，BertTokenizer
step2、载入词表： tokenizer = BertTokenizer.from_pretrained("./bert_localpath/") 这里要注意！！除了你自己建的文件夹名外，后面一定要加个/，才能保证该方法找到你的vocab.txt
step3、载入模型： model = BertModel.from_pretrained("./bert_localpath") 然后，这个地方又不需要加上/
当你没有下载上面的文件时
这个时候他就会帮你下载
step1、导包： from transformers import BertModel，BertTokenizer
step2、载入词表： tokenizer = BertTokenizer.from_pretrained("模型名字")
step3、载入模型： model = BertModel.from_pretrained(".模型名字")

阿呆的使用

from transformers import BertTokenizer,BertModel


# model_name = 'medbert-base-wwm-chinese'
model_pram_path = './BERT'
tokenizer = BertTokenizer.from_pretrained(model_pram_path)
model = BertModel.from_pretrained(model_pram_path)

# 查看分词
sequence = "sadfasdfasdfasdfasdfasdfas"
tokenized_sequence = tokenizer.tokenize(sequence)# 分词
print(tokenized_sequence)

# 编码
inputs = tokenizer(sequence)
encoeded_sequence = inputs["input_ids"]# input_ids，token_type_ids，attention_mask
print(f"encoder: {
      
      encoeded_sequence}")
# 解码
decoded_sequence = tokenizer.decode(encoeded_sequence)
print(f"decoder: {
      
      decoded_sequence}")

参考：
https://blog.csdn.net/qq_35459198/article/details/116236897

https://blog.csdn.net/qq_52852138/article/details/128474948

猜你喜欢

转载自blog.csdn.net/CSTGYinZong/article/details/128926634

huggingface的使用辛酸史

安装tomcat的辛酸史

bitcoin 编译辛酸史

Linux上安装Oracle的辛酸史

软件外包辛酸史与前景

Python-Scrapy安装辛酸史

echarts（JavaScript）加载json的辛酸史

elevation_mapping 安装辛酸史

我的WEB前端辛酸史

7年Java游戏后端，被淘汰辛酸史

wmware扩盘辛酸史-shell历史命令

互联网公司产品部门的辛酸史

前端小tips-我的ff—talk的辛酸史

Scrapy安装及项目启动血泪辛酸史

转载： Linux上安装Oracle的辛酸史

windows 10下选择typora图床的辛酸史

次世代的眼泪——游戏美术入门必读辛酸史

一个老站长运营图片网站的辛酸史

7年的Java后端最终免不了被淘汰，一路北漂辛酸史！！！

记录一次兼容Android手机角标的辛酸史。。。

工作篇之记录一次兼容手机角标的辛酸史。。。

一位IT外包女程序员的辛酸史，网友的回复很扎心！

我的android studio开发环境搭建历程（一部辛酸史）

服务器上安装conda和torch0.4.1的辛酸史

Java程序员7年Java游戏后端的老码农，被淘汰辛酸史！

一位IT外包女程序员的辛酸史，网友的回复很扎心

7年Java后端被淘汰，一路北漂的辛酸史。。。

7年Java后端被淘汰，一路北漂辛酸史。。。

关于在博客园给live2d添加动作的辛酸史

记录一次 Win10 通过 VirtualBox安装CentOS7 的辛酸史

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)