Hugging Face 模型下载方法一览。 - 代码天地

Hugging Face 模型下载方法一览。

企业开发 2023-04-08 00:52:05 阅读次数: 0

huggingface可谓是深度学习里最重要的社区之一了。里面有无数个我们需要的模型和代码。近年来，知名的模型都会在huggingFace里先放一份代码和模型参数。我们要做的就是下载这些模型。

以Bert为例。

bert-base-chinese at main

这是bert的网址。

截图可以看到有这些文件都是代码和模型权重，还有其他文件。

如果想下载，点击图中的那个文件大小后的小小的下载箭头就可以下载对应文件。

可是，有时候，有些模型的这个页面中有很多个文件夹和文件，一个一个点着去下，让人崩溃。那么有没有什么好的方法呢？

一：最推荐的方法：

hf_hub_download()

当然是这个函数啦，来自官方的函数，可以下载页面中所有的文件，并安照文件夹放好。而且还可以筛选不想要的文件，具体看官网api。

Download files from the Hub

代码如下。 ‘bert-base-chinese’ 是网址后面那一截。

a = snapshot_download(repo_id="bert-base-chinese")

a是返回的存储路径。如果你想指定下载路径。

a = snapshot_download(repo_id="bert-base-chinese", cache_dir='v1-4')

如果你遇到

requests.exceptions.HTTPError: 401 Client Error: Unauthorized for url

这是因为有些模型，不是公开的，或者需要一些协议，必须登录才行。（Bert是公开的）。

此时我们需要添加 readtoken, 其中， readtoken 是属于每个人自己的专属token，从huggiface 官网注册，然后点开setting，点token。即可创建属于自己的token ,复制到下面的代码里即可。

read_token = 'hf_qh ???????????  '
a = snapshot_download(repo_id="bert-base-chinese", cache_dir='v1-4', use_auth_token=read_token)

如果出现

requests.exceptions.HTTPError: 404 Client Error: Not Found for url:

说明你网址输入错了，注意是huggingface.co 后面到tree前截至。

二： git clone

直接git clone +网址

不好用的地方在于，这个方法不会下载权重文件。需要手动下载或者联网使用

三：

用模型当页推荐使用方法使用。这个好像也得联网才能调用。

from transformers import AutoTokenizer, AutoModelForMaskedLM

tokenizer = AutoTokenizer.from_pretrained("bert-base-chinese")

model = AutoModelForMaskedLM.from_pretrained("bert-base-chinese")

猜你喜欢

转载自blog.csdn.net/YI_SHU_JIA/article/details/127490591

Hugging Face 模型下载方法一览。

下载Hugging Face预训练模型

微调Hugging Face中图像分类模型

【Hugging Face】使用Hugging Face模型：NLP任务的强大工具

hugging face model hub 下载预训练模型下载加速

Hugging Face Transformers 模型下载地址（以Pytorch Bert为例）

Server - 使用网盘快速下载 Hugging Face 大模型

Hugging Face 被限制访问

将Hugging Face模型转换成LibTorch模型

Hugging Face 发布 AI 编程模型，对抗 GitHub Copilot

Coovally模型探索：一键下载Hugging Face预训练模型并集成应用

详解Hugging Face Transformers的TrainingArguments

Coovally模型探索：高效下载并使用Hugging Face Transformers预训练模型

hugging face 模型库的使用及加载 Bert 预训练模型

无缝支持Hugging Face社区，Colossal-AI低成本轻松加速大模型

Hugging Face快速入门（重点讲解模型(Transformers)和数据集部分(Datasets)）

复旦MOSS大模型开源了！Github和Hugging Face同时上线

ILLA Cloud: 调用 Hugging Face Inference Endpoints，开启大模型世界之门

复旦MOSS大模型开源了「中国版ChatGPT」，Github和Hugging Face同时上线

【深度学习】Hugging Face Transformers：预训练语言模型与迁移学习

悟道·天鹰Aquila大模型更新权重，支持在 Hugging Face 平台使用！

如何使用Databricks、Hugging Face和MosaicML训练大型语言模型

【Rust日报】2023-09-16 从 Rust 调用 Hugging Face 模型

Hugging Face创始人亲述：一个GitHub史上增长最快的AI项目

Hugging Face第一本中文书出版啦！

连接hugging_face失败的一种可能解决方案

Hugging Face推出了分词器

ILLA Cloud + Hugging Face 调用 whisper

Hugging Face Transformer 的APIs应用实例

使用 Hugging Face Transformer 创建 BERT 嵌入

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)