LLM - Hugging Face 工程 BERT base model (uncased) 配置 - 代码天地

LLM - Hugging Face 工程 BERT base model (uncased) 配置

业界资讯 2023-07-02 01:23:22 阅读次数: 0

欢迎关注我的CSDN：https://spike.blog.csdn.net/
本文地址：https://blog.csdn.net/caroline_wendy/article/details/131400428

BERT

BERT是一个在大量英文数据上以自监督的方式预训练的变换器模型。这意味着它只是在原始文本上进行预训练，没有人以任何方式对它们进行标注（这就是为什么它可以使用大量公开可用的数据），而是用一个自动的过程来从这些文本中生成输入和标签。更准确地说，它是用两个目标进行预训练的：

掩码语言建模 (Masked Language Modeling，MLM) ：给定一个句子，模型随机地掩盖输入中的15%的词，然后将整个掩盖的句子通过模型，并且必须预测掩盖的词。这与传统的循环神经网络（RNN）不同，它们通常是一个接一个地看词，或者与像GPT这样的自回归模型不同，它们内部地掩盖未来的词。这使得模型能够学习句子的双向表示。
下一句预测 (Next Sentence Prediction，NSP)：模型在预训练期间将两个掩盖的句子作为输入拼接起来。有时它们对应于原始文本中相邻的句子，有时不是。然后模型必须预测这两个句子是否是相互跟随的。

uncased 表示不区分大小写

Hugging Face：bert-base-uncased

配置 ssh 之后，使用 git 下载工程，模型使用占位符：

git clone [email protected]:bert-base-uncased

从 Hugging Face 网站，下载 5 个大文件：

flax_model.msgpack  # 417M
model.safetensors		# 420M
pytorch_model.bin		# 420M
rust_model.ot				# 509M
tf_model.h5					# 511M

使用 bypy 下载文件，参考：CSDN - 使用网盘快速下载 Hugging Face 大模型

bypy info
bypy downdir /bert-base-uncased/ ./bert-base-uncased/

完成更新 5 个文件。

测试脚本：

from transformers import BertTokenizer, BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertModel.from_pretrained("bert-base-uncased")
text = "Replace me by any text you'd like."
encoded_input = tokenizer(text, return_tensors='pt')
output = model(**encoded_input)
print(f"output.last_hidden_state: {output.last_hidden_state.shape}")

输出：

output.last_hidden_state: torch.Size([1, 12, 768])

猜你喜欢

转载自blog.csdn.net/u012515223/article/details/131400428

LLM - Hugging Face 工程 BERT base model (uncased) 配置

使用 Hugging Face Transformer 创建 BERT 嵌入

Rasa课程、Rasa培训、Rasa面试、Rasa实战系列之Hugging Face bert-base-chinese 使用

Hugging Face Transformers 模型下载地址（以Pytorch Bert为例）

hugging face model hub 下载预训练模型下载加速

BERT uncased和cased的区别

Bert系列：BERT（Bidirectional Encoder Representations from Transformers）原理以及hugging face介绍

LLM - ChatGLM-6B (General Language Model) 的工程配置

hugging face 模型库的使用及加载 Bert 预训练模型

【转载】【NLP】使用 PyTorch 通过 Hugging Face 使用 BERT 和 Transformers 进行情感分析

Hugging Face 被限制访问

LLM - 第2版 ChatGLM2-6B (General Language Model) 的工程配置

NLP冻手之路(5)——中文情感分类(以BERT为基础，由Hugging Face库支持，代码实践)

详解Hugging Face Transformers的TrainingArguments

又壕又实惠的 AI 训练来了，Hugging Face 第一的 LLM 大模型 Falcon 40B 纳入亚马逊云科技服务

Hugging Face推出了分词器

下载Hugging Face预训练模型

ILLA Cloud + Hugging Face 调用 whisper

微调Hugging Face中图像分类模型

Hugging Face Transformer 的APIs应用实例

【Hugging Face】使用Hugging Face模型：NLP任务的强大工具

停止使用谷歌翻译,构建您自己的人工智能应用程序,了解如何使用 Hugging Face LLM 和 Python 将长文档翻译成您的语言，不受任何限制

Hugging Face 模型下载方法一览。

Hugging Face 发布 AI 编程模型，对抗 GitHub Copilot

手把手教你玩Hugging Face

如何安装和使用 Hugging Face Unity API

Server - 使用网盘快速下载 Hugging Face 大模型

将Hugging Face模型转换成LibTorch模型

Hugging Face Transformer：从原理到实战的全面指南

使用 Streamlit 和 Hugging Face Transformers 进行自动图像字幕

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)