Google BERT模型提取句子Token特征 - 代码天地

Google BERT模型提取句子Token特征

其他 2019-04-24 08:40:57 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/fjssharpsword/article/details/89407194

BERT模型：https://github.com/google-research/bert#fine-tuning-with-bert

环境：linux+python3+tensorflow，也有pytorch版。

1、下载：

BERT-Base, Chinese: Chinese Simplified and Traditional, 12-layer, 768-hidden, 12-heads, 110M parameters

解压到指定目录。

2、Git Clone下https://github.com/google-research/bert.git

3、输入句子到指定文件：

echo '如图，a、b、c分别是数轴上A、B、C所对应的实数，试化简' > edp/input.txt

4、执行：

python3 bert/extract_features.py \
  		   --input_file=edp/input.txt \
  		   --output_file=edp/output.json \
  		   --vocab_file=chinese_L-12_H-768_A-12/vocab.txt \
  		   --bert_config_file=chinese_L-12_H-768_A-12/bert_config.json \
  		   --init_checkpoint=chinese_L-12_H-768_A-12/bert_model.ckpt \
  		   --layers=-1 \
  		   --max_seq_length=128 \
  		   --batch_size=8

具体参数参考github上解释。

5、如果有自己特定预料，可以在谷歌训练的模型上再预训练。

参考：https://daiwk.github.io/posts/nlp-bert-code.html#pretrained-model

由于句子长度不一样，token数不一样，每个token的向量长度一样，但token数不一样，一个句子的总体向量长度也就不一样。

猜你喜欢

转载自blog.csdn.net/fjssharpsword/article/details/89407194

Google BERT模型提取句子Token特征

Google BERT

Bert提取句子特征(pytorch_transformers)

Google最新模型bert，你了解么？

Bert模型（Google官方）问题汇总

【NLP】Google BERT详解

Google BERT应用之《红楼梦》对话人物提取

google的transformer模型的解释

5 分钟入门 Google 最强NLP模型：BERT

从零开始快速入门google开源BERT模型

Google机器学习特征集

google

Bert on Google Cloud TPU过程记录

google对标chatgpt4的模型诞生-google bard

BERT预训练模型字向量提取工具--使用BERT编码句子

Google AuthenticationException: 403: Invalid AuthSub token

Google最强模型BERT出炉，NLP还有哪些值得期待的发展？

2018年最强自然语言模型 Google BERT 资源汇总

2018年最强自然语言模型 Google BERT 论文全文中译

Pytorch使用Google BERT模型进行中文文本分类

Google 最强开源模型 BERT 在 NLP 中的应用 | 技术头条

在 Google Colab 中微调用于命名实体识别的 BERT 模型

The Dataflow Model：Google Dataflow 编程模型

深度学习模型搭载google drive训练

Google Colab训练yolov7模型

使用BERT模型生成句子序列向量

Google Earth Engine（GEE）—— 超限超时提取的问题(besteffort的适用)

Google TensorFlow课程编程笔记（5）———特征组合

Google TensorFlow课程编程笔记（4）———特征集

Google 机器学习编程笔记四——良好特征集构建

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)