bert4keras 测试代码可用性: 提取特征 - 代码天地

bert4keras 测试代码可用性: 提取特征

其他 2020-05-21 09:56:53 阅读次数: 0

bert4keras
#! -*- coding: utf-8 -*-
# 测试代码可用性: 提取特征

from bert4keras.backend import keras
from bert4keras.models import build_transformer_model
from bert4keras.tokenizers import Tokenizer
import numpy as np

config_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_config.json'
checkpoint_path = '/root/kg/bert/chinese_L-12_H-768_A-12/bert_model.ckpt'
dict_path = '/root/kg/bert/chinese_L-12_H-768_A-12/vocab.txt'

tokenizer = Tokenizer(dict_path, do_lower_case=True)  # 建立分词器
model = build_transformer_model(config_path, checkpoint_path)  # 建立模型，加载权重

# 编码测试
token_ids, segment_ids = tokenizer.encode(u'语言模型')

print('\n ===== predicting =====\n')
print(model.predict([np.array([token_ids]), np.array([segment_ids])]))
"""
输出：
[[[-0.63251007  0.2030236   0.07936534 ...  0.49122632 -0.20493352
    0.2575253 ]
  [-0.7588351   0.09651865  1.0718756  ... -0.6109694   0.04312154
    0.03881441]
  [ 0.5477043  -0.792117    0.44435206 ...  0.42449304  0.41105673
    0.08222899]
  [-0.2924238   0.6052722   0.49968526 ...  0.8604137  -0.6533166
    0.5369075 ]
  [-0.7473459   0.49431565  0.7185162  ...  0.3848612  -0.74090636
    0.39056838]
  [-0.8741375  -0.21650358  1.338839   ...  0.5816864  -0.4373226
    0.56181806]]]
"""

print('\n ===== reloading and predicting =====\n')
model.save('test.model')
del model
model = keras.models.load_model('test.model')
print(model.predict([np.array([token_ids]), np.array([segment_ids])]))

猜你喜欢

转载自blog.csdn.net/weixin_42462804/article/details/105789913

bert4keras 测试代码可用性: 提取特征

transformer t5代码解读4(主要内容bert4keras实现t5模型)

Keras迁移学习提取特征

[文本语义相似] 基于bert的余弦距离(bert4keras实现)

win11 + tensorflow 1.14 + keras 2.3.1 + bert4keras 0.9.7

特征提取算法（4）——LoG特征提取算法

Google BERT模型提取句子Token特征

Bert提取句子特征(pytorch_transformers)

使用bert4keras出现的问题（Process finished with exit code -1073741819 (0xC0000005)）

脑电EEG代码开源分享【4.特征提取-时域篇】

脑电EEG代码开源分享【4.特征提取-空域篇】

脑电EEG代码开源分享【4.特征提取-时频域篇】

脑电EEG代码开源分享【4.特征提取-频域篇】

“用户体验及可用性测试”第4-6章-读书笔记

（4）图像特征提取算法：LBP特征

机器学习系列(4)_特征工程02特征提取

LBP特征提取原理及代码实现

FPN的Tensorflow代码详解——特征提取！

MFCC特征提取的MATLAB代码

可用性测试

【YOLOV4】(7) 特征提取网络代码复现（CSPDarknet53+SPP+PANet+Head），附Tensorflow完整代码

机器学习图像特征提取—SIFT特征提取原理及代码实现

机器学习图像特征提取—LBP纹理特征提取原理及代码实现

计算特征相关性的方法，特征提取的方法，如何判断特征是否重要

Keras迁移学习实现图像分类和特征提取

关于可用性测试

利用Flask写了一个代理IP提取接口，并附上电影下载站点刷分程序用于测试代理IP可用性

mid-level提取的特征更具判别性

feature_importances_提取特征重要性的应用

字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现

今日推荐

手把手教你用 LangChain 实现大模型 Agent

外星人入侵（python）

超全的免费chatGPT列表【建议收藏】

52.2k star! 自己部署gpt4free, 免费使用各种GPT

2024年（第十届）全国大学生统计建模大赛优秀论文解析——中国经济发展与碳排放库兹涅茨曲线的验证研究

【自动驾驶技术】自动驾驶汽车AI芯片汇总——NVIDIA篇

7个免费的ChatGPT网站，给大家送上

Angular v18 正式发布！

【VMware】 vCenter Converter standalone 6.6.0正式版下载

开源日报 | Angular v18；大模型价格战下的推理优化；Mistral AI以开源模型瞄准美国市场；硅谷有自己的鲁迅

数学建模Matlab之数据预处理方法

充电桩---ISO15118协议详细介绍

周排行

keepalived实现LB配置

数据库相关中间件收录集

Spring Boot 入门之 Web 篇（二） Spring Boot 入门之 Web 篇（二）

gitee 搭建个人网站

Java校招基础知识总结（横扫BAT,就业经验交流会演讲稿）

工程管理器

Delphi定位TDataSet数据集最后一条记录

cocos2dx笔记1:概述

Java实现 LeetCode 110 平衡二叉树

MacBook IDEA激活码

每日归档

更多

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)

2024-05-25(68)

2024-05-24(65)

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)