keras-bert学习 - 代码天地

keras-bert学习

其他 2019-04-11 22:36:35 阅读次数: 0

TOKEN_PAD = ''                   # Token for padding               填充标记
TOKEN_UNK = '<UNK>'              # Token for unknown words         未登录词标记
TOKEN_CLS = '<CLS>'              # Token for classification        分类标记
TOKEN_SEP = '<SEP>'              # Token for separation            分隔符标记
TOKEN_MASK = '<MASK>'            # Token for masking               掩蔽标记

token_dict = get_base_dict()
print(token_dict)
# {'': 0, '<UNK>': 1, '<CLS>': 2, '<SEP>': 3, '<MASK>': 4}
# len(token_dict) = 5

example01：
sentence_pairs = 
[
    [['all', 'work', 'and', 'no', 'play'], ['makes', 'jack', 'a', 'dull', 'boy']],
    [['from', 'the', 'day', 'forth'], ['my', 'arm', 'changed']],
    [['and', 'a', 'voice', 'echoed'], ['power', 'give', 'me', 'more', 'power']]
]

for pairs in sentence_pairs:
    for token in pairs[0] + pairs[1]:
        if token not in token_dict:
            token_dict[token] = len(token_dict)   # 未添加 token 前，token_dict 字典的长度
token_list = list(token_dict.keys())              # 用于随机选择一个单词
print(token_list)
# ['', '<UNK>', '<CLS>', '<SEP>', '<MASK>', 'all', 'work', 'and', 'no', 'play', 'makes', 'jack', 'a', 'dull', 'boy', 'from', 'the', 'day', 'forth', 'my', 'arm', 'changed', 'voice', 'echoed', 'power', 'give', 'me', 'more']
print(list(token_dict.values()))
# [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27]

https://github.com/CyberZHG/keras-bert/

猜你喜欢

转载自blog.csdn.net/s1162276945/article/details/88368268

keras-bert学习

NLP（三十四）使用keras-bert实现序列标注任务

NLP（四十四）使用keras-bert加载BERT模型的两种方法

[Python人工智能] 三十三.Bert模型 (2)keras-bert库构建Bert模型实现文本分类

NLP（三十九）使用keras-bert实现完形填空及简单的文本纠错功能

NLP（三十七）使用keras-bert实现英语序列标注任务

NLP（三十六）使用keras-bert实现文本多标签分类任务

NLP（三十五）使用keras-bert实现文本多分类任务

NLP（三十八）使用keras-bert调用ALBERT模型实现文本分类、文本多标签分类、序列标注任务

BERT实战——基于Keras

用keras优雅的使用bert

[深度学习] 自然语言处理--- 基于Keras Bert使用（上）

BERT文本分类实践Keras

Keras 实现对bert编码的封装实现

BERT+CRF命名实体识别的主动学习实现，支持中英文（基于Keras）

Keras 学习-Keras后端

【深度学习】BERT变体—BERT-wwm

Bert由来、原理、学习

BERT 学习笔记

Bert学习资料

Bert模型的学习之路

bert模型学习随笔

Bert学习笔记

Bert 模型学习

【学习】domain adaptation、BERT

Bert经典变体学习

keras学习

基于tensorflow keras的simcse训练以及bert相关知识

让chatGPT使用Tensor flow Keras组装Bert,GPT,Transformer

[文本语义相似] 基于bert的余弦距离(bert4keras实现)

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)