AMBERT！超越BERT！多粒度token预训练语言模型

其他 2020-09-21 12:03:58 阅读次数: 0

AMBERT: A PRE-TRAINED LANGUAGE MODEL WITH MULTI-GRAINED TOKENIZATION

1. 之前的BERT还存在什么问题？

归纳：即BERT中的token采取的是细粒度的，这种细粒度无法解决英语中的“多词表达形式（如 ice creaming； New York，这些多词表达分开的意思和真正的意思相去甚远）”

2. 作者的解决方案

在本文中，我们提出了一个多粒度的BERT模型(AMBERT)，它同时使用了细粒度和粗粒度标记。对于英语，AMBERT通过使用两个编码器同时构造输入文本中的单词和短语的表示来扩展BERT。确切地说，AMBERT首先在单词和短语级别上进行标记化。然后，它将单词和短语的嵌入作为两个编码器的输入。它在两个编码器中使用相同的参数。最后，它在每个位置上分别获得该词的上下文表示和该短语的上下文表示。注意，由于参数共享，AMBERT中的参数数目与BERT中的参数数目相当。AMBERT可以在单词级和短语级表示输入文本，以利用这两种标记方法的优点，并在多个粒度上为输入文本创建更丰富的表示

3 作者贡献（创新点）

多粒度预训练语言模型的研究
提出一种新的被称为AMBERT的预训练语言模型作为BERT的扩展，它利用了多粒度的token和共享的参数
AMBERT在英文和中文基准数据集GLUE, SQuAD, RACE，和CLUE上的实证验证。

具体可参考专知链接和论文：https://www.zhuanzhi.ai/vip/bc6b030cfb7f96c81f1eb5440fcb7f94
论文地址

猜你喜欢

转载自blog.csdn.net/qq_40199232/article/details/108333383

AMBERT！超越BERT！多粒度token预训练语言模型

预训练语言模型 | (3) Bert

【深度学习】预训练语言模型-BERT

预训练语言模型（GPT，BERT）

超越时空：加速预训练语言模型的训练

Bert 之后：预训练语言模型与自然语言生成

bert 预训练模型路径

谷歌官宣：全面超越人类的最强NLP预训练模型BERT开源了！

【视频】超越BERT的最强中文NLP预训练模型艾尼ERNIE官方揭秘

预训练语言表达模型之BERT

预训练语言模型的前世今生 - 从Word Embedding到BERT

【NLP】1、BERT | 双向 transformer 预训练语言模型

ICML 2019：序列到序列自然语言生成任务超越BERT、GPT！微软提出通用预训练模型MASS | 技术头条...

预训练语言模型中Transfomer模型、自监督学习、BERT模型概述（图文解释）

BERT 预训练模型及文本分类

BERT与其他预训练模型

pytorch的bert预训练模型下载

BERT 模型预训练流程简单认识

Bert模型预训练和微调

基于Pytorch+Bert的预训练模型

BERT预训练模型系列总结

预训练bert模型保存与读取

【BERT类预训练模型整理】

自然语言处理中的语言模型预训练方法（ELMo、GPT和BERT）

【自然语言处理NLP】Bert预训练模型、Bert上搭建CNN、LSTM模型的输入、输出详解

Bert-一种基于深度双向Transform的语言模型预训练策略

自然语言处理-预训练模型BERT的发展现状

Gavin老师Transformer直播课感悟 - BERT语言模型内部机制及预训练解析

NLP文本分类pytorch框架-支持Bert等预训练语言模型

【自注意力机制必学】BERT类预训练语言模型（含Python实例）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)