【深度学习】BERT变体—BERT-wwm - 代码天地

【深度学习】BERT变体—BERT-wwm

企业开发 2023-04-07 21:47:46 阅读次数: 0

1.BERT-wwm

1-1 Whole Word Masking

Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本，主要更改了原预训练阶段的训练样本生成策略。

原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词，在生成训练样本时，这些被分开的子词会随机被mask。在Whole Word Masking (wwm)中，如果一个完整的词的部分WordPiece子词被mask，则同属该词的其他部分也会被mask。这缓解了在训练前 BERT 中屏蔽部分 Wordpiece 分词的缺点。

2.Chinese-BERT-wwm

2-1 中文BERT-WWM

2019年哈工大和科大讯飞联合发表中文BERT-WWM模型的论文，使用中文文本对整个单词进行掩蔽，即屏蔽整个单词而不是屏蔽汉字。由于谷歌官方发布的BERT中，中文以字粒度进行切分，没有考虑到传统NLP中的中文分词。 Chinese-BERT-wwm将 Whole Word Mask的方法应用在了中文中，使用了中文维基百科（包括简体和繁体）进行训练，并且使用了哈工大LTP作为分词工具，即对组成同一个词的汉字全部进行Mask。

2-2 样例

3.总结

BERT-WWM对Bert的改进主要体现在mask的方式上，使用全词mask。

其改进点如下：BERT-WWM不仅仅是连续mask实体词和短语，而是连续mask所有能组成中文词语的字。具体做法是，针对中文，如果一个完整的词的部分字被mask，则同属该词的其他部分也会被mask，即对组成同一个词的汉字全部进行Mask，即为全词Mask。

这样做的目的是：预训练过程中，模型能够学习到词的语义信息，训练完成后字的embedding就具有了词的语义信息了，这对各类中文NLP任务都是友好的。

猜你喜欢

转载自blog.csdn.net/weixin_44750512/article/details/129263935

【深度学习】BERT变体—BERT-wwm

【深度学习】BERT变体—SpanBERT

【深度学习】BERT变体—ALBERT

【深度学习】BERT变体—RoBERTa

Bert经典变体学习

RoBERTa、ERNIE2、BERT-wwm-ext和SpanBERT

BERT

[深度学习]从Attention到Transformer到BERT

【深度学习】预训练语言模型-BERT

深度学习(十一) BERT 理论部分

【深度学习】Sentence Embedding-BERT-Flow

【深度学习】Sentence Embedding-BERT-Whitening

NLP实战：Pytorch实现6大经典深度学习中文短文本分类-bert+ERNIE+bert_CNN+bert_RNN+bert_RCNN+bert_DPCNN

BERT模型深度解析

深入理解深度学习——BERT派生模型：ALBERT（A Lite BERT）

深入理解深度学习——BERT（Bidirectional Encoder Representations from Transformers）：BERT的结构

深入理解深度学习——BERT派生模型：RoBERTa（A Robustly Optimized BERT Pretraining Approach）

学习笔记：深度学习（8）——基于PyTorch的BERT应用实践

torchserve部署 OSError: Model name ‘E:/pretrained_models/chinese-bert-wwm-ext‘ was not fou

Bert由来、原理、学习

keras-bert学习

BERT 学习笔记

Bert学习资料

Bert模型的学习之路

bert模型学习随笔

Bert学习笔记

Bert 模型学习

【学习】domain adaptation、BERT

深度学习：Transformer模型进阶-GPT模型和Bert模型

深度学习-nlp系列（2）文本分类（Bert）pytorch

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)