从bert到XLnet - 代码天地

从bert到XLnet

其他 2020-02-22 22:17:28 阅读次数: 0

1、ELmo与双向lstm

2、bert 模型的特点

3、permutation 与XLnet模型介绍

unsupervised learning

1、easily get lots of unlabeled data；2、labeling

non-contexuailized techniques eg.skipgram cbow glove

contexualized techniques eg.elmo bert xlnet

Denoising auto encoder 去噪自动编码器，深度学习模型——学出图片或数据更有效的表示，

DAE在训练中加入噪声，提高模型健壮性

2、auto_regressive vs auto_encoding

自回归：elmo，product role 优点：保持一致性，考虑词的依赖关系；缺点：单向的，不同同时考虑双边

自动编码： bert , mask一些单词，基本独立假设 bert存在的问题：independent assumption 优点：考虑了双向的关系；缺点：非独立假设；2、train和 test 之间存在的不一致性；

3、permutation language model 排列语言模型

基于elmo考虑双向问题进行改造。answer：consider all possibel factorization

随机采样一定序列，attention mask，把词的顺序混排进模型(类似于数据增强，不改造模型，从数据输入上改造）；

二、已知向量的信息，知道向量的位置，结合两个信息

VAE详细解读：variable autoencoder

推荐课程：NLP高阶免费课程，NLP与知识图谱高阶免费课程

NLP优质博客：http://jalammar.github.io

猜你喜欢

转载自www.cnblogs.com/Christbao/p/12347501.html

从bert到XLnet

从BERT, XLNet, RoBERTa到ALBERT

从BERT、XLNet到MPNet，细看NLP预训练模型发展变迁史

XLNet与BERT以及语言模型的对比

BERT，XLNET分词方法bpe，unigram等介绍

XLnet

XLNet：运行机制及和Bert的异同比较

Transformer 和 Transformer-XL——从基础框架理解BERT与XLNet

Bert&XLNet&XLM等NLP模型架构如何快速实现？

什么是XLNet，它为什么比BERT效果好？

Bert不完全手册4. 绕开BERT的MASK策略？XLNET & ELECTRA

从Attention到BERT

从transformer 到 Bert

Transformer 到bert 模型

Transformer, BERT, ALBERT, XLNet全面解析(ALBERT第一作者亲自讲解）

最新语言表示学习方法XLNet，在20项任务上超越BERT

预训练模型小结：XLNet\Transformer-xl\Bert\GPT\ELMo

最火的几个全网络预训练模型梳理整合（BERT、ALBERT、XLNet详解）

BERT架构——从开始到放弃

百度ERNIE 2.0强势发布！16项中英文任务表现超越BERT和XLNet

[深度学习]从Attention到Transformer到BERT

从 Word Embedding 到 Bert：一起肢解 Bert！

Bert详解(1)---从WE、ELMO、GPT到BERT

XLNet and Robertra

XLNet 详解

XLNet理解

自然语言处理 - Transformer 到 BERT

Transformers回顾：从BERT到GPT4

nlp模型-bert从入门到精通（一）

nlp模型-bert从入门到精通（二）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)