[NLP]AR模型与AE模型 - 代码天地

[NLP]AR模型与AE模型

其他 2020-03-01 23:17:32 阅读次数: 0

AR语言模型(AutoRegressive LM)：只能获取单向信息，即只能前向读取信息并预测t位置的单词或者从后向读取信息并预测t位置的单词，却不能同时获取双向信息，代表例子是GPT，GPT2，XLNet，ELMO

AR LM的优点：比较擅长生成类任务
缺点：只能获取单向信息，不能获取双向信息。

AE语言模型(AutoEncoder LM):获取双向信息进行预测，如想要预测位置t的单词，既可以前向获取信息也可以后向获取信息，代表例子是Bert

AE LM的优点：可以获取双向信息，能同时看到预测位置的上文和下文
缺点：如bert，它在预训练过程中会增加输入噪声，如对输入序列会随机mask掉一部分的单词，而在微调时却不会增加输入噪声，这种预训练-微调步骤中产生的差异，会产生一部分的人为误差

猜你喜欢

转载自www.cnblogs.com/mj-selina/p/12392839.html

[NLP]AR模型与AE模型

NLP领域中两种语言模型AR(AutoRegressive Language Modeling)和AE(AutoEncoding Language Modeling)

NLP模型

AR模型原理

自回归AR模型

nlp 统计语言模型

NLP语言模型

最强NLP模型-BERT

NLP（四）：语言模型

【NLP】CTR预估模型

【NLP】Transformer模型解读

NLP模型之NNLM

NLP -- 词嵌入模型

NLP -- 主题模型

NLP之语言模型

[NLP]Transformer模型解析

NLP模型集锦----pynlp

NLP《语言模型》

nlp(2)语言模型

nlp比赛常用模型

NLP（三）——语言模型

时间序列分析 AR模型

AR+Vuforia+模型操作

时间序列分析-AR模型

AR模型及其平稳性

平稳AR模型的统计性质

CRF模型在NLP中的运用

NLP --- 最大熵模型的引入

NLP预训练语言模型

NLP中的主题模型理解

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)