《ICLR 2020论文分享-BERT在神经机器翻译中的应用》

其他 2020-05-25 13:28:13 阅读次数: 0

https://www.bilibili.com/video/BV1Ep4y1Q71p

活动作品ICLR 2020论文分享-BERT在神经机器翻译中的应用

要解决的问题：

- 直接用预训练的结果

- BERT训练和NMT任务的分词方式不一样，引起句子长短不一样

- BERT双向，decoder 单向 —— BERT作为embedding输入，不适用于decoder 端；

原 Transformer 中的 self-attention 是 Warm-up的——一用一个训练到收敛的模型的参数初始化

红线 BERT attention 随机初始化

drop-out 率 p 增大，训练loss 会变大，但 validation loss 会变小

效果超过了其它：精心设计的模型结构 & NAS 搜索出来的模型结构

IWSLT是连续文档切分成句子组成的数据集，所以我们猜测：BERT对文档级的翻译有帮助

（左下角）

tune BERT 的参数，效果会变差

两部分 attention 并排比 stack，效果更好

从BERT中汲取到了对翻译有用的信息，并不是单纯引入了更多的参数带来的效果

猜你喜欢

转载自www.cnblogs.com/cx2016/p/12956295.html

《ICLR 2020论文分享-BERT在神经机器翻译中的应用》

一种镜像生成式机器翻译模型：MGNMT | ICLR 2020满分论文解读

Deformable DETR（2020 ICLR）

Poly-encoders（2020 ICLR）

论文阅读：ICLR 2020 图神经网络论文

ICLR 2020 九篇满分论文！！！

ICLR 2020 | 神经网络架构搜索（NAS）论文推荐

ICLR 2020 图神经学习论文汇总

ICLR 2019 论文排名列表

ICLR2019论文选读

ICLR2018 GNN GAT论文解读

ICLR 2019论文解读：量化神经网络

ICLR 2020共计198篇开源代码论文目录！

【飞桨】GAN：U-GAT-IT【2020 ICLR】论文研读

ICLR 2024中Video Diffusion Models相关论文

《ICLR 2020趋势分析：NLP中更好&更快的Transformer》

ICLR 2019高分论文抢先看，谁是第一？

[论文笔记][ICLR-2019] Slimmable Neural Networks

爬取ICLR历年论文并制作词云

ICLR 2019最佳论文出炉：微软、MILA、MIT获奖

2017-ICLR-Neural Architecture Search with Reinforcement Learning 论文阅读

2019-ICLR-DARTS: Differentiable Architecture Search-论文阅读

干货！ICLR 2023 强化学习论文合集

ICLR 2020 | GAN是否真的判断出了数据的真假？

ICLR 2020，Nesterov Accelerated Gradient and Scale Invariance for Adversarial Attacks

ICLR2024丨Simulation在ICLR-2024全线溃败？18篇Simualtion & Agent相关论文合集

阿里巴巴达摩院ICLR 2020论文：从群体动态中认知个体

BERT在CNN上也能用？看看这篇ICLR Spotlight论文丨已开源

使用大batch优化深度学习：训练BERT仅需76分钟 | ICLR 2020

ICLR 2019最佳论文揭晓！NLP深度学习、神经网络压缩夺魁 | 技术头条

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)