论文阅读 | Shared-Private Bilingual Word Embeddings for Neural Machine Translation - 代码天地

论文阅读 | Shared-Private Bilingual Word Embeddings for Neural Machine Translation

其他 2020-04-21 22:50:51 阅读次数: 0

论文地址： https://www.aclweb.org/anthology/P19-1352/

作者：Xuebo Liu, Derek F. Wong, Yang Liu, Lidia S. Chao, Tong Xiao, Jingbo Zhu

机构：澳门大学，清华大学，东北大学

研究的问题：

研究翻译任务中词向量的问题。传统的端到端模型中，源语言词向量和目标语言词向量是通过soft attention机制建立联系的，它们相对隔离且参数量大。本文提出利用共享-私有的词向量来建模源语言词向量和目标语言词向量之间的关系，同时减少了参数量。

研究方法：

核心思想：在单词向量空间中，相似的词在词向量上往往具有相似性，这一点已经在很多工作中证明。本文基于这一点，假设在源语言和目标语言中，表示相同意思的词也具有相似的向量，也就是说这部分是与语言无关的，可以共享；而另外一部分，作为私有向量，保留源语言和目标语言的私有特征。

方法：

首先，作者这里对源语言中的词和目标语言之间的词的关系做了分类：

（1）词义相近（记为lm）

（2）词形相近（记为wf）

（3）不相关（记为ur）

源语言中的词和目标语言之间的词之间的约束如下：

（1）一个源语言中的词只能和一个目标语言之间的词共享特征，反之亦然。

（2）每个源语言中的词的匹配优先级是词义相近大于词形相近大于不相关

在实现上，首先利用fast-align根据一定的阈值找到语义对齐的词语，设源语言的词向量矩阵为，这个矩阵由三部分组成：

其分别代表前述三种共享关系的词语表示。由于前边的约束，每个词语只属于其中一种关系。而每种共享关系都是由共享部分和私有部分组成的。如

其中，S_lm表示共享部分，P_lm表示私有部分。运算符表示的是矩阵的拼接。示例如下：

实验结果如下：

评价：

从词向量的表示上入手，提高机器翻译的质量，从结果来看提升比较明显。相较于之前的WT方法，在参数量上更有优势。在实现中，使用的是矩阵拼接，这个操作本身的计算复杂度也比较低。

猜你喜欢

转载自www.cnblogs.com/bernieloveslife/p/12748538.html

论文阅读 | Shared-Private Bilingual Word Embeddings for Neural Machine Translation

Unsupervised Bilingual Word Embedding Agreement for Unsupervised Neural Machine Translation

论文阅读：《Neural Machine Translation by Jointly learning to Align and Translation》

【论文阅读】Neural Machine Translation by Jointly Learning to Align and Translate

论文阅读笔记|NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

论文阅读：《Google's Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation》

NEURAL MACHINE TRANSLATION

【论文阅读】Topical Word Embeddings

Tied Transformers: Neural Machine Translation with Shared Encoder and Decoder

Neural Machine Translation by Jointly Learning to Align and Translate阅读笔记

[文献阅读]—Unsupervised Neural Machine Translation with Universal Grammar

[文献阅读]—When and Why is Unsupervised Neural Machine Translation Useless?

【RNNsearch】neural machine translation by jointly learning to align and translate阅读与思考

【论文】on the properties of neural machine translation :Encoder-decoder approaches 阅读笔记

论文阅读（三）：Text2Sign: Towards Sign Language Production using Neural Machine Translation and GAN

论文阅读：Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation

【论文笔记】Neural Machine Translation by Jointly Learning to Align and Translate

论文解读：Semantic Neural Machine Translation using AMR

论文解读：Selective Attention for Context-aware Neural Machine Translation

论文解读：DTMT: A Novel Deep Transition Architecture for Neural Machine Translation

《Neural Machine Translation in Linear Time》

Paper Summary: Neural Machine Translation

[文献阅读]—Improving Massively Multilingual Neural Machine Translation and Zero-Shot Translation

[文献阅读]——Google’s Multilingual Neural Machine Translation System: Enabling Zero-Shot Translation

Artetxe - 弱监督双语词嵌入学习Learning bilingual word embeddings with (almost) no bilingual data

论文阅读：Dual Learning for Machine Translation

Neural+machine+translation+with+attention+-+v3

Phrase-Based & Neural Unsupervised Machine Translation

Low-resource Neural Machine Translation

Sequence Models Week 3 Neural Machine Translation

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)