机器翻译 | 反向翻译 (back-translation) 笔记 - 代码天地

机器翻译 | 反向翻译 (back-translation) 笔记

其他 2020-06-24 10:48:25 阅读次数: 0

介绍

为了更好地利用目标语言单语语料, Improving Neural Machine Translation Models with Monolingual Data 提出了两种方式

假如有目标语言句子y, 将源语言对应的句子设置为空, 得到句对 (dummy, y), 加入到平行语料中进行训练. 这样在有平行句对和(dummy, y)句对的情况下, 训练翻译系统可以想想成翻译和语言模型多任务训练, 因为输入dummy, 使得y的概率最大, 实际上等价于训练一个语言模型.
反向翻译: 有了目标语言句子y, 用训练好的目标语言到源语言的翻译模型得到伪句对(x’, y), 加入到平行句对中一起训练. 因为y是高质量的单语语料, x‘可能包含一些UNK, 或者错误的句法等, 质量较差. 这样训练可以想像成去噪声训练的形式. 在有噪声的情况下, 训练x->y方向的翻译模型尽量能还能翻译好, 提升泛化性能.
使用时机: 一般先用高质量的句对训练好初始模型后, 然后将反向翻译的句对(x’,y)和训练语料混合, 再次训练.

实验文章

Understanding Back-Translation at Scale
实验性文章, 分析了在不同场景下反向翻译的表现

一般结论

反向翻译平均来讲能提升~2BLEU
在低资源情况下, 因为翻译模型的性能较差, 因此得到的句对(x’, y) 质量较差, 可能需要过滤一下才行
如果有跨领域的单语语料, 用反向翻译进行训练一下, 得到的模型跨领域表现会提升.

不同的采样方法的影响

得到句对(x’, y)可以有不同的采样方式

sampling: 直接从翻译模型中输入y, 采样得到一个x’
beam search: 根据beam search得到x‘, 这样x’的质量较高
beam + noise: 在beam search的过程中, 添加给token添加随机噪声
greedy: 根据输入y, 翻译时每一步采用最好的一个token, 翻译得到x’
top10: 根据输入y, 翻译时每一个在前10个最可能的token中采样得到下一个token

不同采样方式下, 平行语料较多的情况下, 反向翻译的效果如下图:

可以看出

反向翻译句对量增加的时候, 对最终翻译的效果有提升
带有噪音的采样方法效果好一些(beam+noise, sampling), 原因大致可以解释为去噪的影响, 噪声多了, 效果会好一些

注: 这是平行语料多的情况, 如果平行语料较少, 由于翻译模型的效果还不好, 得到的句对(x’, y)质量不高, 这时使用beam的方式反向翻译效果最好. 实际使用的时候, 可以结合过滤策略过滤掉一些质量不高的句对, 在保证noise较多的情况, 也保证质量不太差, 效果会更显著.

猜你喜欢

转载自blog.csdn.net/feifei3211/article/details/103344445

机器翻译 | 反向翻译 (back-translation) 笔记

【机器翻译machine translation】

NLP——Translation 机器翻译

机器翻译笔记

机器翻译（machine translation）相关

【笔记】机器翻译 Transformer代码笔记

Tensorflow 机器翻译NMT笔记 1 快速上手

基于Attention的机器翻译模型，论文笔记

BLEU机器翻译评价指标学习笔记

机器翻译

1401：机器翻译

机器翻译（模拟）

模拟机器翻译

机器翻译汇总

机器翻译论文

NMT 机器翻译

机器翻译（queue）

机器翻译（函数）

1540机器翻译

反向翻译back-translations

codevs 1067 机器翻译

NOIP 2010 机器翻译

机器翻译模型 Transformer

git help 机器翻译

NOIP-机器翻译

机器翻译数据集

机器翻译（queue,set）

496. 机器翻译

基于树模型的机器翻译《Forest-Based Neural Machine Translation》

【Machine Translation】基于短语&神经网络的无监督机器翻译

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)