ACL2019论文阅读 - 代码天地

ACL2019论文阅读

其他 2020-04-11 19:34:14 阅读次数: 0

Integrating Weakly Supervised Word Sense Disambiguation into Neural Machine Translation

一篇关于机器翻译的论文，目的是是将词义信息加到机器翻译模型中，以此缓解机器翻译模型对于多义词翻译不准确的问题。

引入的方法很简单，输入机器翻译模型的word emebdding将由常规的word embedding和词义embedding拼接而成，让模型对单词的词义敏感。问题有两个：

1 每个单词不同词义embedding从哪里来

2 对于某一个token，如何确定使用哪个词义embedding

对于第一个问题，该论文通过wordnet获取单词w的词义描述以及使用该词的example，将词义描述或者example里的单词进行embedding，再取平均就作为每个词义的初始embedding。对于词义描述和example处理方式略有不同。词义描述使用其中所有单词的embedding的平均，而example则是选择单词w左右窗口内的词的embedding做平均，原因是example可能是很长的句子，把这个句子所有的词考虑进来会带来很多噪音。有的词义的初始centroid embedding，接下来就是对词义进行聚类进而达到词义消歧的目的。聚类的方法论文中采用的三种，例如k-means等等。首先会在源语言句子中抽取单词w的片段，例如预设一个窗口，这个窗口内的单词（除去停用词）的emebdding的平均作为w的候选词义embedding。然后根据初始centroid embeddings对所有候选词义embedding做聚类。聚类的k可有wordnet中对于单词w保存的词义个数来确定。

对于第二个问题，就是简单的和对应的多个词义embedding做相似度计算，选择最相似的。也可以通过相似性算的每个词义的权重，再根据这个权重对所有词义embedding做带权平均。

猜你喜欢

转载自www.cnblogs.com/zhuangliu/p/12681645.html

ACL2019论文阅读

论文阅读 | ACL2019 Chinese Relation Extraction with Multi-Grained Information and External Linguistic Knowledge

论文阅读 | ACL2019 Exploring Pre-trained Language Models for Event Extraction and Generation

论文阅读9-Fine-tuning Pre-Trained Transformer Language Models to(远程监督关系抽取,ACL2019,GPT,长尾关系,DISTRE）

论文阅读课2-Inter-sentence Relation Extraction with Document-level （GCNN，句间关系抽取，ACL2019

论文阅读课1-Attention Guided Graph Convolutional Networks for Relation Extraction（关系抽取，图卷积,ACL2019，n元）

Cognitive Graph for Multi-Hop Reading Comprehension at Scale(ACL2019) 阅读笔记与源码解析

论文笔记 Entity-Relation Extraction as Multi-turn Question Answering | ACL2019

ACL2019 Latex 编辑错误总结

ACL2019|巧用文本语境信息：基于上下文感知的向量优化

[ACL2019 Best Paper] Bridging the Gap between Training and Inference for Neural Machine Translation

【ACL2019】利用关联词与关系词的对应性，通过标签嵌入识别隐性话语关系

CVPR && ICCV 2019 论文阅读

【论文阅读】时序动作检测系列论文精读（2019年）

【论文阅读ACL2020】Leveraging Graph to Improve Abstractive Multi-Document Summarization

《论文阅读》连续前缀提示Prompt：table-to-text和摘要生成 ACL2021

Discrete Opinion Tree Induction for Aspect-based Sentiment Analysis论文阅读笔记（ACL2022）

《论文阅读》DiaASQ：基于会话方面的情感四重分析的基准 ACL2023

【论文阅读】一些多轮对话文章的体会 ACL 2023

ACL论文集

注意力机制可解释吗？这篇ACL 2019论文说……

cvpr2019论文汇总（论文/代码/项目/论文阅读）

2019论文阅读3:Actor and Action Video Segmentation from a Sentence

#ICCV2019论文阅读#Fully_convolutional_Features

多目标跟踪：CVPR2019论文阅读

【论文阅读SIGCOMM2019】Neural packet classification

快速人体姿态估计：CVPR2019论文阅读

2019-ICLR-DARTS: Differentiable Architecture Search-论文阅读

【论文阅读 - AAAI 2019】Abstractive Summarization: A Survey of the State of the Art

ICCV 2019 | ACNet论文阅读分析（keras实现）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)