paper解读：Dictionary-Guided Editing Networks for Paraphrase Generation - 代码天地

paper解读：Dictionary-Guided Editing Networks for Paraphrase Generation

其他 2020-07-23 12:22:57 阅读次数: 0

突发奇想，突然想把自己阅读后的paper整理下来，整理自己思路的同时也可以方便有需要的读者阅读，感觉这应该是个好习惯hhh…

今天要讲解的是谷歌在17年发表的关于复述生成的一篇论文:
Dictionary-Guided Editing Networks for Paraphrase Generation

什么是复述生成呢？简单来说就是一个句子经过复述后，跟原来的句子在表达形式上有所区别，但是表达的是相同的意思，而且复述的句子还要保证语法通顺。
举个例子：
原句子：“你很漂亮”；
复述句子：“你长得好好看”。

这篇论文的主要贡献为：在encoder-decoder框架中加入字典指导的编辑网络，如下图，右边的词或短语的复述对就是作者引入的外部信息：
在这里插入图片描述
第一步：检索

作者引入外部数据库：Paraphrase Database (PPDB)来获取词或短语的复述对；
使用Lucene工具在PPDB中检索原句子中词或短语的复述对（10倍复述对），然后对这些复述对进行排序，排序算法如下：

这里作者先使用Lucene工具默认的排序工具检索出10倍复述对，然后再使用自己的排序算法取出top M个复述对，排序算法第一项为原始词或短语的tfidf值，表征该短语的整个句子中的重要程度；第二项为复述对的得分函数，可以理解为两个复述短语的语义相似程度。

第二步：字典编码
得到原始句子x的复述对 $\varepsilon=\{(o_i,p_i)\}_{i=1}^M$ 之后，使用字典编码网络将 $\varepsilon$ 转换为表示向量：
在这里插入图片描述

第三步：字典指导的编辑模型

对于原始输入句子，作者使用BiRNN和标准的attention模型提取有效信息:
对于表示向量，作者使用soft attention来判断词是否删除或插入:

具体的soft attention模型如下：

通过 $c_t$ 向量来判断词是否删除或插入。

以上，就是整篇文章的大致流程，paper中的结构图如下：
在这里插入图片描述
但其实这个图作者是省略了一些步骤的，具体为隐藏层省略了一层，更具体的应该为：

画的有点丑，将就着看吧…

以上内容，若理解或表达有误，请不吝赐教！

猜你喜欢

转载自blog.csdn.net/Flying_sfeng/article/details/100711356

paper解读：Dictionary-Guided Editing Networks for Paraphrase Generation

paper解读：Decomposable Neural Paraphrase Generation

论文阅读 | Adversarial Example Generation with Syntactically Controlled Paraphrase Networks

UE Mesh Generation and Editing at Runtime

[codes] Writing Editing Networks Source Code Analysis

【论文笔记】Knowledge-Driven Encode, Retrieve, Paraphrase for Medical Image Report Generation (AAAI 2019)

【论文简介】2204.VQGAN-CLIP(已开源)：Open Domain Image Generation and Editing with Natural Language Guidance

【论文精读CVPR_2023】Collaborative Diffusion for Multi-Modal Face Generation and Editing

源码分析：《Topic-to-Essay Generation with Neural Networks》

论文分享摘要生成 Paper Abstract Writing through Editing Mechanism

[Read Paper] Maxout Networks

Waveform Modeling and Generation Using Hierarchical Recurrent Neural Networks for Speech Bandwidth Extension

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks 笔记

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks

Topic-to-Essay Generation with Neural Networks阅读笔记和部分实验

生成对抗网络中的样本生成（Sample Generation in Generative Adversarial Networks）

Scene Graph Generation by Iterative Message Passing解读

[论文解析] Null-text Inversion for Editing Real Images using Guided Diffusion Models

<Convolutional Neural Network for Paraphrase Identification>

ParaBLEU:Generative Pretraining for Paraphrase Evaluation

Deformable Convolutional Networks解读

Paper：《Generating Sequences With Recurrent Neural Networks》的翻译和解读

Paper：《Graph Neural Networks: A Review of Methods and Applications》翻译与解读

Paper | Densely Connected Convolutional Networks

Attribute-Guided Face Generation Using Conditional CycleGAN

Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs

【NQG】Paragraph-level Neural Question Generation with Maxout Pointer and Gated Self-attention Networks论文笔记

Paper Reading - Learning a Recurrent Visual Representation for Image Caption Generation

Cascaded Diffusion Models for High Fidelity Image Generation (Paper reading)

解读 intriguing properties of neural networks

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)