论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution - 代码天地

论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution

其他 2020-04-19 23:01:28 阅读次数: 0

论文地址：https://arxiv.org/abs/1902.01541

已有的研究工作：

本文关注的是文献的实体解析问题，当前的state-of-art是mention-pair模型，但是该方法在计算和标记数据方面的成本都比较高。

本文的工作和创新点：

本文提出了一种以增量方式处理文本、动态解析引用的模型，是一种在线学习方法。

研究方法：

工作原理：

自左向右地读取文本，在一个固定大小的工作内存中存储实体，当遇到每个token时，有三种选择：将该token链接到现有的内存中，从而创建一个共同的指代链接；存储一个新的实体，覆盖到现有的内存中；忽视这个token并且继续向前阅读。下图显示的是具有两个内存单元的模型的工作示意。

模型简介：

对于一个给定的文档，在两个层级上表示文本，分别是token级别和entity级别。模型包括两个组件，分别是存储单元，用于存储和跟踪文本中实体的状态；循环单元，通过一组门来控制记忆。下图是模型的概述。

对于循环单元，它的灵感来源于Coreferential-GRU。使用外部存储单元来跟踪实体，让模型学习在每个单元中存储什么，而不是依赖于参照结构来构建动态计算图。其更新方式如下：

Ct也就是衡量当前token在记忆网络中重要性的一个门。

对于内存单元，它是一个标量的集合，表示的是在某个token处更新或重新某个实体。

实验部分：

实验在GAP数据集上进行，任务是在文本中正确跟踪实体引用的能力。从结果来看，实验所取得的效果相当好。

评价：

本文做的是文档中实体解析的问题，也就是在本文中正确地跟踪引用的实体。从实验结果来看，提升还是比较明显的。尤其在使用BERT建模的方法取得的提升相当明显，然而BERT的建模是双向的，利用了未来的信息，因此并不能说是纯粹的以增量的方式来更新。但也提醒，未来的工作可以与大规模预训练的一些模型和方法相结合。

猜你喜欢

转载自www.cnblogs.com/bernieloveslife/p/12734776.html

论文阅读 | The Referential Reader: A Recurrent Entity Network for Anaphora Resolution

【论文阅读】Recurrent Back-Projection Network for Video Super-Resolution(RBPN)

记忆网络系列之Recurrent Entity Network

论文《Chinese Poetry Generation with Recurrent Neural Network》阅读笔记

【论文阅读】Frame-Recurrent Video Super-Resolution (FRVSR2018超分)

DSRN——Image Super-Resolution via Dual-State Recurrent Network

视频超分：RBPN（Recurrent Back-Projection Network for Video Super-Resolution）

视频超分：RSDN（Video Super-Resolution with Recurrent Structure-Detail Network）

2020ECCV VSR Video Super-Resolution with Recurrent Structure-Detail Network

论文阅读 | Revisiting Joint Modeling of Cross-document Entity and Event Coreference Resolution

论文阅读笔记 | (CVPR 2017 Oral) Recurrent Attention Convolutional Neural Network（RA-CNN）

『论文阅读』Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling

【论文阅读】A Dual-Stage Attention-Based Recurrent Neural Network

Deep Learning专栏--FFM+Recurrent Entity Network的端到端方案

实体-关系联合抽取：Table Filling Multi-Task Recurrent Neural Network for Joint Entity and Relation Extraction

论文阅读之《Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network》

【论文阅读】Second-order Attention Network for Single Image Super-Resolution

【论文阅读】Transformer Neural Network for Weed and Crop Classification of High Resolution UAV Images

Scale-recurrent Network for Deep Image Deblurring 阅读理解

论文笔记：DRAW: A Recurrent Neural Network For Image Generation

VSR论文笔记四|Frame-Recurrent Video Super-Resolution

文献阅读 An implementation of the seismic resolution enhancing network based on GAN

Recurrent Neural Network

Independently Recurrent Neural Network

Training Recurrent Neural Network

recurrent_network

Recurrent nural network

论文翻译：Speech Super Resolution Generative Adversarial Network

Recurrent Pixel Embedding for Instance Grouping论文阅读

Recurrent Neural Network(1):Architecture

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)