知识图谱-远程监督关系提取

其他 2018-11-04 17:01:40 阅读次数: 0

1. 前言

今天介绍一片2017年的论文《Distant Supervision for Relation Extraction with Sentence-level Attention and Entity Deions》，这篇论文主要是介绍通过句子层面的注意力和实体知识来提高远程监督抽取关系的准确度。

2. 原理介绍

关系抽取的远程监督方法通过知识库与非结构化文本对其的方式，自动标注数据，解决人工标注的问题。但是，现有方法存在无法选择有效的句子、缺少实体知识的缺陷。

无法选择有效的句子是指模型无法判断关系实例对应的句子集（bag）中哪个句子是与关系相关的，在建模时能会将不是表达某种关系的句子当做表达这种关系的句子，或者将表达某种关系的句子当做不表达这种关系的句子，从而引入噪声数据。
缺少实体知识，例如“[Nevada] then sanctioned the sport , and the U.F.C. held its first show in [Las Vegas] in September 2001. ”如果不知道 Nevada 和 Las Vegas 是两座城市，则很难判断他们知识是地理位置上的包含关系。

论文的主要方法分为三部分：句子特征提取、实体表示和bag特征提取。

2.1 句子特征提取

句子特征提取结构如下：

使用词向量和位置向量相连接作为单词表示，句子的词表示序列作为模型的输入；
使用卷积神经网络对输入层提取特征，然后Piecewise Max-pooling，形成句子的特征表示。

Piecewise Max-pooling：传统的max-pooling的作用是提取最重要的特征，而Piecewise Max-pooling是把向量分为几段，然后分别提取每段的max特征，方便捕捉更多的特征信息，给后面微调提供支持。

2.2 实体表示

实体表示在词向量的基础上，使用实体描述信息对向量表示进行调整，形成最终的实体向量表示。最终的实体向量 = 实体表示词向量 + 实体描述信息

模型主要思想是，使用CNN对实体的描述信息进行特征提取，得到的特征向量作为实体的特征表示，模型的训练目标是使得实体的词向量表示和从描述信息得到的实体特征表示尽可能接近。

2.3 bag特征提取

bag特征提取模型的关键在句子权重学习，在得到bag中每个句子的权重后，对bag中所有句子的特征向量进行加权求和，得到bag的特征向量表示。

bag特征提取模型如下图：

模型中用到了类似TransE的实体关系表示的思想：\(e_1+r=e_2\)。使用\(r=e_2-e_1\)作为实体间关系信息的表达，与句子特征向量相拼接，进行后续的权重学习。

扫描二维码关注公众号，回复： 3928259 查看本文章

使用bag中的所有句子的特征向量表示，结合\(r=e_2-e_1\)方式得到的关系表示，作为模型的输入。
利用attention机制学习权重矩阵，得到每个句子的权重。
对句子进行加权求和，得到bag的最终表示。

3. 总结

这篇论文在当时提时是SOTA的表现。总结下论文的主要内容。

引入句子层面的注意力模型来选择一个bag中的多个有用的句子，从而充分利用bag中的有用信息。
使用实体描述来为关系预测和实体表达提供背景信息。

（欢迎转载，转载请注明出处。欢迎沟通交流： [email protected]）

猜你喜欢

转载自www.cnblogs.com/huangyc/p/9904573.html

知识图谱-远程监督关系提取

知识图谱-关系挖掘

中文人物关系知识图谱（含码源）：中文人物关系图谱构建、数据回标、基于远程监督人物关系抽取、知识问答等应用.

知识图谱学习(一)：知识提取

知识图谱-知识提取-deepdive与postgresql

基于知识图谱推理的关系推演

知识图谱之关系抽取

【知识图谱】知识图谱实体链接无监督学习框架

知识图谱-知识提取-py2neo使用

【知识图谱系列合集】一、知识提取

知识图谱( 知识图谱管理)

知识图谱（知识图谱构建）

知识图谱_关系抽取调研_文献笔记

机器不学习：基于知识图谱推理的关系推演

知识图谱_关系抽取_文献笔记（二）

2.2-知识图谱中语义关系设计

知识图谱之关系抽取代码实战

知识图谱中传统关系抽取方法

知识图谱关系抽取之PCNN——tensorflow实现

知识图谱入门学习笔记（六）-关系抽取

动手学关系抽取-知识图谱基础篇

基于 Nebula Graph 构建百亿关系知识图谱实践

echarts 力向导图_关系图_知识图谱

知识图谱实战应用8-从文本关系抽取到知识图谱关系构建流程贯通

知识图谱建模

前端知识图谱

JAVA知识图谱

nginx知识图谱

知识图谱概述

知识图谱的应用

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)