目前主要采用统计机器学习的方法，将关系实例转换成高维空间中的特征向量或直接用离散结构来表示，在标注语料库上训练生成分类模型，然后再识别实体间关系 

基于特征向量方法

最大熵模型(Kambhatla 2004)和支持向量机 (Zhao et al., 2005；Zhou et al., 2005; Jiang et al., 2007)等

主要问题：

如何获取各种有效的词法、句法、语义等特征，并把它们有效地集成起来，从而产生描述实体语义关系的各种局部特征和简单的全局特征

从自由文本及其句法结构中抽取出各种表面特征以及结构化特征
实体词汇及其上下文特征
实体类型及其组合特征
实体参照方式
交叠特征
基本短语块特征
句法树特征

浅层树核（Zelenko et al., 2003)、依存树核（ Culotta et al., 2004)、最短依存树核（Bunescu et al., 2005)、卷积树核（Zhang et al., 2006；Zhou et al., 2007）

如何有效挖掘反映语义关系的结构化信息及如何有效计算结构化信息之间的相似度

用两个句法树之间的公共子树的数目来衡量它们之间的相似度

在计算两棵子树的相似度时，只考虑子树本身，不考虑子树的上下文信息

在计算子树相似度量，同时考虑子树的祖先信息，如子树根结点的父结点、祖父结点信息，并对不同祖先的子树相似度加权平均
基于神经网络的方法

递归神经网络（ Socher et al., 2012)、基于矩阵空间的递归神经网络（ Socher et al., 2012)、卷积神经网络（Zeng et al., 2014）
主要问题

如何设计合理的网络结构，从而捕捉更多的信息，进而更准确的完成关系的抽取

不同的网络结构捕捉文本中不同的信息

网络的构建过程更多的考虑到句子的句法结构，但是需要依赖复杂的句法分析工具

通过卷积操作完成句子级信息的捕获，不需要复杂的NLP工具

在这里插入图片描述

原文链接：https://blog.csdn.net/sty945/article/details/95450681

发布了89 篇原创文章 · 获赞 42 · 访问量 3654

私信关注