事理图谱入门

目录

前言

一.事理图谱的定义

二.事理图谱中事件的定义与表示

三. 事理图谱中的事件关系类型

四.事理图谱中的事件属性

五.事理图谱与知识图谱的区别与联系


前言

        为了确定今后的主要研究方向,笔者首先回顾了2022年知识图谱峰会,在收听了约10个讲座后,确定了可解释性推荐技术,多模态知识图谱,事理图谱三个大致方向。首先是多模态知识图谱,其核心是构建知识图谱的数据来源从传统的文字变为了多形式的数据,该技术的创新方向相对来说并不算多,且目前的技术难点主要在于对图片素材进行内容识别和读取,因读者对图像识别技术并不太了解,因此放弃了该方向的研究。其次是可解释性推荐技术,该技术因为推荐领域中的算法已经较为完善,所以其研究方向目前主要集中在解释语句的个性化生成。其主要的前言研究领域主要包括两个:其一是传统知识图谱与深度学习的结合,其二则是利用强化学习进行自然语言文本的生成,两个技术方向的难度对于初入NLP领域的学者来说并不算友好,因此读者也放弃了可解释性推荐技术的研究。最终读者将目光投向了事理图谱领域,事理图谱作为知识图谱的一个变种,其构建的核心思路是模拟人的自然思考逻辑,因此在舆论传播模拟,事件走向预测,智能问答等多领域具有相当优秀的应用前景,且该技术目前仍处于创立和探索阶段,还有大量的空白等待学者去填补。


一.事理图谱的定义

事理图谱是一个描述事件之间演化规律和模式的事理逻辑知识库。结构上,事理图谱是一个有向有环图,其中节点代表事件,有向边代表事件之间的顺承、因果、条件和上下位等事理逻辑关系。

①不是去研究“事理学”这一门学科。

②不是脱离现有知识图谱的结构体系。

二.事理图谱中事件的定义与表示

理论上,事理图谱中的事件是具有一定抽象程度的泛化事件,具体可以表示为抽象、语义完备的谓词短语或句子,或可变长度的、结构化的(主体,事件词,客体)多元组,元组中必须至少包含一个事件词标志事件的发生,例如“跑步”;而事件的主体和客体都可以在不同的应用场景下被省略,例如“(元首,出访)”可以省略事件的客体,“(购买,机票)”可以省略事件的主体。

事件词可以是动词或名词,但是绝大多数事件都是动词触发的。

三. 事理图谱中的事件关系类型

根据对大规模文本数据进行统计,现实世界中有四种事理逻辑关系所占比重较大,也是事理图谱中主要关注的事理逻辑关系,包括事件之间的顺承关系、因果关系、条件关系和上下位关系。 顺承关系:是指两个事件在时间上相继发生的偏序关系。事理图谱中的顺承关系相对比较简单,只需要保证前序事件a在后序事件b之前发生即可,不用考虑哪个事件先结束。事实上,只要a事件的起始时间点早于b事件的起始时间点,那么它们之间就有可能形成顺承关系,而它们的结束时间点的相对关系可以是任意的。两个前后顺承的事件之间存在一个介于0到1之间的转移概率,表示从一个事件按顺承关系演化到下一事件的置信度。 因果关系:是指两个事件之间,前一事件(原因)的发生导致后一事件(结果)的发生。因果关系满足原因事件在前,结果事件在后的时间上的偏序关系,因此在一定意义上,可以认为因果关系是顺承关系的子集。因果事件对之间存在一个介于0到1之间的因果强度值,表示该因果关系成立的置信度。 条件关系:是指前一个事件是后一个事件发生的条件。条件关系属于思想中命题的某种逻辑关系,因果关系属于对客观事实的某种认识。条件关系可以理解为“理由”,是前提与结论或论据与论点的内在联系,是关于逻辑的,而因果关系则可以理解为“原因”,是关于事实的,本质上讲“原因≠理由”。举例来说,“如果买票的人多,那么电影好看”这一条件是成立的,而“因为买票的人多,所以电影好看”这一因果是不成立的。 上下位关系:事件之间的上下位关系有两种:名词性上下位关系和动词性上下位关系。例如,事件“食品价格上涨”与“蔬菜价格上涨”互为名词性上下位关系;事件“杀害”与“刺杀”互为动词性上下位关系。需要注意的是,上下位关系一般是确定性的知识,因此无须类比顺承或者因果关系,给上下位关系赋值一个0到1之间的常数来表示其置信度。

四.事理图谱中的事件属性

事理图谱除了关注事件之间的事理逻辑关系外,还关注事件自身的属性。事件属性用来描述事件发生的程度、持续时间等。

在进行推理时,事件属性会起到非常重要的作用,例如,从金融文本中可以抽取到“货币超发”会导致“汇率贬值”,“汇率贬值”又会导致“货币紧缩”,而实际上“货币持续超发”才会导致“汇率贬值”,而“汇率大幅贬值”才会导致“货币紧缩”,这里面“持续”和“大幅”作为事件的属性,可以影响到事件未来的走势情况。此外,“股票下跌/上涨”的百分比也是事件重要的属性,股票上涨0.1%和上涨10%对未来事件的影响是有非常明显的区别的。

五.事理图谱与知识图谱的区别与联系

“知识图谱”这一术语可以有两层含义。如果认为“知识图谱”表示广义上的知识库,是一种用以存储知识的本体,那么“事理图谱”则是一种存储事理逻辑关系的“知识图谱”;如果认为“知识图谱”特指狭义上现阶段以谷歌、百度等为代表所构建的以实体为中心、用于提升用户搜索体验的知识库,那么“事理图谱”便是与“知识图谱”相并列的一种新型常识知识库。

事理图谱与知识图谱的区别与联系可以从研究对象、组织形式、主要知识形式和知识的确定性四个方面进行研究。事理图谱以谓词性事件为核心研究对象,有向边表示事理逻辑关系,即顺承、因果、条件和上下位等;边上标注概率信息说明事理图谱是一种事件间相继发生可能性的刻画,不是确定性关系。而知识图谱以体词性实体为核心研究对象,实体属性以及实体间关系种类往往成千上万。知识图谱以客观真实性为目标,某一条属性或关系要么成立,要么不成立。

猜你喜欢

转载自blog.csdn.net/cuguanren/article/details/126274144
今日推荐