再议事理图谱(首届事理图谱研讨会参后感)

0. 前言

上一章中,我们主要讲述了一些关于事理图谱的引言以及背景介绍。在这一章中,我们主要根据首届事理图谱研讨会的内容,对于事理图谱有一个更深的概念认识,对于具体的模型细节,更希望去论文中寻找答案。

这次我们还是从数据、信息和知识开始讲起。

数据,信息和知识,这是组成我们文明世界的三个层次。在SECI模型(野中郁次郎和竹内广孝,1991)也对此作了一些相关阐述。就我而言,数据是最底层,可以说所有的事物都是数据。只要能被观察到的,都是数据。信息是再往上的一层,数据里包含了噪声和冗余的数据,而我们所关注的,能够被传播并带有一定功能的,就是信息。知识则是最上一层,它包含了对于信息的理解、存储和传递的方式方法。知识,知道、认识的(事物)。我经常说的是,只有能够被人容易接受、记忆和传播的信息才能够叫做知识。而那些只可意会不可言传的通常是经验,一般认为是还没有抽象化的知识。

在这里插入图片描述
世界经合组织早在1996年就将知识分为四大类:Know-what/why/how/who,基本上就是关于某一事物的5W1H。因此,知识的主体就是某一事物,既可以是物体也可是事件,所谓的方法,基本上是一系列规范化的事件组成的整体。

一般的,知识共分为四个层次:语言知识、常识知识、世界知识和领域知识。
在这里插入图片描述

语言知识位于最底层,是能够理解信息的第一步,在计算机内就是掌握编码规则。常识知识位于第二层,在这个层次上,我们可能只需要对日常生活有一定的表达就可以,衣食住行等细节方面。世界知识则是你要对世界有一个正确的认识,需要有一定的积累。而领域知识则是指某一专业领域的知识,它需要你成为某方面的人才后,才能够掌握的知识。

1.知识图谱及其组成

在这里插入图片描述

在百度学术上,“知识图谱”的知识图谱如上图所示。可以看到知识图谱与情报学、计算机科学、教育学、中国语言文学甚至是应用经济学、科学技术史都有学科交叉和渗透。但是在计算机科学与技术分支上,目前还主要用于数据可视化。而在人工智能中,
正如上一章中所说,知识图谱属于符号主义学派,使用的是专家系统和知识工程的方法,将人类的经验使用符号显式的表达出来,从而辅助计算机自动化处理外界带来的输入(这也是为什么会应用与数据可视化的原因)。从研究主体来看,目前知识图谱可以分为以下三类:实体图谱、事件图谱和事理图谱。

实体图谱是描述实体和实体之间的关系,最早的时候是没有关系概率值的三元组,后来也形成了有概率值,有丰富的属性的复杂表示形式。下图是实体图谱的例子:人民的名义人物关系。
在这里插入图片描述

事件图谱是描述事件和事件之间的关系,最早是从事件抽取出发,按照事件之间关系进行图谱的构建,后来有一部分根据需求,研究的是特定的,具体的事件和事件之间的关系(情报学、金融学),另一部分,则将事件抽象化,逐渐变成事理图谱。下图是事件图谱例子:奥巴马就任美国总统。

在这里插入图片描述

事理图谱与事件图谱比较相似,事理是与物理、人理相对应的概念,根据其定义,它更倾向于研究事件的演化规律,它的节点表示的是某一个更加抽象的概念,而其连接的边,则是与其他事件的联系。因此除了常见的因果、时序关系外,还有一些上下位关系、同指关系等。可以说是事件图谱的再加工的结果,下图是事理图谱的例子:美联储加息。

在这里插入图片描述

从以上三个例子,我们很清楚实体图谱、事件图谱和事理图谱之间的区别与联系。我们这里省去实体图谱和事件图谱的介绍,重点讲解事理图谱的组成及应用。

2.事理图谱

事理图谱是一个事理逻辑知识库 ,描述了事件之间的演化规律和模式。结构上事理图谱是一个有向环,节点边代表事件之间的顺承、因果、条件和上下位等逻辑关系等逻辑关系 。这里要提及的一个定义是事件,一个完整的事件应当包含主语(非必须)谓语(必须)宾语(非必须),在下面的例子中可以有所体现。

2.1 事理图谱的主要关系

事理图谱之间的关系主要包含顺承关系、因果关系、上下位关系、条件关系等。以下为详细说明。

2.1.1 顺承关系

顺承关系是指两个时间在时间上上级发生的偏序关系,如图所示,期间的转移概率为事件间演化的置信度。
在这里插入图片描述
在事理图谱中的顺承关系主要包括两种情况:

  1. 顺承的前序事件a结束后,后续事件b紧接着发生。
  2. 顺承的前序事件a结束后,隔一段时间后续事件b才发生。

2.1.2 相关关系和因果关系

图谱,其实就是包含许多事物和事物之间的关系的整体,一般的,我们将只要是相关关系的事物都会形成连接,但我们更侧重于因果关系这一个比较特殊的关系。而我们之所以重点研究因果性,是因为因果性更能够进行推理和预测,它可能包含我们一直所要探寻的“规律”。从具体的、细节化事件因果( 事实 )中归纳总结出事件因果律( 认知 ),从而指导人们的行为。这也是知识的一个比较重要的功能体现。

对于因果关系和相关关系的研究有很多,例如《关于人的认知体系“相关性”与“因果性”的初探》阐述了人们将相关性认定为因果性的原因在于“过拟合”的观点,《统计学中的相关性与因果性》讲了统计学中出现的奇怪的因果现象。《相关性≠因果性》则用几个吸引人的例子向我们介绍了我们常常会犯的错误。这也让我想起两年前在CCL会议上听耿直教授讲的因果关系和相关关系的区别与联系。就我看来,因果性只是相关性的其中一个子集,例如时序关系,同指关、包含关系等都是相关性的体现之一。

和相关性区别的是无关性。事实上,任何事情之间都是有联系的,只不过这个联系强度大小的,当我们认为两个人之间的联系强度低于某个阈值或者超过某些连接长度(例如亲戚关系),我们就认为两者没有关系。所以,只要在图谱中体现出的节点之间是连通的,都会认为是有联系的,而我们之所以找不到他们之间的联系,可能是因为关系链太长或者相关强度太小。

在事件图谱中,因果关系是指两个事件之间,前一事件导致后一事件的发生。
在这里插入图片描述

2.1.3 上下位关系

在事理图谱中,事件之间的上下位关系分为:名词性上下位关系和动词性上下位关系。其实就是看一个事件中是否是动词存在上下位还是名词存在上下位。
在这里插入图片描述

2.1.4 条件关系

条件关系不是因果关系。就我而言,条件关系和因果关系不是那么容易区分。在事理图谱中,条件关系指前一个事件的发生是后一个事件发生的条件。
在这里插入图片描述

2.2 事理图谱的典型结构

事理图谱中的三个典型的子图结构:链状、树状和环状结构。
在这里插入图片描述
上图为看电影场景下的链状事理图谱,这基本上就是一个流程,它并不是指某一次具体的看电影,也就是说这是一个看电影的通用方法。如果人工智能可以自动的学习这一套流程,那么相比现在的人工智能,可要聪明多了。
在这里插入图片描述
上图为结婚场景下的树状结构,它就不仅仅是一个顺序执行的过程,而是一个发散的,可能包含许多事情的事件。
在这里插入图片描述
上图为金融领域里的环状结构,它更加可以揭示事物发展的规律,尤其是良性循环与恶性循环。这也正印证了“历史总是相似的”老话。

这里我有一个额外的问题,如何确定一个大小合适的场景?

2.3 事理图谱的构建步骤

事理图谱的构建主要步骤如下:

  1. 事件抽取(无监督的模式匹配+有监督的模型算法)
  2. 事件因果强度计算
  3. 事件上下位关系获取(基于大词林)
  4. 事件合一(事件同指)
  5. 事件泛化(事件聚类)

2.4 事理图谱的应用方面

事理图谱可以应用在多个方面,例如:

  1. 脚本事件预测(事件链)
  2. 金融事理图谱
  3. 应用于内部决策参考、风险预警、资产组合、投研分析等。
  4. 消费意图预测与推荐
  5. 辅助对话生成
  6. 问答系统
  7. 热点事件发现与跟踪(民众热点、国际政治)
  8. 机器自动写作等
  9. POI检测

4. 小结

在未来,无论是具有可解释性的符号主义学派的相关模型还是速度更快,更简单方便的联结主义学派的相关模型,都不可能完全的处理所有的问题。正如曾经的所谓脑启发的人工智能,正迈向类脑人工智能一样,人类必将会对自身认知过程有一个更深的了解,并且逐步细化,最终组合形成一个人类知识的集合体。

其实,我们对于人工智能要求太高,现实中,不是每个人的能力都如此优秀出众。很多人有着这样或那样的缺陷。然而,我们要造的通用人工智能,就是要比任何一个人,在任何领域都要优秀。从AlphaGo到如今的王者荣耀AI等一系列游戏智能体完全打败顶尖人类玩家,到图像识别、作诗作画达到研究生水平,甚至是自动驾驶不允许出现一点差错,这不是赤裸裸的造神运动吗?

当然,这不是一蹴而就的事情,依旧是一声长叹,抬头看路:路漫漫其修远兮,吾将上下而求索。

发布了232 篇原创文章 · 获赞 547 · 访问量 51万+

猜你喜欢

转载自blog.csdn.net/qq_35082030/article/details/98613736
今日推荐