王昊奋知识图谱学习笔记--第二讲知识表示与知识建模

知识表示语言 RDF / RDFS

RDF 资源描述框架

在这里插入图片描述
Resource:资源;Description:属性、特征、关系;Framework:框架、语言和描述的语法。
RDF 中,知识总是以三元组(triple)形式出现: 主+谓+宾
在这里插入图片描述

举例说明:将一条语句,转换为两条三元组。
在这里插入图片描述
RDF 可以被看做一个图。

在这里插入图片描述
在这里插入图片描述
在RDF三元组中,三元组的主谓宾都有一个全局标识URI。

在这里插入图片描述

RDFS 和 RDF 的区别是RDFS 预定义了一些词汇。基于这些词汇可以形成更丰富的三元组关系,并实现一定程度的推理。
即使没有schema, 本身也是一个知识图谱。只是这个知识图谱仅仅是一个数据层面的知识图谱,没有概念上的约束。

上面是模式层,下面是实例层(数据层)。加入约束之后,有利于我们去做一定的推理,既包括上下位的推理,也包括类别的约束的推理。

从下图中可以看到,haofen 的类别是Person, ccf_adl 的类别是Talk(会议),而Person和Talk都是Thing 类的子类。
同时speaker 的主语(定义域)domain 是Talk , speaker 的对象(值域)是Person。
在这里插入图片描述

  1. 第一个例子是利用类别的实例和类别之间的上下位关系,得到的推理结果。
  2. 第二个例子是利用schema的约束(类别的定义域和值域),和数据层的具体三元组实例,得到的推理结果。
    在这里插入图片描述

知识表示语言 OWL

无论是OWL还是OWL2 , 都是在概念层定义一些新的预定义语言。在增加了表示能力的同时,他的推理复杂度也会提高。
在它增加了表示能力之后,我们就在之后会做知识推理的内容。

在这里插入图片描述在这里插入图片描述

知识图谱查询语言的表示

SPARQL :RDF 的查询语言

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
当没有上层的schema 约束时,查询会非常复杂。
在这里插入图片描述
基于本体层优化之后:

在这里插入图片描述

Json-LD

在这里插入图片描述
常规的JSON文件的内容,机器无法理解。因此JSON-LD需要引入规范的术语来进行表示。
在这里插入图片描述

“RDF+SPARQL” VS “ER+SQL”

在这里插入图片描述
虽然基于关系型数据库,使用三表查询的方式可以实现这个问答问题。但实际上下图中的SQL 查询语句是由人来实现的,所以说语义没有存在于人的定义当中,而是存在人的脑中。

使用RDF+SPARQL 的好处,是当这个问题发现改变,比如增加了深圳位于广东,广东位于中国,对于SPARQL来说没有变化,依然可以正确推理。而使用关系型数据库,需要重新由人来实现多表查询。
在这里插入图片描述

数据的智能性

在关系型数据库中,底层的数据可以理解为哑巴数据,更多的依靠上层的应用实现的智能化。
数据是非常显式的表示关系,而这些关系又通过我们预定义的一些关联,使得我们去做的是图。而图的这种结构增加边和点,是非常容易的。在关系数据库中,就需要修改表和字段。

在这里插入图片描述

自顶向下 VS 自底向上

对于开放知识图谱,更多的是先去做数据层,这样数据的抽取、知识的构建更加的方便。
对于领域知识图谱,会去先定义本体层,然后基于本体层的约束和推理的规则,使得数据更加聚焦,质量更好。

知名知识图谱项目的知识表示方式

以下知识图谱在进行知识表示时,都基本遵循RDF的描述,只是在处理多元关系时有各自的特点。
在这里插入图片描述

实用的知识表示

够用即好。
RDF/OWL 只是众多知识表示中的一种,不是必须的。但它们是非常基础的内容,还是有必要了解。
在这里插入图片描述

基于Protege 的知识建模实践

Protege 是用于手工建模用的。也就是不需要去做知识抽取,通过手工建模去得到这个知识图谱,在这个基础上也能实现知识推理。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u010414589/article/details/109105870