知识图谱学习笔记(3)

  一、知识图谱的基础概念1:RDF

RDF(Resource Description FrameWork),就是资源描述框架,它的本质是一个数据模型(Data Model)。它提供了一个统一的标准,用于描述实体/资源。简单来说,就是表示事物的一种手段和方法。RDF在形式上表示为SPO三元组,有时候也称为一条语句(statment),在知识图谱中我们称之为一条知识)

  Subject ---------------------------Predicate-------------------------------->Object

其中RDF由节点和边组成,节点表示实体/资源、属性,边则表示实体和实体之间以及实体和属性之间的关系。

  二、RDF序列化的方法

RDF的表示形式和类型有了,那我们如何创建EDF数据集,将其序列化呢(Serialization)呢?换句话说,就是我们怎么存储和传输RDF数据。目前,RDF序列化的主要方式有:RDF/XML,N-Triples,Turtle,RDFa,JSON-LD等几种方式。  

  (1)RDF/XML,顾名思义,就是XML的格式来表示RDF数据,之所以用到这个方法就是因为XML技术比较成熟,有很多现成的工具来存储和进行解析XML。然而,对于RDF来说,XML的格式太冗长,也不便于阅读,通常我们不会使用这种方式来处理RDF数据。

  (2)N-Triples,就是用三元组的方式来表示RDF数据集,是最直观的表述方法。在文件中每一行表示一个三元组,方便机器的解析和处理。开放知识领域的图谱DBpedia通常是用这种格式来发布数据的。

  (3)Turtle,是用的最多的一种RDF序列化的方式了。他比RDF/XML紧凑,并且可读性比N-Triple要好一些。

  (4)RDFa,即"The Resource Description Framework in Attributes",是HTML5的一个扩展,在不改变任何显示效果的情况下,能够让网站构建者在页面中标记实体,像人物、时间、地点、评论等等。也就是说,将RDF数据嵌入到网页中,搜索引擎能够更好的解析非结构化的页面,获取一些有用的结构化信息。

  (5)JSON-LD,j就是"JSON for Linking Data",用键值对的方式来存储RDF数据

 

猜你喜欢

转载自www.cnblogs.com/bigdata-stone/p/9613809.html
今日推荐