知识图谱入门学习笔记(二)-知识表示

目录

1 知识表示的概念

1.1 知识表示方法

1.2 知识表示的分类观点

1.3 知识表示的发展

2.1 语义网络

2.2 产生式系统

2.3 框架系统(Frame Systems)

2.4概念图(Conceptual Graph)

2.4.1 描述逻辑(Description Logic)

Horn子句

2.4.2 描述逻辑

3.1 RDF(Resource Description Framework)

3.1.1 RDF模型

3.1.2 RDF Schema(图解)

3.1.3 具体例子

3.2 OWL (Web Ontology Language)

3.2,1 OWL的设计思想

3.3 SPARQL

3.4 JSON-LD(JSON for Linked Data)

4 知识图谱统计表示学习(Representation Learning)

4.1 自然语言中的表示学习

4.2 知识图谱表示学习原理

参考资料:


1 知识表示的概念

1.1 知识表示方法

  • 语义网络

  • 产生式规则

  • 框架系统

  • 描述逻辑

  • 本体

  • 统计表示学习
     

1.2 知识表示的分类观点

(1)基于非逻辑的知识表示;

(2)基 于数理逻辑的知识表示;

(3)基 于统计学习的分布式知识表示。

1.3 知识表示的发展

2.1 语义网络

优点:
1.表示自然,易于理解,应用广泛;
2.符合人类联想记忆;
3.结构化知识表示。
不足:
1.不严格:没有公认的逻辑基础;
2.难有效处理:网络形式具有灵活的特点,但
同时造成了处理和检索的低效率。

2.2 产生式系统

优点:
1.自然性:符合人类表达因果关系的知识表示形式,表示直观、自然,便于进行推理。
2.模块性:产生式系统中的规则形式相同,易于模块化管理。
3.有效性:能表示确定性知识、不确定性知识、启发性知识、过程性知识等。
4.清晰性:格式固定,便于规则设计,易于对规则库中进行一致性、完整性检测。.
不足:
1.效率不高:匹配规则代价高,求解复杂问题容易造成组合爆炸。
2.不能表达具有结构性的知识:不能把具有结构关系的事物间的区别与联系表示出来

2.3 框架系统(Frame Systems)

框架:框架是知识表示的基本单位,描述对象(事物、事件或概念等)属性的数据结构。一个框
架由若千个“槽”(Slot)结构组成,每个槽又可分为若干个“侧面”(Facet)
槽:描述某一方面的属性
侧面:描述相应属性的一个方面,通常是一个属性值

优点
1.框架对于知识的描述非常完整和全面;
2.基于框架的知识库质量非常高;
3.框架允许数值计算,优于当时其它表示语言;
不足
1。框架的构建成本非常高,对知识库的质量要求非
常高;
2.框架的表达形式不灵活,很难同其它形式的数据联合使用。(数据孤岛)

2.4概念图(Conceptual Graph)

2.4.1 描述逻辑(Description Logic)

Horn子句

2.4.2 描述逻辑

描述逻辑的组成

概念(Concept):描述世界的抽象术语
关系(Role):概念之间的联系
实例(Individual):唯一个体
公理(Axiom):不证自明的命题
例如


描述逻辑ALC的推理 没看懂

3.1 RDF(Resource Description Framework)

设计目的:

最低限度的约束,灵活地秒速信息,可用于Web

1.采用了基于三元组声明的图模型(图表示)
2.基于URI的可扩展词汇集(唯一标识)
3.基于XML的序列化语法编码(信息交换)
4.形式化的语义和可证明的推论(逻辑基础)
5.允许任何人发表任何资源的声明(开放 世界)


3.1.1 RDF模型

资源(Resource): URI标识的所有事物
文字(Literal):字符串或数据类型的值
属性(Property):描述资源特征、属性、或关系
声明(Statement):一个资源加.上属性及属性值

3.1.2 RDF Schema(图解)

RDFS用于定义和描述词汇集

类: rdfs:Class
类层次: rdfs:subClassOf
实例定义: rdfs:type
属性定义: rdfs:range, rdfs:domain
属性层次: rdfs:subPropertyOf

3.1.3 具体例子

关于一本书的RDF图

关于Person类的RDF语言描述

3.1.4 RDF的不足
1.值域的定义: RDF(S)中通过rdfs:range定义了属性的值域,该值域是全局性的,无法说明该属性应用于某些具体的类时具有的特殊值域限制。
2.类、属性、个体的等价性: RDF(S)中 无法声明两个或多个类、属性和个体是等价还是不等。
3.不相交类的定义:在RDF(S)中 只能声明子类关系,如男人和女人都是人的子类,但无法声明这两个类是不相交的。
4.类的布尔结合定义:即通过类并、交和补的声明实现对某些类的结合,从而构建新类,如定义人类为男人和女人这两个类的并。
5.基数约束:即对某属性值可能或必须的取值范围进行约束,如说明一一个人有双亲(包括两个人),一门课至少有一名教师等。
6.关于属性特性的描述:即声明属性的某些特性,如传递性、函数性、对称性,以及声明一个属性是另一-个属性的逆属性等。

3.2 OWL (Web Ontology Language)

3.2,1 OWL的设计思想

1.扩展RDFS,语法规则采用RDFS/XML,语义严格遵循描述逻辑。
2.根据应用对表达能力和推理复杂度的不同要求,OWL提供了OWL DL和OWL Lite两种子语言。
3.为完全兼容RDFS,提供了OWL Full,其中包括了OWLDL的全部内容,但这也造成了OWL Full推理问题
是不可判定的。

3.3 SPARQL

基于图匹配模型,使用了SELECT-FROM-WHERE句子,增强了图算子OPTIONAL

3.4 JSON-LD(JSON for Linked Data)

4 知识图谱统计表示学习(Representation Learning)

传统表示:
基于符号的三元组表示,不能捕获实体间的语义关系(显式+隐式)
不好直接利用各种机器学习模型进行分析和挖掘
统计学习表示:
给出一种统计上的分布式表示形式,
能捕获实体间的语义关系,特别是隐式关系

表示形式为向量,
能被各种机器学习模型直接使用。

4.1 自然语言中的表示学习

4.2 知识图谱表示学习原理

参考资料:

猜你喜欢

转载自blog.csdn.net/qq_37457202/article/details/108449823