1.1 知识图谱的基本概念
分为狭义与广义概念。
狭义的知识图谱特指一类知识表示,本质上是一种大规模语义网络。
广义的知识图谱是大数据时代知识工程一系列技术的总称,在一定程度程度上指代大数据知识工程这一新兴学科。
1.1.1 知识图谱的狭义概念
- 知识图谱作为语义网络的内涵
知识图谱是一种大规模语义网络,包括实体(entity)、概念(concept)及其之间的各种语义关系。
要点:
- 其是语义网络,这是知识图谱的本质;
- 其是大规模的,这是知识图谱与传统语义网络的根本区别。
语义网络是一种以图形化的(Graphic)形式通过点和边表示知识的方式,其基本组成元素是点和边。语义网络的点可以是实体、概念和值,如下图所示。
(1)实体。实体有时也会被称作对象(Object)或实例(Instance)。
(2)概念。概念又被称为类别(Type)、类(Category或Class)等。
(3)值。每个实体都有一定的属性值。
知识图谱中的边可以分为属性(Property)和关系(Relation)两类。关系可以认为是一类特殊的属性,当实体的某个属性值也是一个实体时,这个属性实质上就是关系。
语义网络中的边按照其两端节点的类型可以分为概念之间的子类(subclassof)关系、实体与概念之间的实例(instanceOf)关系,以及实体之间的各种属性关系,如上图所示。
- 知识图谱与传统语义网络的区别
(1)规模巨大。知识图谱具有巨大的规模。
(2)语义丰富。两个方面:知识图谱富含各类语义关系;语义关系的建模多样。
(3)质量精良。大数据多源特性使得我们可以通过多个来源验证简单事实。
(4)结构友好。知识图谱通常可以表示为三元组,这是典型的图结构。三元组可以借助RDF(Resource Description Framework)进行表示。
知识图谱构建与应用独特挑战:
(1)高质量模式缺失。
(2)封闭世界假设不再成立。
(3)大规模自动化知识获取成为前提。
- 知识图谱与本体的区别
本体刻画人们认知一个领域的基本框架,而知识图谱富含的是实例以及关系实例。
1.1.2 知识图谱的广义概念
知识图谱作为一种技术体系,指代大数据时代知识工程的一系列代表技术的总和。
1.2 知识图谱的历史沿革
1.2.1 知识图谱溯源
- 传统知识工程
知识工程属于符号主义。符号主义认为知识是智能的基础。传统人工智能专家认为人工智能的核心问题是知识表示、推理和应用。
传统知识工程所成功解决的问题普遍具有规则明确、应用封闭的特点,比如几何定理证明。
传统的专家系统需要借助大量的人力参与,如下图所示
- 传统知识工程的局限性
(1)隐形知识与过程知识等难以表达
(2)知识表达的主观性的不一致性
(3)知识难以完备
(4)知识更新困难
1.2.1 大数据知识工程
- 互联网与大数据应用催生了知识图谱
互联网应用特点:
- 规模巨大
- 精度要求相对不高
- 知识推理困难
- 大数据时代给知识图谱的发展带来了新机遇
(1)数据、算力和模型的飞速发展使得大规模自动化知识获取成为可能。
(2)众包技术使得知识的模块化验证成为可能。
(3)高质量用户生成内容提供了高质量知识库来源
1.3知识图谱的研究意义
1.3.1 知识图谱的认知智能的基石
(1)知识图谱使能机器语言认知。
实现机器对自然语言的理解所需要的条件:
- 规模必须足够巨大才能理解不同的实体和概念
- 语义关系必须足够丰富才能理解不同的关系
- 结构必须足够友好才能为机器所处理
- 质量必须足够精良才能让机器对现实世界产生正确的理解
(2)知识图谱赋能可解释人工智能
(3)知识图谱有助于增强机器学习的能力
1.3.2 知识引导成为解决问题的重要方式之一
当下,计算机解决问题主要采用数据驱动的方式,也就是从样本数据中建立统计模型,挖掘统计规律来解决问题。
单纯依赖统计模式难以有效解决很多实际问题,并且单纯的数据驱动方式仍然面临效果的“天花板”,如下图所示。
实际应用越来越要求将数据驱动和知识引导相结合,以突破基于统计学习的纯数据驱动的效果瓶颈。
1.4 知识图谱的应用价值
1.4.1 数据分析
1.4.2 智能搜索
1.4.3 智能推荐
1.4.4 自然人机交互
1.4.5 决策支持
1.5 知识图谱的分类
首先认识数据、信息和知识之间的联系和区别
- 数据是对客观世界的符号化记录
- 信息是被赋予意义的数据
- 知识的人类对信息的提炼和总结的结果,是人类认识世界的结果
1.5.1 知识图谱中的知识分类
(1)事实知识
(2)概念知识
(3)词汇知识
(4)常识知识