【知识图谱学习笔记】01知识图谱简介

本文旨在讲解知识图谱的构建、理解以及应用,笔者也将会根据自身的学习情况持续更新。

与其他面向知识的信息系统相比,知识图谱有其独特的知识表示结构,信息管理流程以及搜索算法。知识图谱的概念来自于2012年谷歌开始将知识图谱应用于他的搜索引擎,使得用户能够搜索人、地点、以及文档,而不仅仅是序列匹配。由于谷歌的成功,知识图谱也渐渐在世界的公司取得了较好的发展势头。

知识图谱最基本表示单元是一个实体,每一个实体都会有各种各样的属性,不同实体之间会有关系相连接,关系亦能够将两个不同领域的知识图谱连接起来。每个实体需要有独特的identification来标识,每一个实体的id必须独一无二,实体与关系的类型由OWL(类似schema)定义。知识图谱是需要保持一致性以及具有良好的正确性、兼容性、容错性、可扩展性等。

1.1知识图谱的历史简要

语义网:
语义网就是将对象、概念和状态用点,关系用弧表示出来,但由于语义网没有标准的句法和语义表示,使用者则可以做出不同的解释,并且语义网不允许使用者自己定义节点和弧线的含义。

Linked Data:
基于RDF和OWL 的Linked Data能在不同的领域发布和共享数据,其中RDF用来描述对象,而OWL提供一种标准的模式来解释数据,由此RDF可以通过图像的方式联系到一起,包括schema层级的mapping和对象层级的绘图。

Introducing the Knowledge Graph: things, not strings:
知识图谱可以理解真实世界实体和实体之间的关联,实体而不是字符串,例如你查找[taj mahal]这个query有丰富的含义。你可以认为它表示世界上最壮美的纪念碑,或者格莱美奖的获奖音乐家,又或者是新泽西区近大西洋城市的一个俱乐,又或者是离你最近的印第安餐厅。谷歌可以理解到这些不同的含义,并且将所有可能的结果归纳分组,谷歌就像用户一样,能够理解实体和实体含义之间的细微差别,这就是知识图谱的真正含义。

1.2知识图谱技术

一个知识图谱通常由三个部分组成:构建、存储以及推理,知识图谱的构建以及存储有四项应用:知识表示和推理,知识存储,知识工程,自动知识学习(包括关系学习)。

其中前三项应用都来自于一些知识推理、数据库、本体及语义网,而第四个知识的自动学习,则来自于数据挖掘,NLP和机器学习等。

通常一个知识图谱能够被序列语言、搜索引擎、专业的接口所直接分析及应用,而一个知识图谱也能加强其他的传统信息处理任务,例如:信息抽取、搜索、推荐及问答等。

1.3企业中的知识图谱应用

知识图谱自2012年由谷歌提出以来,就在企业中获得了良好的发展势头,目前在企业中应用时也遇到了一些挑战:知识获取、表示以及发现、知识工程方法、人机交互界面,信息检索。

一些企业知识管理平台
Open Innovation
Intra-enterprise Micro-knowledge Management
Market Intelligence
IBM Waston

猜你喜欢

转载自blog.csdn.net/weixin_42864175/article/details/85044963