【知识图谱学习笔记】01知识图谱简介

本文旨在讲解知识图谱的构建、理解以及应用，笔者也将会根据自身的学习情况持续更新。

与其他面向知识的信息系统相比，知识图谱有其独特的知识表示结构，信息管理流程以及搜索算法。知识图谱的概念来自于2012年谷歌开始将知识图谱应用于他的搜索引擎，使得用户能够搜索人、地点、以及文档，而不仅仅是序列匹配。由于谷歌的成功，知识图谱也渐渐在世界的公司取得了较好的发展势头。

知识图谱最基本表示单元是一个实体，每一个实体都会有各种各样的属性，不同实体之间会有关系相连接，关系亦能够将两个不同领域的知识图谱连接起来。每个实体需要有独特的identification来标识，每一个实体的id必须独一无二，实体与关系的类型由OWL(类似schema)定义。知识图谱是需要保持一致性以及具有良好的正确性、兼容性、容错性、可扩展性等。

1.1知识图谱的历史简要

语义网：
语义网就是将对象、概念和状态用点，关系用弧表示出来，但由于语义网没有标准的句法和语义表示，使用者则可以做出不同的解释，并且语义网不允许使用者自己定义节点和弧线的含义。

Linked Data：
基于RDF和OWL 的Linked Data能在不同的领域发布和共享数据，其中RDF用来描述对象，而OWL提供一种标准的模式来解释数据，由此RDF可以通过图像的方式联系到一起，包括schema层级的mapping和对象层级的绘图。

Introducing the Knowledge Graph: things, not strings：
知识图谱可以理解真实世界实体和实体之间的关联，实体而不是字符串，例如你查找[taj mahal]这个query有丰富的含义。你可以认为它表示世界上最壮美的纪念碑，或者格莱美奖的获奖音乐家，又或者是新泽西区近大西洋城市的一个俱乐，又或者是离你最近的印第安餐厅。谷歌可以理解到这些不同的含义，并且将所有可能的结果归纳分组，谷歌就像用户一样，能够理解实体和实体含义之间的细微差别，这就是知识图谱的真正含义。

1.2知识图谱技术

一个知识图谱通常由三个部分组成：构建、存储以及推理，知识图谱的构建以及存储有四项应用：知识表示和推理，知识存储，知识工程，自动知识学习(包括关系学习)。

其中前三项应用都来自于一些知识推理、数据库、本体及语义网，而第四个知识的自动学习，则来自于数据挖掘，NLP和机器学习等。

通常一个知识图谱能够被序列语言、搜索引擎、专业的接口所直接分析及应用，而一个知识图谱也能加强其他的传统信息处理任务，例如：信息抽取、搜索、推荐及问答等。

1.3企业中的知识图谱应用

知识图谱自2012年由谷歌提出以来，就在企业中获得了良好的发展势头，目前在企业中应用时也遇到了一些挑战：知识获取、表示以及发现、知识工程方法、人机交互界面，信息检索。

一些企业知识管理平台
Open Innovation
Intra-enterprise Micro-knowledge Management
Market Intelligence
IBM Waston