知识图谱(一):知识图谱概论(上)

1.知识图谱和人工智能

人工智能可分层次:

  • 感知层次

        感知层次的主要代表:视觉嗅觉听觉等。

  • 认知层次

        而认知层次的代表则是知识图谱的需求。

        任何知识存储在人类的大脑中作为经验知识,再次碰到类似的东西,人就会马上从记忆中想起该物体的特征,对号入座,马上判断出其相关的类型、性质等东西。而机器要想具有认知能力,也需要建立一个知识库,然后运用知识库来做一些事,这个知识库就是我们要说的知识图谱。从认知层次这个角度说,知识图谱是人工职能的一个重要分支,也是机器具有认知能力的基石,在人工智能领域具有非常重要的地位

2.知识图谱的由来

        2012 年 5 月 ,Google 正 式 提 出 知 识 图 谱 的 概 念 , 主要 用 于 描 述 真 实 世 界 中 存 在 的 各 种 实 体 和 概 念 以 及 实体 概 念 之 间 的 关 联 、 关 系 , 把 所 有 不 同 种 类 的 信 息 连接 在 一 起 得 到 一 个 关 系 网 络 , 提 供 了 从 “ 关 系 ” 角 度 分析 问 题 的 能 力 , 用 于 增 强 其 搜 索 引 擎 功 能 的 知 识 库 。 

        因此,在知识图谱出现之前和出现之后Google在搜索引擎的结果有很大区别。辛格尔博士对知识图谱的介绍很简短。things,not string,这抓住了知识图谱的核心,也点出了知识图谱加入之后搜索发生的变化,以前的搜索,都是将要搜索的内容看作字符串,结果是和字符串进行匹配,将匹配程度高的排在前面,后面按照匹配度依次显示。而利用知识图谱之后,将搜索的内容不再看作字符串,而是看作客观世界的事物,也就是一个个的个体。eg:搜索比尔盖茨的时候,搜索引擎不是搜索“比尔盖茨”这个字符串,而是搜索比尔盖茨这个人,围绕比尔盖茨这个人,展示与他相关的人和事,左侧百科会把比尔盖茨的主要情况列举出来,右侧显示比尔盖茨的微软产品和与他类似的人,主要是一些IT行业的创始人。一个搜索结果页面就把和比尔盖茨的基本情况和他的主要关系都列出来了,搜索的人很容易找到自己感兴趣的结果。

3.知识图谱的定义

        知识图谱本质上是一种语义网络,一个网状知识库。用图的形式表示知识,描述客观事物/。这里的图指的是数据结构中的图,也就是由节点和边组成的,这也是知识图谱(Knowledge Graph)的真实含义。知识图谱是对现实世界的抽象表达。知识图谱中的节点表示概念和实体概念是抽象出来的事物,实体是具体的事物;表示事物的关系和属性事物的内部特征属性来表示,外部联系关系来表示。很多时候,人们简化了对知识图谱的描述,将实体和概念统称为实体,将关系和属性统称为关系,这样就可以说知识图谱就是描述实体以及实体之间的关系。实体可以是人,地方,组织机构,概念等等,关系的种类更多,可以是人与人之间的关系,人与组织之间的关系,概念与某个物体之间的关系等等。

4.知识图谱的数据组织

        知识图谱是由实体和实体的关系组成,通过图的形式表现出来,那么实体和实体关系的这些数据在知识图谱中怎么组织呢,这就涉及到三元组的概念,在知识图谱中,节点-边-节点可以看作一条记录,第一个节点看作主语,边看作谓语,第二个节点看作宾语,主谓宾构成一条记录。比如曹操的儿子是曹丕,曹操是主语,儿子是谓语,曹丕是宾语。再比如,曹操的小名是阿瞒,主语是曹操,谓语是小名,宾语是阿瞒。知识图谱就是由这样的一条条三元组构成,围绕着一个主语,可以有很多的关系呈现,随着知识的不断积累,最终会形成一个庞大的知识图谱,知识图谱建设完成后,会包含海量的数据,内涵丰富的知识。

5.知识图谱的应用

        知识图谱构建完成之后,比较典型应用是语义搜索、智能问答、推荐系统等方面。

  •         语义搜索,知识图谱是一个具有本体特征的语义网络,可以看成是按照本体模式组织数据的知识库,以知识图谱为基础进行搜索,可以根据查询的内容进行语义搜索,查找需要找的本体或者本体的信息,这种语义搜索功能在google、百度、阿里巴巴等数据量大的公司里得到应用。
  •         智能问答,和语义搜索类似,对于提问内容,计算机首先要分析提问问题的语义,然后再将语义转换为查询语句,到知识图谱中查找,将最贴近的答案提供给提问者。
  •         推荐系统,首先要采集用户的需求,分析用户的以往数据,提取共同特征,然后根据一定的规则,对用户提供推荐的产品。比如淘宝中记录用户经常购买的商品,经常浏览的商品,提取这些商品的共同特征,然后给这个用户打上标签,然后就给用户推荐具有类似特征的商品。

        知识图谱主要反映的事物之间的关系,对于和关系链条有关的场景,也可以用知识图谱解决,一些应用场景包括反欺诈、不一致性验证、异常分析、客户管理等。

发布了152 篇原创文章 · 获赞 53 · 访问量 5万+

猜你喜欢

转载自blog.csdn.net/weixin_41297324/article/details/103684038