什么是知识图谱?将数据转化为知识

在过去的十年左右的时间里,知识图谱一直潜入我们的日常生活中,如通过语音助手(例如Alexa,Siri或Google Assistant),直观的搜索结果,或通过在线商店推荐者的个性化购物体验。我们每天都在不断与知识图谱进行交互。但是,知识图谱和底层图数据库对大多数人来说仍然是一个谜,由于它无缝地进入了我们的生活,我们大多数人甚至都不知道我们对技术的依赖程度,或更糟糕的是,我们是如何开始期望我们现在已经习惯的某种质量和标准。

许多组织已经在使用知识图谱技术来帮助自己保持领先地位。知识图谱和图数据库已用于所有类型的行业,从银行,汽车行业,石油和天然气到制药和医疗保健零售,出版,媒体等。尽管这些公司针对不同的用例使用了知识图谱,但最终的结果却是相同的:从各种数据库中获取大量数据并为其增值,以便可以以有意义和更智能的方式使用(并最终重用)它。

内容和上下文在通过AI技术提供洞察力方面的作用不断增强,以及针对AI应用程序的最新知识图谱产品已将知识图谱推向表面

Gartner(2018):“人工智能的炒作周期

什么是知识图谱

知识图谱是由学科专家借助智能机器学习算法创建的知识领域模型。 它为所有数据提供结构和通用接口,并允许在整个数据库中创建智能多边关系。 知识图谱被结构化为一个额外的虚拟数据层,位于现有数据库或数据集的顶部,可大规模将所有数据链接在一起,无论是结构化还是非结构化。

知识图谱和图数据库有什么区别?

知识图谱就是数据。它们必须被存储,管理,扩展,质量保证并且可以被查询。这要求数据库和组件位于顶部,通常在语义中间件层中实现。这个“位于”数据库上,同时提供了服务端点以与第三方系统集成。

因此,图数据库构成了每个知识图谱的基础。通常,这些技术基于资源描述框架(Resource Description Framework,RDF),W3C标准或基于标记属性图(Labeled Property Graphs,LPG)。

但是,为了在公司中推出知识图谱,不仅需要数据库:只有借助分类和本体编辑器,实体提取器,图映射器,验证,可视化和搜索工具等组件,才能确保知识图谱可以可持续地开发和管理。虽然图数据库通常由高素质的数据工程师或语义网专家维护,但是语义中间件的接口还允许人们与知识图谱进行交互,这些知识图谱可以为图贡献较少的技术知识,而不是业务和专家知识。

企业知识图谱与Google的知识图谱有何不同?

知识图谱无处不在:Facebook,Microsoft,Google,它们所有人都将自己的知识图谱作为基础架构的一部分。 Google在2012年5月推出了自己的版本以及对知识图谱的解释。 从那以后,“知识图谱”的概念越来越流行。 从表面上看,来自Google知识图谱的信息可用于扩大搜索结果。

最重要的是,当在Google Assistant和Google Home语音查询中回答直接口语问题时,谷歌知识图谱也可以增强其人工智能(Artificial Intelligence,AI)。 作为回报,Google在后台使用其知识图谱来改进其机器学习算法。

但是Google的“知识图谱”在用户和软件代理如何与之交互的方式上非常有限。 它仅涵盖了一些特定于行业的知识,而没有涵盖公司的内部知识。 它的API仅返回单独的匹配实体,而不返回互连对象的形。

这就是企业知识图谱的地方。 企业知识图谱可以帮助公司创建代表自己领域的特定知识网。 结果,他们可以无缝地分解数据库,从而以敏捷方式使用信息资产。 此外,它是一种经济高效的解决方案,它不能替代现有的IT系统,而可以增强现有的IT系统。 企业知识图谱满足当今的需求,以处理实时信息源并从存储在不同系统中的数据中检索知识。

企业知识图谱可以帮助您的四个原因

1.合并不同的数据孤岛
有没有想过,两个独立部门之间的工作是如何完全重叠的,两个部门都懒得互相沟通?这种情况经常发生,并且需要公司重新评估他们在哪些方面花钱:浪费在已经掌握的知识上,或者让员工不断地重新学习。知识图谱有助于组合不同的数据库,从而为您提供所有知识的概览,不仅是部门知识,而且还包括跨部门和全球组织的知识。

2.组合结构化和非结构化数据
累积数据并不仅仅意味着组装文档和Excel工作表。知识图谱技术意味着能够以有意义的方式连接不同类型的数据,并支持比大多数知识管理系统更丰富的数据服务。然后,组织将在AI和机器学习技术的帮助下使用该技术来提取和发现更深、更细微的模式

3.通过更快地发现事物来做出更好的决策
即使在计算机之前,寻找信息也意味着翻阅成堆的文档,以找到对您的思路很有价值的特定句子或数字等。使用知识图谱技术可以为您提供更丰富,更深入的搜索结果,从而缓解了这种情况。知识图谱帮您提供有关特定问题的相关事实和上下文答案,而不是包含许多(不相关)文档和消息的宽泛搜索结果,但这些都是没有价值的输入。知识图谱之所以能够做到这一点,是因为它具有“事物”网络以及属于这些“事物”的事实。 “事物”可以是您的任何业务对象或这些业务对象的属性和方面,例如:项目,产品,员工或他们的技能。任何图都可以链接到其他图以及关系数据库。通过所有这些链接,成熟的知识图谱可以为企业提供任何智能应用程序的坚实的基础设施和基础。

4.用标准证明数据库将来
大多数致力于AI策略的企业都假设外部供应商能够创建一个黑匣子,将其数据汇集到一个智能的知识图谱中。这也意味着这些企业高度依赖外部服务,并且不知道他们的机器如何制定决策。没有高质量的数据,就不可能获得高质量的知识。有了企业知识图谱,组织在管理数据模型时将受益于其数据的更高可重用性,因为他们的知识图谱符合W3C标准。这不仅触发了内部网络效应,而且还允许重新使用公开可用的行业图和本体(例如FIBO,CHEBI,ESCO等)以及用于多语言叙词表的ISO标准。由于所有内容都在内部维护,因此还可以确保您完全控制知识图谱。

知识图谱实现的四个例子

制药业

一个制药业排名前20位的公司使用企业知识图谱的广泛功能来提供其所有研究活动的统一视图。

电信

一家全球性电信公司受益于企业知识图谱的功能,可帮助基于半结构化文档生成聊天机器人。

IT与IT服务

大型IT服务企业使用企业知识图谱来帮助他们将所有非结构化(合法)文档链接到其结构化数据。 帮助企业自动评估通常隐藏在普通法律文档中的风险。

政府

一个大型的政府组织通过使用几个标准的行业知识图(例如MeSH和DBPedia等)为其公民提供受信任的健康信息。 政府卫生平台链接了200多个受信任的医疗信息源,这些信息源有助于丰富搜索结果并提供准确的答案。

参考资源

[1] What is a Knowledge Graph?

发布了66 篇原创文章 · 获赞 101 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/u010705932/article/details/105044532