新冠病毒知识图谱|图数据库能做什么

图可视化直观、智能地展现数据之间的结构和关联

能看到从前在表格或者图表中看不到的内容

                ——本文节选自《新程序员》文章

随着大数据时代的到来,传统的关系型数据库由于其在数据建模和存储方面的限制,变得越来越难以满足大量频繁变化的需求。关系型数据库,尽管其名称中有“关系”这个词,却并不擅长处理复杂关系的查询和分析。另外,关系型数据库也缺乏在多服务器之上进行水平扩展的能力。基于此,一类非关系型数据库,统称“NoSQL”存储应运而生,并且很快得到广泛研究和应用。

NoSQL(Not Only SQL,非关系型数据库)是一类范围广泛、类型多样的数据持久化解决方案。它们不遵循关系型数据库模型,也不使用SQL作为查询语言。其数据存储不需要固定的表格模式,也经常会避免使用SQL的JOIN操作,一般都有水平可扩展的特征。

图数据库与关系型数据库的比较

图数据库(Graph Database)是指以图表示、存储和查询数据的一类数据库。这里的“图”,与图片、图形、图表等没有关系,而是基于数学领域的“图论”概念,通常用来描述某些事物之间的某种特定关系。比如在我们的日常生活中:

社交网络是图。每个社交网络的参与者是节点,我们在社交网络中的交互,例如“加好友”“点赞”就是连接节点的边。

城市交通是图。每个路口、门牌号、公交站点等都是节点,街道或者公交线路是边,将可以到达的地方连接起来。

知识也是图。每个名称、概念、人物、事件等都是节点,而类属关系、分类关系、因果关系等是边,将节点连接起来,形成庞大、丰富并且随时在演变的知识图谱。

“图无处不在”(Graphs are everywhere),也正因如此,传统关系型数据库不擅长处理关系的问题,能够被图数据库很好地解决,图数据库正是为解决这一问题而生。

关于新冠病毒的知识图谱

新冠病毒肆虐全球,来自Neo4j图数据库社区的一群成员,集成了多个异构生物医学和环境数据集,建立了关于新冠病毒的知识图谱

https://github.com/covid-19-net/covid-19-community

以帮助研究人员分析宿主、病原体、环境和病毒之间的相互作用。

e11f0a5a44347c430223340ae2e9865c.png

关于新冠病毒的知识图谱

  • 该知识图谱的部分可视化结果,图中最左边的部分是病毒暴发的地理位置子图,包含国家、地区、城市;

  • 中间绿色的部分是流行病学子图,包括有关病毒株、病原体和宿主生物的信息,病例和菌株分别与报告和发现它们的位置相关联;

  • 右边紫色的部分是生物学子图,代表生物体、基因组、染色体、变异体等。

eb549c9cac4a0f768228dcc575ced4b1.png

《新程序员》004期上线

扫描二维码,限制折扣图书送到家

还有电子版送

图数据库未来大放异彩

在金融领域,图和图分析帮助机构更高效地发现异常的关联交易,以赢得反洗钱战争。

在电力、电信行业,图数据库帮助管理复杂庞大的设备和线路网络,并及时为故障分析根源、估算影响。

在制造、科研、医药等领域,图数据库广泛用于存储和查询知识图谱,成为大数据管理、数据分析和价值挖掘乃至人工智能技术领域的重要支撑。

在可预见的未来内,图数据库与人工智能技术的结合应用将会带来更多创新和飞跃。图数据库至少能在以下四个领域帮助提升AI能力。

6a45a0f24f379ac33e4e1b02448c34ab.png

数据库技术发展趋势(截至2021年6月)来源:DB-Engines

第一是知识图谱,它为决策支持提供领域相关知识/上下文,并且帮助确保答案适合于该特定情况。

第二,图提供更高的处理效率,因此借助图来优化模型并加速学习过程,可以有效地增强机器学习的效率。

第三,基于数据关系的特征提取分析可以识别数据中最具预测性的元素。基于数据中发现的强特征所建立的预测模型拥有更高的准确性。

第四,图提供了一种保证AI决策透明度的方法,这使得通过AI得到的结论更加具有可解释性。AI和机器学习具有很大的应用潜力,而图解锁了这种潜力。这是因为图数据库技术支持领域相关知识和关联数据,使AI变得更广泛适用。

e29be81333cfe34c3eaac2b0d20920ee.png

《新程序员》数据库文章作者

近年来,云端部署的图数据库(SaaS/DaaS)成为了又一个发展趋势。国内的众多大厂纷纷推出自研的云端图数据库产品,例如百度的HugeGraph、阿里的GDB、腾讯的TGDB、华为的GES图计算引擎。

就总体趋势而言,我们能够预见,大数据时代,数据缺失不再是最大的挑战,我们渴求的是挖掘数据价值的能力,而数据的价值很大一部分在于数据之间的关联。图数据库和图分析作为处理关联数据最有效的技术和方法,一定会继续大放异彩,书写数据库应用的新篇章。

d05d5e0dddf2efdcabbcedad23d1502c.png

与我共读《新程序员》

欢迎入群交流

d7f0c9b5fc19bcc6446d2131bf4effc8.png

更多阅读

新刊人物速递|对话OceanBase创始人阳振坤

尤雨溪Vue登榜GitHub之路看似不难

中国云原生用户调查报告来了!

猜你喜欢

转载自blog.csdn.net/Blockchain_lemon/article/details/124854274
今日推荐