Gartner数据库报告解读及数据库技术发展方向预测


Gartner报告解读

近期,国际知名行业分析机构Gartner发布了“2017年数据库厂商推荐报告”(Other Vendors to Consider for Operational DBMSs 2017)。自Gartner发布数据库行业报告以来,第一次收录了来自中国的数据库厂商,分别是阿里云Alibaba Cloud、SequoiaDB巨杉数据库以及南大通用Gbase,标志着中国数据库产业发展已经迈出了一大步。


据了解,Gartner对于技术厂商和产品的选拔要求十分严格,除了会考察产品在整个业界维度的技术先进性,产品成熟度,还需要考察企业的市场规模、营收状况,以及考察成熟的大型企业案例和全球化客户的布局。


其中,金融行业等头部行业用户的认可是重要的评价条件之一。 金融行业在企业级技术和应用中一直保持领先,金融行业的技术系统也一 直在政府和监管部门的严格监管下不断的发展。金融行业正在转变为“技术驱动 业务”,但是其 IT 和数据管理系统的迭代演进却十分谨慎,既要满足严格的监管 法律和,同时还要在保证稳定情况下与复杂传统系统兼容。


数据库技术发展

Gartner今年的多分报告中认为数据库未来需要在几个方面进行创新:

· 分布式架构

· Multimodel多模数据管理

· 数据安全

· 混合访问HTAP

· 云架构整合

特别是Multimodel多模数据管理,是近年来数据库发展的重要新要求。


1)分布式架构

分布式架构是数据库发展的大势所趋。分布式架构显著提升大容量数据存储和管理能力,既保障面对大量用户的高并发需求,又保障了面对业务变化的弹性增长能力。分布式数据库的使用成本,也远低于传统数据库。


分布式数据库则可以用于复制传统的事务数据,以便通过增加移动访问和工作人员的分布来实现更高容量,只读需求,从而快速方便地访问传统的事务数据。例如,商业银行使用分布式数据库向网上银行用户提供交易信息访问查询。这从传统的数据库环境中消除了一些负载,从而降低了处理需求,从而降低了成本。传统关系型数据库产品,仅仅考虑在单个服务器上运行,然后通过ACID的特性来维护数据完整性,但是他们的设计和技术却没有考虑海量数据下的容量扩展。


对于数据库来说,分布式架构的优势十分明显:

· 弹性扩容提升性能:需要弹性地扩容以应对PB级别以上的数据管理,这种弹性容量调整可以实现让所有数据保持在线。同时满足高并发业务操作需求,实现海量数据高性能读写以及实时访问查询。

· 高可用与数据安全:分布式架构数据高可用保障。除了经典的主-从架构,数据库和存储方面还有类似Ceph的纠删码google spanner的原子钟分布式算法等等方式。

· 简化开发运维节约成本。随着应用的增多,更需要分布式架构支持,进行数据分区管理,实现业务有效隔离。同时,保持系统的弹性、兼容性,大大简化运维开发。


2)Multi-Model 多模数据与非结构化数据

随着应用和业务的多样化,系统对于多类型数据的管理能力提出了新的要求。Multi-Model多模是指在单个数据库平台中支持非结构化结构化数据在内的多种数据类型。


一直以来,传统关系型数据库仅支持表单类型的结构化数据存储和访问能力,而对于层次型对象、图片影像等半结构化与非结构化数据管理无能为力。如今,随着应用类型的多样化和存储成本的降低,单一数据类型已经无法满足许多综合性业务平台的需求,例如,许多企业应用需要处理图表以及关系数据,这些平台需要能支撑Multi-Model多模数据管理的产品。一些传统的数据库产品能够处理XML和面向对象数据类型,Oracle这样的产品现在也渐渐开始支持JSON,甚至图形和键值K-V数据。


特别对于非结构化数据,当前企业管理的结构化数据只占信息总量的15%,而剩下85%的信息是非结构化数据,对于非结构化数据,企业需要实现数据的统一管理,并实现数据共享和数据流转;需要应对数据总量的飞速增长;同时还需要应对数据激增带来了管理成本和使用成本的快速增长。如金融企业在互联网金融等等新需求下,随着银行远程开户、柜面无纸化、面部识别等系统的建立和升级正在面临大量不同类型的非结构化数据(如图片,视频和文件)带来的挑战。


数据库层面的Multi-Model和非结构化数据管理,将能实现结构化、半结构化和非结构化数据的统一管理,实现非结构化数据的实时访问,大大降低了运维和应用的成本。


3)容灾与双活与数据安全

伴随着在企业内部价值的不断提升,数据已经成为了金融企业的生命线与核心资产。作为承载着企业关键数据的数据库,其安全性、可靠性、稳定性一直是金融级数据库的核心价值。


但是,在分布式架构中完美实现高可用与容灾面临着诸多技术挑战。一般来说,以统计分析为目标的分布式数据库相对弱化了该部分的功能,而面向在线与交易业务的分布式数据库则对数据安全保持了高标准的严格要求。


高可用性是所有现在新的数据架构必备特性之一。高可用对于银行这样的企业级用户更是重要,中国银行业监督管理委员会要求所有银行数据中心必须进行高可用备份,包括数据中心的“两地三中心”能力,也就是银行数据存储管理整体架构的分布式架构转型成为了标准要求。这其中,数据库的分布式转型就将成为数据管理现代化的首要任务。


大多数银行数据中心还需要“双活”容灾的能力,即在两个数据中心实时进行备份,一旦失去一个中心,所有业务可以及时切换中心继续运行。同时,通过数据中心“双活”,在保证数据安全下,也将数据存储,数据处理的高可用性和灾难恢复相结合,这样数据管理可以以更低的成本实现连续的可用性,并以最少的努力最大限度地利用“双活”的数据中心。


4)HTAP混合事务/分析处理模式

新的业务需求下,数据库除了应对操作型业务,还会在业务实时数据监控,数据报告和决策辅助方面有许多数据实时应用的场景。传统架构中OLTP和OLAP两类业务是完全分离的。两者的隔离导致整个系统在数据一致性,数据平台管理上带来了巨大的阻碍。此前, RDBMS和大数据(Hadoop)分别成为数据处理的两个方面,一旦一种架构选择了一种场景,就不得不放弃另一种场景。


因此,HTAP混合事务/分析处理模式成为数据库发展的一个新要求。


根据Gartner的最新定义,混合负载(HTAP Hybrid Transactional/Analytical Processing)在保留原有在线交易功能同时,也强调了数据库原生计算分析的能力。支持混合负载的数据库能够避免在传统架构中,在线与离线数据库之间大量的数据交互,同时也能够针对最新的业务数据进行实时统计分析。


为了避免在线实时读写与批处理作业之间的资源干扰,混合负载型数据库通常使用读写分离或内存处理技术实现。一般来说,分布式数据库的多副本架构天然支持读写分离技术,而基于传统架构的数据库往往采用内存处理技术进行实现。


5)云架构整合能力 

云架构整合对于数据库未来发展也是一个比较重要的特性,虽然分布式架构下是原生支持云架构的,但是对于数据库云DBaaS来说,仍有许多新的要求。


对于数据库云服务的定义,是具有一定程度自助服务的可伸缩的,弹性的多租户订阅服务。它由云服务提供商(CSP)本身或是基于了CSP的基础架构的第三方软件供应商提供的产品或是服务。同时数据库云服务,是不允许直接访问后台底层的系统服务如操作系统和存储软件的。这一领域上,Gartner也有意将DBaaS划分在 PaaS的层面,与IaaS或者IaaS+区分开。


对于DBaaS,除了基础的数据库功能,云架构下需要具备的能力还包括基础设施的管理,自主管理监控,多租户管理,快速扩容,在线升级等等。


小结

数据库技术发展至今,在数据量和数据类型的压力下,数据库技术本身也面临新的挑战,因此分布式技术是数据库发展的大势所趋。面对雨后春笋般涌现的新型分布式数据库产品,在经过了爆发阶段后,新一代数据库市场也将迎来稳定期,能够满足企业用户需求的产品才回最终走到最后。


猜你喜欢

转载自blog.csdn.net/qq_27676247/article/details/79444569