工信部电子五所张志强:中国数据库行业发展趋势分析

嘉宾 | 张志强

在数字经济时代,中国作为全球发展增速最快的经济体,不断引领着数字化技术发展。如今,中国国产开源数据库历经20多年的发展,正呈现出百花齐放的新局面。

2022年7月27日,在2022开放原子全球开源峰会的数据库分论坛上,工业和信息化部电子第五研究所创新业务负责人张志强带来了《百花齐放,开源当先——中国数据库行业发展趋势分析》的主题分享。

 

数据库行业的历史机遇

在全新的数字时代,多元化的数据正以前所未有的速度呈现爆发式增长。IDC预测,2025年,全球的数据总量将达到175ZB,中国的数据总量将高达48.6ZB,成为全球第一。

海量的数据将为存储带来挑战,而数据库是迎接该挑战的关键技术。预到2025年,中国数据库市场最规模将达到688亿元,占全球比例的12.5%。由此可见,中国数据库的未来市场空间巨大。

在国家政策上,也给未来数据库发展带来了明确的指引。2021年3月份“十四五”规划纲要正式发布,提出要培育壮大人工智能、大数据、区块链等新兴技术产业,而这些技术与数据库紧密关联,需要依托数据库进行数据存储。

数据库的现状和挑战

首先,从全球看中国。根据Gartner最新分析报告,关于全球数据库市场占有率的数据中有两个好消息:

  1. 数据库系统的市场持续增长,2021年该市场的收入接近800亿美元,相比2017年翻了一番;
  2. 中国的阿里云、华为云、腾讯云三云厂商进入到了全球数据库领域的争夺当中。他们取得成功离不开国内庞大的数据库市场需求,说明中国的市场经济是快速发展的。

全球数据库的格局变化,从侧面揭示了数据库重要的方向——云化。云的成功,也逐渐成为数据库成功的新动能。

其次,从中国看中国。根据墨天轮中国数据库流行度排行榜的数据显示,国产数据库正在呈现百花齐放、欣欣向荣的新局面,目前有228家数据库参与了排行,在5月份的榜单中前9名有3家商业数据库、3家开源数据库和3家云数据库。

这体现了数据库技术发展的三个时代,从商业时代到开源时代再到云时代,现如今三个时代正在相互交融。

开源数据库在国内有极强的竞争力,以openGauss、TiDB、OceanBase三个数据库为代表。

2021年,CCF数据库专业委员会和墨天轮社区在数据库系统的分类和测评研究的工作中,提出了一些观:数据库依据数据模型、架构模型、负载模型和部署模型,呈现出主流的分类体系。其中,数据模型是最核心的分类法,关系型和非关系型成为两个关键分支。

在墨天轮排行榜收录的228款国产数据库中,依照数据模型分类,关系型数据库有150个,占比66%,成为当前关注的重点;非关系型数据库中,时序和图数据库分别为29个和25个,增长最快;键值、列、空间、向量、搜索等模型共24个,占比10%。

但开源数据库与全球相比,国内开源数据库占比仅为18%,远低于全球52%的比例。因此,加强开源社区的建设成为国产数据库建设和发展的重要命题。

正如国产数据库强依赖于开源技术,目前,国产数据库的测评体系也处于初级的效仿阶段,强依赖于开源的成果和外来技术。

虽然中国是唯一拥有联合国产业分类中所有工业门类的国家,应用场景非常丰富,但数据库典型场景的测评上,还是强依赖于国外的TPC组织的基础测评工具,难以自我创新。因此,数据库测评技术的创新、基础测评工具的研发、算力品控模型的制定,都要各行业共同努力和创新。

根据中国赛宝实验室的测评数据可见,国内基础软硬件性能与与国外的主流厂商有较大差距。即使在过去20年国产数据库企业取得了较大的进步,但仍然面临着很多亟待解决的问题和挑战。

  1. 最关键的是生态和人才,商业数据库经过50多年的发展,已经建设了广泛的生态壁垒,而至今国产数据库最需要加速建设的是生态建设,知识体系、服务体系、社区体系目前都需要建设
  2. 同时,国产数据库人才短缺。Oracle有4000名内核开发人员,这对国内的人员规模和速度也提出了挑战。因此,我认为数据库的发展趋势之一是开源,通过开源快速聚集人才队伍优势
  3. 此外,还包括同质化竞争严重、知识产权保护意识薄弱、售后能力不足、关键场景验证不足等挑战。

国产数据库的破局之道

面对问题,国产数据库该如何破局呢?可以借鉴Oracle公司发展的成功要素:

  1. 抓住了技术上的萌芽机遇期;
  2. 前沿技术路线的关键性选择;
  3. 授权模式和利优市场的成功;
  4. 创始人文化和企业家精神;
  5. 逐步累积的规模优势。

在数据库领域后来者欲追上领先者,必须在多个要素上取得增量优势。因此,可以从六个方面破局

  1. 形成合力集中攻关加速突破。这需要国内企业自身加大投入,或者是开源共建
  2. 培养吸引人才投身基础软件。这需要大家共同努力,其中高校的培养也很重要
  3. 产品方面要抓住数据库技术的前瞻成果。在数据库的演进中,有很多的阶段性成果,需要足够的技术去洞察和识别,抓住窗口期
  4. 产品方面还要找到关键场景进行验证。好的产品需要在更多的关键性场景下进行产品验证,不断迭代,打磨得更优秀
  5. 产业层面要设定引领指标。推动行业发展,尽可能降低低价值的竞争
  6. 发挥产业链协同的发展优势。通过集中力量办重要的事情,以各方的合力,让国产数据库取得突破性进展。

 追赶之后就是发展。在未来,数据库只有持续不断地把握和解决用户需求,才能够实现自身的持续发展。主要可以从以下几个角度考虑。

  1. 数据库要与新基建结合。这将成为数据库技术发展的重要方向,只有持续不断与创新的产品设施进行深度融合,数据库在性能上才能不断地取得突破
  2. 多模数据管理。要有更多的应用场景,用户的数据是多元化的,图片、音视频、位置信息等使得数据爆炸,使用多模数据管理使数据库能够支持更多的类型,能够解决不断涌现的数据需求
  3. 更加智能化。未来的数据库应该能够自治存取各种不同的数据,实现自治优化、自动修复、永续运行
  4. 更加安全。当数据承载一切的时候,保护数据安全应该是最重要的事件,隐私计算、全密态、防篡改等技术将成为热点。

猜你喜欢

转载自blog.csdn.net/csdnopensource/article/details/126117189
今日推荐