CSDN专访张程伟&金毅:回归数据库技术本原,做难而正确的事

数据库技术是信息科技领域最为重要的技术之一。随着科技的不断进步,数据库技术得到了迅速的发展,应用范围也越来越广泛。

与此同时,在数据量持续高速增长的情况下,企业对数据库提出了更高的要求,例如数据存储越来越多,性能越来越强;企业在数据迁移过程中,对数据库的兼容性、安全合规也提出了新要求;应用场景多样化更是推动着数据库要具备更强的适应能力等。而目前大火的分布式数据库,虽说可以实现对单个系统的总容量提升,但不能很好地解决投入成本与业务容量收益的比例,即单位事务给客户带来的利润(事务利润)。

如何继续提升数据库的性能?

回归数据库的技术本原,数据库的单机性能重回聚光灯下。正如云和恩墨·本原数据技术合伙人张程伟在2023数据技术嘉年华上所说:“就像高速路一样,可以不停地拓车道,但如果能把单车道的通行量翻倍,那其实是更难却更有效的方向。”本原数据的初心正是如此,也就是回归数据库技术最本质的东西。

92d06be97888a28c0992060ad8242035.jpeg

云和恩墨·本原数据技术合伙人 张程伟

DTC 2023

提升单机性能,难而有道

“无论数据库跑在哪里,不管是线下还是云上,私有云还是公有云,分布式还是集中式,终归都需要一个内核在一台机器上跑起来。所以说,一个强大的单机内核是技术创新的重点,是数据库技术的本原。”云和恩墨·本原数据技术合伙人金毅在2023数据技术嘉年华上这样感慨道

eddcb4b805b3451433774d5774d9adcd.jpeg

云和恩墨·本原数据技术合伙人 金毅

经历了数十年的发展,数据库技术解决的问题已覆盖方方面面,积淀形成了相对成熟完整的体系结构。除了提供数据存储的功能外,数据库系统还需要满足丰富的数据管理的需求,所以数据库的性能,不能止步于此,还应该继续提升单机性能。只有单机性能上去了,分布式或者其他数据库技术,也才能再上一个台阶。

而衡量一个技术在数据库内核当中是否被成功地运用,有一个非常简单的标准——在固定的数据计算负载前提下,能够为客户提供最低成本的方案,就是最好的技术。把成本投入和给客户提供的事务所带来的收益利润进行整合,本原数据引入了“事务利润”的概念:越低成本投入获得越高事务处理能力,为客户带来更高业务容量就会带来更高的事务利润。只有事务利润空间有了,作为数据库和数据服务提供方与用户之间才更容易找到共赢。因此,从全生命周期角度度量方案的事务利润可以更有效地度量数据库技术给用户带来的价值。

相对于集中式方案,分布式方案从理论上来讲会产生额外的网络通信成本,造成代码路径的延长和稳定性风险问题,并不能提升客户的事务利润。因此,重新审视单机的性能发挥成为应考虑的关键解决之道。如果单机性能能够得到数量级突破,在固定业务容量的前提下,小规模分布式方案可考虑简化成单机方案,大规模分布式方案可极大缩减系统实施规模。既简化硬件部署、降低能耗碳排放,又提高系统稳定性、减少维护成本,从全生命周期来看便能够达成降本增效。

探究本原,金毅认为现代成本友好的主流硬件的性能无法被传统数据库内核充分发挥。总结当前硬件性能特征包括:众核CPU、大容量内存、SSD高速磁盘,他提出使用新内核实现思路和新算法可以充分发挥现代硬件性能,结合在关键路径消除竞争热点和压榨无效计算,便能够达到数量级提升(下一代)数据库单机性能的目标。具体来看:

  • 单机单核计算能力有限,单机众核可以形成数量优势带来的大规模并行计算能力。

  • 大内存可以将一个交易系统中频繁使用的热数据几乎完全驻留在内存里,这便意味着数据库内核设计和实现思想可以发生一个转变——把主存中的业务数据作为数据计算和优化核心,去思考如何有效地使用它,而不是放在磁盘中的数据。因此,以优化频繁发生的慢速I/O为主要目的的传统数据库内核实现思想,可以转变为以优化CPU和DRAM主存间性能瓶颈的新数据库内核实现思想。

  • SSD高速磁盘当前通过PCle到SSD,单盘就能够提供GB级每秒的I/O带宽,通过快速I/O能力,可以高效率地移出冷数据或将冷数据交换回DRAM主存成为热数据,支撑了上述以内存中热数据为中心的设计实现。

  • 在大比重围绕DRAM主存的数据计算中,其关键路径中无效的93%的指令可以通过采用新的数据结构和算法实现来尽量压缩和消除掉,这为单机性能达到10倍提升提供了基础。

  • 当数据库计算更多围绕主存发生的时候,解决CPU与主存性能瓶颈,提高CPU计算实际效率成为重点。该关注点也曾因传统设计思路被忽略。CPU Cache效率成为解决该瓶颈的关键,技术优化方面包括提高CPU Cache命中率、减少CPU Cache一致性同步,以及解决亲和性不足造成的CPU卡顿等待问题。

  • 传统数据库在各主要模块的内部实现中大量存在集中式访问对象,在众核大规模并发场景下,产生拥塞热点严重影响众核计算性能发挥,需要新的技术实现尽可能分拆并行访问间冲突,解放并行效率。

DTC 2023

本原数据在行动

张程伟表示,他们对技术的追求可以称得上“执着”,始终认为做技术不是一件花哨的事情,并以真实的市场需求为导向,会坚持打磨产品、创新研发。

目前,云和恩墨·本原数据主要研发了 MogDB 和 Uqbar 两款产品。

MogDB 是基于 openGauss 开源内核进行研发,推出的一款企业级关系型数据库,核心适用于交易型场景。

Uqbar 是在 openGauss 开源内核基础上打造的超融合时序数据库,可以用于管理海量时序数据,也可以用于OLTP场景管理关系数据,还支持跨时序数据和关系数据的复杂关联查询,为物联网场景提供一站式数据解决方案。

DTC 2023

国产数据库,任重而道远

国产数据库蓬勃发展的同时,也面临几个突出的问题:

  • 可靠性和稳定性有待加强,数据库是整个应用系统的核心,一旦瘫痪意味着承载应用和业务中断;

  • 运维人员担心迁移到国产分布式数据库后,运维技能和方式与原来相比有过大差异,无法对数据库进行有效运维;

  • 对原有应用系统升级的改造成本较高,担心架构和应用的兼容性出现问题;

  • 不少国产数据库只是对国外开源数据库的包装或者少量修改,难以称为真正的国产数据库。

当然,现在国产数据库基础软件面对的系统环境与前些年相比已经有了很大的变化,国产数据库的发展壮大任重而道远,继续坚持长期投入是对其发展最大的助力。

数据应用的变化倒逼数据库具备更大的数据存储容量、更多的数据计算模型、更快的数据业务响应能力,整体技术发展进入后关系型阶段。行业应该在追求架构设计分布式化、模型构建场景化的同时,关注数据库技术内核,坚持打造产品的客户成功本质,坚持实事求是的技术创新,选择从单机内核为起点的演进与革新路线,让分布式和上云更高效、更有效。

“明者见于无形,智者虑于未萌。”希望有更多的像云和恩墨·本原数据这样的企业,回归技术本原,做难而正确的事。

——————————————————

版权声明:本文为CSDN博主「CSDN云计算」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/FL63Zv9Zou86950w/article/details/130366953

关于本原数据

2775ce524aa355f7186839b25af8bb47.png

本原数据是一家由技术、产品、商业和运营领域专才联合云和恩墨发起设立的创新型数据技术基础软件公司,致力于面向全球市场研发安全、稳定、高效、敏捷、经济的企业级数据库软件。

65382703f9bfca2d5fff1002616e4614.gif

数据驱动,成就未来,云和恩墨,不负所托!


云和恩墨创立于2011年,以“数据驱动,成就未来”为使命,是智能的数据技术提供商。我们致力于将数据技术带给每个行业、每个组织、每个人,构建数据驱动的智能未来。

云和恩墨在数据承载(分布式存储、数据持续保护)、管理(数据库基础软件、数据库云管平台、数据技术服务)、加工(应用开发质量管控、数据模型管控、数字化转型咨询)和应用(数据服务化管理平台、数据智能分析处理、隐私计算)等领域为各个组织提供可信赖的产品、服务和解决方案,围绕用户需求,持续为客户创造价值,激发数据潜能,为成就未来敏捷高效的数字世界而不懈努力。

猜你喜欢

转载自blog.csdn.net/weixin_54551388/article/details/130518357