数据架构现代化,Cloudera“混合数据”能够成为定海神针吗?

03c174af12e29cc29653b5a53cdd7b25.jpeg

“现代数据架构,加速数据变现。”Cloudera大中华区区域副总裁王刚在近日于上海举行的Cloudera Evolve上如此表示,“作为一家混合数据公司,Cloudera将积极拥抱混合数据未来。”


ed114e3e21cd4967137d3c3dbdae3622.jpegCloudera大中华区区域副总裁王刚

现代数据架构水到渠成

如果提到“肯睿”这个Cloudera的中文名字,可能很多人会感觉陌生,但是一说到Cloudera Data Platform (CDP)这个Cloudera公司的旗舰产品,大多数用户都会发出一声感慨,因为他们都曾受益于这一混合数据平台。

IDC的调研显示,国内某金融机构早在2017年便采用了CDP,但是目前,其大数据建设进度只有30%~40%。从中国行业用户的普遍现状来看,虽然很多企业在构建数仓并做了大量可视化的工作,但是在智能化、数字化方面仍缺少统一规划,进展不如想象中那样快。从整体需求层面来看,中国行业用户迫切需要打造一个安全稳定的现代化数据平台,并且希望利用数据智能来创造新的价值,重塑竞争力。

在业务驱动、大数据处理愈加复杂、多云部署成为主流的背景下,行业用户对大数据平台提出了更高的要求。随着数字化转型逐渐深入,IT基础架构的现代化、应用的现代化都被提上了日程,这其中数据架构的现代化也是不可或缺的一环。Cloudera正是为有效应对现代数据架构的挑战,才不断强化其CDP。


105c06941102e1bbbd3fe46be1a46d89.jpegCloudera大中华区技术总监刘隶放

Cloudera大中华区技术总监刘隶放表示,Cloudera混合数据平台能够更好地支持现代数据架构。在这一平台架构中,由下往上,最底层的混合云和多云的基础架构,能够保证跨所有环境的一致体验;其上,数据编织(Data Fabric)和编排(Orchestration)层,能够以自助服务的方式智能、安全地动态编排不同的数据源,利用数据平台提供集成的可信数据,支持各种应用程序、分析和其他工作负载;再往上,湖仓一体与多功能分析,具有集成和统一数据仓库及数据湖的功能,旨在支持同一数据集上的AI、BI、ML和数据工程;最上一层,数据网格与数据应用,基于面向域的分布式数据产品,使用通用数据基础设施作为平台来托管、准备和服务其数据资产。
89fb3d0104b777eff00c7236f379300d.jpeg

“我们始终在强调,我们是一家混合数据架构公司,既可以支持私有化的部署,也可以在公有云上支持混合数据。这是由客户需求决定的。从本地到云再到边缘,用户会根据业务发展以及安全合规运营的要求,在混合云的环境中最优化地存储数据、调用数据、使用数据,在满足数据安全性的前提下,最大程度地追求降本增效。因此,我们不遗余力地在自己的平台上支持用户的混合数据应用。”刘隶放如是说。

IDC分析师指出,为满足数据架构现代化的需要,行业用户有必要在混合云、数据编排和湖仓一体上下更多功夫。如今,多云、混合云已经是架构转型的必然趋势。过去,企业已经建了一些大数据平台和系统,现在则要对这些平台和系统中的海量复杂数据进行分析,实现智能化的洞察,而湖仓一体化的架构可以让这项工作事半功倍。另外,像实时数据、流数据的处理,以及交互式分析,都对数据架构提出了更高的要求,研究、部署和应用现代数据架构成了当前一项非常紧迫的任务。

上汽大众2017年开始引入Cloudera的CDH,2018构建了数据湖,2022年用6个月的时间升级到CDP,它也是国内汽车行业率先实现升级的。升级到CDP后,上汽大众的批量作业性能平均提升2.5倍,其中最高提升达6.6倍。据王刚介绍,已有83%的中国客户完成或部分完成了向CDP的升级。2023年,Cloudera希望这一比例超过90%。

2023,有的放矢

作为一家混合数据公司,Cloudera致力于为千行百业的客户提供满足数据编织、湖仓一体、数据网格和未来数据生态系统架构要求的混合数据平台,使得客户能够在多个公有云、私有云以及本地,访问和分析数据,从而做出由数据驱动的明智决策,走向由数据驱动的未来。


d53a29afeee87b7edcd3bf6baf6e6b4a.jpeg

为了实现上述目标,2023年,Cloudera将主要做好以下三项工作。

重点推动PVC DS私有云数据服务。新应用内置工作负载隔离,价值实现时间提高10倍,而数据中心基础设施却减少约一半。今天,大数据走向云原生已经是大势所趋。Cloudera一直积极践行云原生,并可以基于Kubernetes对外提供数据加工、数据仓库、机器学习等服务组件,同时提供统一的权限管理,并确保应用上的绝对隔离,以满足安全性的要求。国内已经有用户采用Cloudera云原生的数据服务,用于支持机器学习、数仓等应用。“对云原生的数据服务提供支持是必然选择,而且不仅要在公有云环境下提供很好的支持,更要应用于私有云环境中。”刘隶放如是说。

更好地支持Iceberg版本(公有云的版本已经推出,私有云的版本马上发布),实现对开放的湖仓一体架构的支撑,最终在单一平台上支持AI、BI、ML和数据工程等,同时与安全性完美结合。刘隶放表示:“未来,湖仓一体化还有很长的一段路要走,需要厂商、社区共同进行大量持续的投入。”

对象存储组件Ozone值得期待。有了Ozone的支持,CDP能够更好地支持更多小文件以及更大数据量的存储,并且可以支持云原生。

另外,在动态数据的处理上,Cloudera也在推陈出新。以前,用户的数据大多是静态的。但是现在,比如在工业领域,传感器数据就是动态数据。为了更好地应对数据分发与实时流处理,Cloudera推出了针对Data-in-Motion动态数据的三个组件:DataFlow,通过Apache NiFi允许开发人员连接任何地点、数据源与结构类型的数据,进行加工处理后,交付到任意地方;Stream Processing,通过Apache Flink & Kafka提供完整的企业级数据流管理,并借助标准界面,使得开发人员、数据分析师、数据科学家能够轻松地构建实时混合云应用;Cloudera SDX,通过Apache Ranger & Apache Atlas,使得数据流安全可控,并且得到有效的监控与治理。

“如果企业的总裁早上睁开眼的第一件事就是要看到报表和分析结果,那么这样的企业通常会是我们的优质客户。”刘隶放表示,“很多企业之前可能已经在开源的组件上做了一些大数据方面的有益尝试,当他们真正想向生产系统移植时,出于企业级特性、安全合规等方面的考虑,他们最终会找到Cloudera。我们提供标准化的7×24小时专业服务,能够满足企业级客户对功能特性、安全合规、混合多云等多方面的需求。”


猜你喜欢

转载自blog.csdn.net/Bmo40mqfG249H/article/details/130436933