Hudi和Kudu的比较 - 代码天地

Hudi和Kudu的比较

其他 2021-11-26 04:24:12 阅读次数: 0

与Kudu相比，Kudu是一个支持OLTP workload的数据存储系统，而Hudi的设计目标是基于Hadoop兼容的文件系统（如HDFS、S3等），重度依赖Spark的数据处理能力来实现增量处理和丰富的查询能力，Hudi支持Incremental Pulling而Kudu不支持。 Hudi能够整合Batch和Streaming处理的能力，这是通过利用Spark自身支持的基本能力来实现的。一个数据处理Pipeline通常由Source、Processing、Sink三个部分组成，Hudi可以作为Source、Sink，它把数据存储到分布式文件系统（如HDFS）中。Apache Hudi在大数据应用场景中，所处的位置，如下图所示：
在这里插入图片描述

从上图中可见，Hudi能够与Hive、Spark、Presto这类处理引擎一起工作。Hudi有自己的数据表，通过将Hudi的Bundle整合进Hive、Spark、Presto等这类引擎中，使得这些引擎可以查询Hudi表数据，从而具备Hudi所提供的Snapshot Query、Incremental Query、Read Optimized Query的能力。

猜你喜欢

转载自blog.csdn.net/epitomizelu/article/details/120274382

Hudi和Kudu的比较

Kudu、Hudi和Delta Lake的比较

kudu

kudu的hash和range分区

Hbase、Kudu和ClickHouse 对比

Hbase、Kudu和ClickHouse对比

impala记录-安装kudu和impala

Hbase、Kudu和ClickHouse横向对比

HBase、Kudu 和 ClickHouse 全视角对比

Hudi：初识Hudi

使用Apache Spark和Apache Hudi构建分析数据湖

使用 docker-compose 搭建 Doris 和 Hudi 测试环境

kudu记录-kudu原理

kudu：安装kudu

Hive记录-Impala jdbc连接hive和kudu参考

KUDU使用注意点和心得体会

UBER Hudi

Hudi 简介

Kudu简介

kudu架构

kudu 介绍

KUDU介绍

Kudu编译

Kudu安装

Kudu优化

Kudu教程

kudu实践

使用Amazon EMR和Apache Hudi在S3上插入，更新，删除数据

Delta Lake 和 Apache Hudi 两种数据湖产品全方面对比

深度对比delta、iceberg和hudi三大开源数据湖方案

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)