kudu - 代码天地

kudu

其他 2020-01-02 14:50:57 阅读次数: 0

kudu部署:
官网:
https://kudu.apache.org/docs/index.html

yum安装kudu master和kudu server

大数据存储:
静态数据：以 HDFS 引擎作为存储引擎，适用于高吞吐量的离线大数据分析场景。这类存储的局限性是数据无法进行随机的读写。

动态数据：以 HBase、Cassandra 作为存储引擎，适用于大数据随机读写场景。这类存储的局限性是批量读取吞吐量远不如 HDFS，不适用于批量数据分析的场景。

HDFS，使用列式存储格式Apache Parquet，Apache ORC，适合离线分析，不支持单条记录级别的update操作，随机读写性能差。这个就不多说了，用过HDFS的同学应该都知道这个特点.

HBase，可以进行高效随机读写，却并不适用于基于SQL的数据分析方向，大批量数据获取时的性能较差。

但在真实的场景中，边界可能没有那么清晰，面对既需要随机读写，又需要批量分析的大数据场景.
kudu它不及HDFS批处理快，也不及HBase随机读写能力强，但是反过来它比HBase批处理快（适用于OLAP的分析场景），而且比HDFS随机读写能力强（适用于实时写入或者更新的场景）

猜你喜欢

转载自www.cnblogs.com/hongfeng2019/p/12132855.html

kudu

kudu记录-kudu原理

kudu：安装kudu

Kudu简介

kudu架构

kudu 介绍

KUDU介绍

Kudu编译

Kudu安装

Kudu优化

Kudu教程

kudu实践

Hudi和Kudu的比较

[Kudu基础]--Kudu+Impala介绍

大数据Kudu（二）：Kudu架构

Apache Kudu集群安装

Kudu vs HBase

kudu存储引擎

Kudu的架构以及优势

kudu 1.7 源码安装

kudu 问题集

kudu底层存储原理

impala+kudu

kudu yum 安装

Kudu分区 --- 高级部分

Kudu分区 --- 基础部分

Kudu架构概述

Kudu概念与术语

kudu tablet design

kudu原理设计初探

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)