Databend 的安装配置和使用 - 代码天地

Databend 的安装配置和使用

编程语言 2024-01-08 21:19:53 阅读次数: 0

介绍

Databend 是一个内置在 Rust 中的开源、弹性和工作负载感知的云数据仓库，为 Snowflake 提供了具有成本效益的替代方案，专门对最大的数据集进行复杂分析而设计。

性能：

在存储对象上，能快速进行数据分析。
没有索引和分区，但也能快速查询。
利用数据级并行和指令级并行技术实现最佳性能。

数据操作：

支持原子操作，如SELECT、INSERT、DELETE、UPDATE、REPLACE、COPY和MERGE。
提供高级功能，如时间旅行和多目录（Apache Hive / Apache Iceberg）。
支持以 CSV、JSON 和 Parquet 等各种格式。
支持半结构化数据类型，如 ARRAY、MAP 和 JSON 。
支持类似 Git 的 MVCC 存储，以便于查询、克隆和恢复历史数据。

对象存储：

Amazon S3
Azure Blob Storage
Google Cloud Storage
MinIO
Ceph
Wasabi
SeaweedFS
Cloudflare R2
Tencent COS
Alibaba OSS
QingCloud QingStor

Databend 的高级架构由meta-service layer、query layer和storage layer组成。

meta-service layer(元服务层)有效地支持多个租户，该层在系统中发挥着至关重要的作用：

元数据管理：处理数据库、表、集群、事务等的元数据。
安全性：管理安全环境的用户身份验证和授权。

query layer(查询层)处理查询计算，由多个集群组成，每个集群包含多个节点。每个节点是查询层中的核心单元，由以下部分组成：

规划师：使用来自的元素为SQL语句制定执行计划关系代数，结合了投影、滤波器和限位等运算符。
优化器：基于规则的优化器应用预定义规则，如“谓词下推”和“未使用列的修剪”，以优化查询执行。
处理器：遵循 Pull & Push 方法，根据规划师指令构建查询执行管道。处理器相互连接，形成一个可以分布在节点之间的管道，以提高性能。

storage layer采用开源柱状格式 Parquet ，并引入了自己的表格格式，以提高查询性能。主要功能包括：

二级索引：加快各种分析维度的数据位置和访问速度。
复杂数据类型索引：旨在加快半结构化数据等复杂类型的数据处理和分析。
段：Databend 有效地将数据组织成段，提高数据管理和检索效率。
集群：在段内使用用户定义的集群密钥来简化数据扫描。

安装和配置

Databend 官网：https://databend.rs/doc/integrations/access-tool/mysql

Databend 下载：https://databend.rs/download

本地部署，使用 JDBC 驱动程序连接 Databend 步骤如下：

根据官网下载地址，选择与自己电脑版本对应的，下载解压后可以看到以下系列文件。
将文件 databend-query.toml 中的以下部分注释取消。
在文件夹脚本中运行脚本**start.sh，打开进入该文件目录中终端执行 ./scripts/start.sh。
在DBeaver中，选择数据库>驱动程序管理器以打开驱动程序管理器，然后单击新建以创建新驱动程序。

在这里插入图片描述
根据上图片，添加设置相关信息如下图：

在这里插入图片描述

在“库”选项卡上，单击“添加工件”，然后将以下内容复制并粘贴到“**依赖项声明”**文本框中，点击确定即可。

<dependency>
    <groupId>com.databend</groupId>
    <artifactId>databend-jdbc</artifactId>
    <version>0.0.8</version>
</dependency>

在这里插入图片描述

使用前面添加的驱动，连接本地的 Databend 。

相关扩展

Databend支持的工具、平台和编程语言如下：

在这里插入图片描述

可以查看对应的工具和编程语言，了解更多用法。

参考资料

猜你喜欢

转载自blog.csdn.net/weixin_50357986/article/details/135416330

Databend 的安装配置和使用

使用 Databend 加速 Hive 查询

Databend 源码阅读：配置管理

在 BI 工具 Tableau 中使用 databend

特性快闪：使用 Databend 玩转 Iceberg

理解 Databend Cluster key 原理及使用

【Databend】数据库和表操作

使用 PGO 优化 Databend 二进制构建

使用 Databend Kafka Connect 构建实时数据同步

Tapdata 和 Databend 数仓数据同步实战

祝贺！Databend Cloud 和腾讯云达成合作

官宣！Databend Cloud 和青云科技达成合作

Databend in 2022

使用轻量级 CDC debezium-server-databend 构建实时数据同步

使用 LF Edge eKuiper 将物联网流处理数据写入 Databend

构建并运行 Databend

Databend 开源周报 #74

Databend 开源周报 #73

Databend 开源周报 #72

Databend 开源周报 #71

Databend 开源周报 #70

Databend 开源周报 #69

Databend 开源周报 #68

Databend 开源周报 #67

Databend Roadmap in 2023

Databend 玩转Local 模式

Databend join reorder 策略

【Databend】数据类型

Migrate your data into databend with DataX

开源、云原生且实时分析型的现代数据仓库DataBend的介绍，及其与其它开源文件存储的结合使用实例

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)