Druid.io系列（五）：查询过程 - 代码天地

Druid.io系列（五）：查询过程

其他 2018-06-11 17:52:51 阅读次数: 0

原文链接： https://blog.csdn.net/njpjsoftdev/article/details/52956194

Druid使用JSON over HTTP 作为底层的查询语言，不过强大的社区也为我们提供了多种查询方式，比如Python接口pydruid、R接口RDruid、JavaScript接口plywood、类SQL接口plyql、PHP接口druid-php等。

Druid查询目前只支持单表操作，基本涵盖了ANSISQL中常用的查询语句，包括：

聚合类(Aggregation)查询
时间序列查询
TopN查询
GroupBy

元信息(Metadata)类查询
时间范围查询（数据集最早和最近出现时间点）
Segment元信息
DataSource元信息

搜索类(Search)查询（包括Select查询）
不过Druid目前还不支持JOIN类操作，以上已支持的各类查询的详细说明可以参见：http://druid.io/docs/0.9.1.1/querying/searchquery.html

查询过程
在介绍BrokerNode中已基本概述了Druid是如何查询集群内的数据。BrokerNode作为集群内查询入口，需要了解数据在集群内的分布情况，才能将查询请求发送给对应的数据节点（包括HistoricalNode和Real-TimeNode），BrokerNode会merge每个节点返回的数据，最终返回给用户。

在这里主要说下带有过滤(filter)的查询请求，我们知道Segments内部存在位图索引，所以数据的过滤操作完全可以转换为bitmap的按位逻辑操作，所以无论是HistoricalNodes还是Real-TimeNodes，都不需要去查看原始数据，只需要通过位图索引的按位逻辑操作，获得符合过滤条件的行号，再取出需要的列返回给Broker即可。

猜你喜欢

转载自www.cnblogs.com/lenmom/p/9168198.html

Druid.io系列（五）：查询过程

Druid.io系列（四）：索引过程分析

Druid.io 查询分时段指标

Druid.io系列（一）：简介

Druid.io系列（九）：数据摄入

Druid.io系列（七）：架构剖析

Druid.io系列（六）：问题总结

Druid.io系列（八）：部署

Druid.io系列（三）： Druid集群节点

druid.io 优化

Druid.io系列（二）：基本概念与架构

Druid.IO简介系列之三：Datasource和segments

Druid：Druid.io 部署&使用文档

druid.io 去重计数

druid.io架构的个人理解学习

Druid.io通过NiFi摄取流数据

druid.io本地集群搭建 / 扩展集群搭建

druid.io kafka-Index-service.json任务

zookeeper 使用 curator (参考druid.io源码)

druid.io 列式数据存储和简单分析 TODO

druid.io出现的问题及解决方法

Druid阅读（五）client调用查询过程分析

海量数据实时OLAP分析系统-Druid.io安装配置和体验

druid.io架构的个人理解学习 part1 part2 翻译

Hadoop集群版本必须和Druid.io中版本同一，可以通过pull-deps下载相同hadoop-dependencies版本,e.g. :

druid.io 集成 hadoop 问题解决 /hdp/apps/${hdp.version}/mapreduce/mapreduce.tar.gz#mr-framework

druid查询

Oracle系列五多表查询

Java IO流系列（五）—— 用法总结

Mybatis学习系列（五）关联查询

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)