为什么Hbase能实现快速的查询 - 代码天地

为什么Hbase能实现快速的查询

其他 2018-12-16 02:05:03 阅读次数: 0

原地址：https://www.cnblogs.com/1130136248wlxk/p/4990910.html
你的快速是指什么？是根据亿级的记录中快速查询，还是说以实时的方式查询数据。

A：如果快速查询（从磁盘读数据），hbase是根据rowkey查询的，只要能快速的定位rowkey, 就能实现快速的查询，主要是以下因素：
1、hbase是可划分成多个region，你可以简单的理解为关系型数据库的多个分区。
2、键是排好序了的
3、按列存储的

首先，能快速找到行所在的region(分区)，假设表有10亿条记录，占空间1TB, 分列成了500个region, 1个region占2个G. 最多读取2G的记录，就能找到对应记录；

其次，是按列存储的，其实是列族，假设分为3个列族，每个列族就是666M，如果要查询的东西在其中1个列族上，1个列族包含1个或者多个 HStoreFile，假设一个HStoreFile是128M，该列族包含5个HStoreFile在磁盘上. 剩下的在内存中。

再次，是排好序了的，你要的记录有可能在最前面，也有可能在最后面，假设在中间，我们只需遍历2.5个HStoreFile共300M

最后，每个HStoreFile(HFile的封装)，是以键值对（key-value）方式存储，只要遍历一个个数据块中的key的位置，并判断符合条件可以了。一般key是有限的长度，假设跟value是1:19（忽略HFile上其它块），最终只需要15M就可获取的对应的记录，按照磁盘的访问 100M/S，只需0.15秒。加上块缓存机制（LRU原则），会取得更高的效率。

B：实时查询
实时查询，可以认为是从内存中查询，一般响应时间在1秒内。HBase的机制是数据先写入到内存中，当数据量达到一定的量（如128M），再写入磁盘中，在内存中，是不进行数据的更新或合并操作的，只增加数据，这使得用户的写操作只要进入内存中就可以立即返回，保证了HBase I/O的高性能。

实时查询，即反应根据当前时间的数据，可以认为这些数据始终是在内存的，保证了数据的实时响应。

猜你喜欢

转载自blog.csdn.net/tclwh123/article/details/84036020

为什么Hbase能实现快速的查询

为什么索引能提高查询速度

为什么索引能提高查询速度？

如何实现分库分表，有哪些策略，为什么能提高查询效率

了解索引为什么能快速查找数据

使用索引为什么能提高查询速度？

索引为什么能提高查询性能

hbase为什么快

HBase的快速查询

反射为什么能反射，内部是怎样实现的

Runnable为什么能实现资源共享而Thread不能

ddr 和 selectio ip 为什么能实现高速

为什么出现了HBase？HBase为什么要有？

Hbase实现like查询

数据库添加索引为什么能加快查询速度

SQL Server表能查询出结果为什么提示对象名无效？

【阿里面试】：MySQL索引为什么能提高查询效率这么多？

到现在还搞不懂，索引为什么能提供查询性能？

hbase为什么不会脑裂

淘宝为什么使用HBase及如何优化的

有了HBase为什么还要Kudu？

spark实现分页查询hbase

移动办公oa管理软件为什么能实现企业更好的流程管理？

HTML5为什么现在这么火？真的能实现高薪就业吗？

简单探究丨病毒之所以能快速入侵进用户的计算机，究竟是为什么？

java语言为什么能跨平台

JAVA语言为什么能跨平台？

synchronized为什么能锁住对象

【聊天记录】为什么「能」恢复？

树为什么能长这么高？

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)