Hbase知识点总结 - 代码天地

Hbase知识点总结

其他 2018-06-25 05:57:25 阅读次数: 2

一.客户端存储与读取数据流程

首先，存储数据的region信息是在hbase：meta（元数据表）中管理，而管理hbase:meta的region（只有一个）的位置是由zookeeper管理的。因此client查询数据的流程：1.client首先查询zookeeper中管理hbase：meta的region位置。2.找到管理hbase：meta的region后就找到了hbase:meta。 3.找到hbase：meta后，在meta中scan（扫描）数据的region。4. 找到管理数据的region后就找到了需要查询的数据。（其中region是由HRegionServer管理）

二. HMaster 连接zookeeper

HMaster连接zookeeper是为了查找HRegionServer的位置然后管理HRegionServer。

三. HBase数据存储

HBase中所有数据文件都是存储在Hadoop HDFS文件系统上，主要包括两种文件。

1.HFile: HBase中KeyValue数据存储格式，HFile是Hadoop的二进制格式文件，实际上StoreFile就是对HFile的轻量级包装，进行数据存储。

2.Hlog File ，HBase中WAL（预写日志）的存储格式，物理上是Hadoop的Sequence File。

HBase存储数据是首先会向HLog存储一份以防HRegionServer宕机，在向MenStore存储。

四. HRegionServer

HRegionServer内部管理了一系列的HRegion对象，每个HRegion对应了table中的一个region，HRgion中由多个HStore组成。每个Hstore对应了Table中的column family（列簇），可以看出每个列簇就是一个集中地存储单元，因此最好将具备共同IO特性的column放在一个column family中，这样最高效。

HStore存储时HBase的核心，有两部分组成，一部分是MenStore，一部分是StoreFile。MEMStore是Stored Memory Buffer,用户写入的数据首先会当如MemStore，当MemStore满了以后就会Flush成一个StoreFile（底层实现是HFile）。

五. MemStore和StoreFile

Client写入->存入MemStore，一直到MEMStore存满->Flush成一个StoreFile，直到增长到一定阈值->触发Compact合并操作->将多个StoreFile合并成一个StoreFile，同时进行版本合并和数据删除->当StoreFile Compact后，逐步形成越来越大的StoreFile->单个StoreFile大小超过一定阈值之后，触发Split操作，把当前RegionSplit成2个Region ,Region会下线，新Split的2个孩子Region会被HMaster分配到相应的HRegionServer上，使得原先1个Region的压力得以分流道2个Region上。

Hbase只是增加数据，所有的更新和删除操作都是在Compact阶段做的，所以，用户写操作只需要进入到内存中即可立即返回，从而保证I/O高性能。

六. HLog文件结构

WAL以为Write Ahead log，类似MySQL中的binlog，用来做灾后恢复。

猜你喜欢

转载自blog.csdn.net/nieji3057/article/details/80074589

Hbase知识点总结

hbase --知识点总结

【HBase十三】HBase知识点总结

Hbase知识点总结（三）

Hbase知识点总结（二）

Hbase知识点总结（一）

Hbase知识点总结（四）

Hbase知识点

转载：HBase核心知识点总结

Hadoop生态之HBase知识点总结

大数据培训纪实：HBase知识点集中总结

重游HBase核心知识点总结

[转帖]HBase核心知识点总结

Hbase整体知识点

HBase知识点（三）

HBASE知识点汇总

知识点总结

总结：知识点

总结知识点

知识点的总结

HBase快速入门系列(10) | HBase知识点总结(建议收藏！)

HBase BlockCache知识点铺垫

HBase核心知识点

Linux：HBase知识点笔记

hbase知识点及实时读写原理

好程序员大数据实：HBase知识点集中总结

django知识点总结

JavaWeb知识点总结

Canvas知识点总结

Redis知识点总结

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)