HBase的读写流程

        本篇博客小菌为大家带来的是关于HBase的读写路程的介绍。
        

读请求流程

在介绍之前先为大家科普几个前提!

  • 什么是meta表?
    meta 表时hbase系统自带的一个表。里面存储了hbase用户表的原信息。
  • 什么是元信息?
    meta表内记录一行数据是用户表一个region的start key 到endkey的范围。
  • meta表存在什么地方?
    meta表存储在regionserver里。 具体存储在哪个regionserver里?zookeeper知道。
            
    好了,清楚了上面的概念之后,理解起来就会简单很多了。

meta,region之间的关系如下(在HBase0.96版本中已经取消了root表)
在这里插入图片描述
具体的流程如下:

1.到zookeeper询问meta表在哪
2.到meta所在的节点(regionserver)读取meta表的数据
3.找到region 获取region和regionserver的对应关系,直接到regionserver读取region数据
在这里插入图片描述

写请求过程

在这里插入图片描述
写入的流程与读的流程稍复杂一些

1、Client先访问zookeeper,找到Meta表,并获取Meta表元数据。确定当前将要写入的数据所对应的HRegion和HRegionServer服务器。
2、Client向该HRegionServer服务器发起写入数据请求。

  • Client先把数据写入到HLog,以防止数据丢失。
  • 然后将数据写入到Memstore。

3、Memstore达到阈值,会把Memstore中的数据flush到Storefile中 4、当Storefile越来越多,达到一定数量时,会触发Compact合并操作,将多个小文件合并成一个大文件。
5、Storefile越来越大,Region也会越来越大,达到阈值后,会触发Split操作,变成两个文件。

说明:hbasez 支持数据修改(伪修改),实际上是相同rowkey数据的添加。hbase只显示最后一次的添加。
        
        好了,本次的分享就到这里了,受益的小伙伴或对大数据技术感兴趣的朋友记得关注小菌哟(^U^)ノ~YO

在这里插入图片描述

发布了146 篇原创文章 · 获赞 1340 · 访问量 35万+

猜你喜欢

转载自blog.csdn.net/weixin_44318830/article/details/103656305