hadoop 之 hbase 原理 (hmaster, hregionserver, zookeeper, 读写流程及组件职责)

目录

  • 1、体系图
  • 2、写流程
  • 3、flush过程
  • 4、合并过程
  • 5、读过程
  • 6、hmaster职责
  • 7、hregionserver职责
  • 8、client职责

1、体系图

2、写流程

  • client向hregionserver发送写请求。
  • hregionserver将数据写到hlog(write ahead log),为了数据的持久化和恢复。
  • hregionserver将数据写到内存(memstore)。
  • 反馈client写成功。

3、flush过程

  • 当memstore数据达到阈值(1版本默认是64M,2版本默认是128M),将数据刷到硬盘,将内存中的数据删除,同时删除Hlog中的历史数据。
  • 并将数据存储到hdfs中。
  • 在hlog中做标记点。

4、合并过程

  • 当数据块达到 4块 (默认值),hmaster将数据块加载到本地,进行合并。
  • 当合并的数据超过256M(1版本为256M, 2版本为512M),进行拆分,将拆分后的region分配给不同的hregionserver管理
  • 当hregionser宕机后,将hregionserver上的hlog拆分,然后分配给不同的hregionserver加载,修改.META. 。
  • 注意:hlog会同步到hdfs。

5、读过程

  • 通过zookeeper和-ROOT- .META.表定位hregionserver。
  • 数据从内存和硬盘合并后返回给client。
  • 数据块会缓存。

6、hmaster职责

  • 管理用户对Table的增、删、改、查操作;
  • 记录region在哪台Hregion server上;
  • 在Region Split后,负责新Region的分配;
  • 新机器加入时,管理HRegion Server的负载均衡,调整Region分布;
  • 在HRegion Server宕机后,负责失效HRegion Server 上的Regions迁移。

7、hregionserver职责

  • HRegion Server主要负责响应用户I/O请求,向HDFS文件系统中读写数据,是HBASE中最核心的模块
  • HRegion Server管理了很多table的分区,也就是region。

8、client职责

  • HBASE Client使用HBASE的RPC机制与HMaster和HRegionServer进行通信;
  • 管理类操作:Client与HMaster进行RPC;
  • 数据读写类操作:Client与HRegionServer进行RPC。

猜你喜欢

转载自blog.csdn.net/py_tamir/article/details/85225205