HBase预分区设置

HBase预分区

创建HBase时默认一张表只有一个region,所有put操作都会往这个region中填充数据,当这个region过大就会进行split。

在创建表的时候就进行预分区,就可以减少当数据猛增时由于region split带来的资源消耗

HBase表的预分区需要紧密结合业务场景选择区分key值,每个region都有一个startkey和endkey表示该region存储rowKey范围

create 't10','cf',SPLITS=>['10','20','30']

create 't2', 'cf', SPLITS_FILE => '/home/hadoop/splitfile.txt' /home/hadoop/splitfile.txt中存储内容如下: 
20150501000000000
20150515000000000
20150601000000000

会创建4个region,可在hbase的Web UI界面查看

在这里插入图片描述

hdfs中也可以查到对应分区存储文件位置

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_38524532/article/details/86531742