hbase定义一个列族

知识点来源: Hbase企业应用开发实战-p13-p52

Hregion对应Table的一个region
Hregion对应多个HStore(即基于列族的存储)
Hstore由两部分构成MemStore(缓存)和StoreFile(落地文件,存储在HDFS上)
数据先存入MemStore,当MemStore超过设定的阈值时,则flush一次到StoreFile中(即落地)

写数据时有的列族已经写满达到阈值,另外的列族还没写多少没有达到阈值,但是真实情况是只要有一个列族达到阈值,其他列族都会跟着flush,会存在许多StoreFile小文件,后期会引发很多compact操作,所以列族多了会影响效率.

其他列族都会跟着flush的原因是为了保证一个region中的数据能保存在一个服务器节点上

猜你喜欢

转载自blog.csdn.net/u010916338/article/details/80901431