HBase的预分区 - 代码天地

HBase的预分区

其他 2020-02-09 20:36:31 阅读次数: 0

1、为何要预分区？

增加数据读写效率
负载均衡，防止数据倾斜
方便集群容灾调度region
优化Map数量
2、如何预分区？
每一个region维护着startRow与endRowKey，如果加入的数据符合某个region维护的rowKey范围，则该数据交给这个region维护。
3、如何设定预分区？
1、手动指定预分区
hbase(main):001:0> create ‘staff’,‘info’,‘partition1’,SPLITS => [‘1000’,‘2000’,‘3000’,‘4000’]
完成后如图：

2、使用16进制算法生成预分区
hbase(main):003:0> create 'staff2','info','partition2',{NUMREGIONS => 15, SPLITALGO => 'HexStringSplit'}
完成后如图：

3、分区规则创建于文件中
创建splits.txt文件内容如下：
cd /export/servers/
vim splits.txt
aaaa bbbb cccc dddd
然后执行：

hbase(main):004:0> create ‘staff3’,‘partition2’,SPLITS_FILE => ‘/export/servers/splits.txt’

成功后如图：
在这里插入图片描述
4、使用JavaAPI创建预分区
Java代码如下：
/** * 通过javaAPI进行HBase的表的创建以及预分区操作 */ @Test public void hbaseSplit() throws IOException { //获取连接 Configuration configuration = HBaseConfiguration.create(); configuration.set("hbase.zookeeper.quorum", "node01:2181,node02:2181,node03:2181"); Connection connection = ConnectionFactory.createConnection(configuration); Admin admin = connection.getAdmin(); //自定义算法，产生一系列Hash散列值存储在二维数组中 byte[][] splitKeys = {{1,2,3,4,5},{'a','b','c','d','e'}}; //通过HTableDescriptor来实现我们表的参数设置，包括表名，列族等等 HTableDescriptor hTableDescriptor = new HTableDescriptor(TableName.valueOf("stuff4")); //添加列族 hTableDescriptor.addFamily(new HColumnDescriptor("f1")); //添加列族 hTableDescriptor.addFamily(new HColumnDescriptor("f2")); admin.createTable(hTableDescriptor,splitKeys); admin.close(); }

发布了93 篇原创文章 · 获赞 288 · 访问量 18万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45765882/article/details/103711265

HBase:HBase的预分区

HBase预分区设计

HBase的预分区设计

HBase预分区

Hbase 预分区代码

HBase预分区设置

HBase之预分区

Hbase - 预分区的技巧

HBase的预分区

关于HBase的预分区

HBase优化预分区

hbase 预分区与自动分区

HBASE 预分区建表

Hbase优化之预分区

HBase 预分区 & Phoenix 加盐

Hbase的预分区与Hbase的rowKey的设计原则

Hbase优化之预分区设计

HBase 创建表时的预分区

hbase的split策略和预分区

hbase学习笔记-表预分区

Hbase 表创建（压缩、编码、预分区）

HBase学习之六: hbase的预分区设计

hbase预分区---工作中的用法----region理解-----TODO

预期数据下HBase的预分区的实现

hbase热点问题解决（预分区）

HBASE的存储缺陷以及预分区的解决办法

HBase表设计----预分区和散列存储

Hbase的Rowkey设计以及如何进行预分区

hbase HexStringSplit预分区，spark通过bulkload入数据

关于Hbase的预分区，解决热点问题

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)