HBASE表设计

Rowkey设计

Rowkey是不可分割的字节数，按字典排序由低到高存储在表中。
在设计HBase表时，Rowkey设计是最重要的事情，应该基于预期的访问模式来为Rowkey建
模。Rowkey决定了访问HBase表时可以得到的性能，原因有两个：
1）Region基于Rowkey为一个区间的行提供服务，并且负责区间的每一行；
2）HFile在硬盘上存储有序的行。
这两个因素是相互关联的。当Region将内存中数据刷写为HFile时，这些行已经排过序，也会
有序地写到硬盘上。Rowkey的有序特性和底层存储格式可以保证HBase表在设计Rowkey之后
的良好性能。
关系型数据库可以在多列上建立索引，但是HBase只能在Rowkey上建立索引。（可以通过ES
为Hbase的列建立索引）而设计Rowkey有各种技巧，而且可以针对不同访问模式进行优化，
我们接下来就研究一下。

1. 将Rowkey以字典顺序从大到小排序
原生HBase只支持从小到大的排序，但是现在有个需求想展现影片热度排行榜，这就要求实现
从大到小排列，针对这种情况可以采用Rowkey=Integer.MAX_VALUE-Rowkey的方式将
Rowkey进行转换，最大的变最小，最小的变最大，在应用层再转回来即可完成排序需求。

2.RowKey尽量散列设计
最重要的是要保证散列，这样就会保证所有的数据都不是在一个Region上，从而避免读写的时
候负载会集中在个别Region上。比如ROWKEY_Random

3.RowKey的长度尽量短

如果Rowkey太长，第一存储开销会增加，影响存储效率；第二内存中Rowkey字段过长，会导
致内存的利用率降低，进而降低索引命中率。
Rowkey是一个二进制码流，Rowkey的长度被很多开发者建议说设计在10~100个字节，不过
建议是越短越好，不要超过16个字节。

原因如下：
1）数据的持久化文件HFile中是按照KeyValue存储的，如果Rowkey过长比如100个字
节，1000万列数据光Rowkey就要占用100*1000万=10亿个字节，将近1G数据，这会极大影
响HFile的存储效率；
2）MemStore将缓存部分数据到内存，如果Rowkey字段过长内存的有效利用率会降低，系统
将无法缓存更多的数据，这会降低检索效率。因此Rowkey的字节长度越短越好。

4.RowKey唯一
5.RowKey建议用String类型
虽然行键在HBase中是以byte[]字节数组的形式存储的，但是建议在系统开发过程中将其数据类
型设置为String类型，保证通用性。
常用的行键字符串有以下几种：
1）纯数字字符串，譬如9559820140512；
2）数字+特殊分隔符，譬如95598-20140512;
3）数字+英文字母，譬如city20140512；
4）数字+英文字母+特殊分隔符，譬如city_20140512

6.RowKey设计得最好有意义
RowKey的主要作用是为了进行数据记录的唯一性标示，但是唯一性并不是其全部，具有明确
意义的行键对于应用开发、数据检索等都具有特殊意义。
譬如数字字符串：9559820140512，其实际意义是这样：95598（电网客服电话）+
20140512（日期）。
行键往往由多个值组合而成，而各个值的位置顺序将影响到数据存储和检索效率，所以在设计
行键时，需要对日后的业务应用开发有比较深入的了解和前瞻性预测，才能设计出可尽量高效
率检索的行键。

7.具有定长性
行键具有有序性的基础便是定长，譬如20140512080500、20140512083000，这两个日期时
间形式的字符串是递增的，不管后面的秒数是多少，我们都将其设置为14位数字形式，如果我
们把后面的0去除了，那么201405120805将大于20140512083，其有序性发生了变更。所以
我们建议，行键一定要设计成定长的。
此外，目前操作系统是都是64位系统，内存8字节对齐。控制在16个字节，8字节的整数倍利用
操作系统的最佳特性。

列族的设计

在设计hbase表时候，列族不宜过多，尽量的要少使用列族。
经常要在一起查询的数据最好放在一个列族中，尽量的减少跨列族的数据访问。

HBase优化

硬件和操作系统调优

1）配置内存
HBase对于内存的消耗是非常大的，主要是其LSM树状结构、缓存机制和日志记录机制决定的，所以物理内存当然
是越大越好。并且现在内存的价格已经降到可以批量配置的程度，例如一条三星DDR3的16GB内存，价格大约在
1000元左右。
在互联网领域，服务器内存方面的主流配置已经是64GB，所以一定要根据实际的需求和预算配备服务器内存。如果
资源很紧张，推荐内存最小在32GB，如果再小会严重影响HBase集群性能。
2）配置CPU
HBase给使用者的印象可能更偏向于“内存型”NoSQL数据库，从而忽略了CPU方面的需求，其实HBase在某些应
用上对CPU的消耗非常大，例如频繁使用过滤器，因为在过滤器中包含很多匹配、搜索和过滤的操作；多条件组合
扫描的场景也是CPU密集型的；压缩操作很频繁等。如果服务器CPU不够强悍，会导致整个集群的负载非常高，很
多线程都在阻塞状态（非网络阻塞和死锁的情况）。
一般CPU的品牌有Intel、AMD、IBM，Intel是主流。
现在的服务器支持1、2、3、4、6、8、10路CPU，而每路CPU的核心有双核、四核、六核、八核、十二核。CPU数
量和核心数之间可以互相搭配，当然值越大相应的价格越高。建议每台物理节点至少使用双路四核CPU（2×4），
主流是2～8路，一般单颗CPU至少四核。一颗四核心CPU，便宜的，价格在1500元左右，还是可以接受的。所以，
对于CPU密集型的集群，当然是越多越好。
磁盘的配置
如果是机械盘，看转速，14000转，一般的是7000转。
可以考虑用SSD固态硬盘，底层是通过电阻器原件构架的，速度接近于内存
3）垃圾回收器（GC）的选择

对于运行HBase相关进程JVM的垃圾回收器，不仅仅关注吞吐量，还关注停顿时间，而且两者之间停顿时间更为重
要，因为HBase设计的初衷就是解决大规模数据集下实时访问的问题。那么按照首位是停顿时间短，从这个方面
CMS和G1有着非常大的优势。
而CMS作为JDK1.5已经出现的垃圾收集器，已经成熟应用在互联网等各个行业。所以，选用CMS作为老年代的垃圾
回收器。与CMS搭配的新生代收集器有Serial和ParNew，而对比这两个收集器，明显ParNew具有更好的性能，所
以新生代选用ParNew作为垃圾收集器。那么，最终选用的垃圾收集器搭配组合是CMS+ParNew。而且很多成熟应
用已经验证了这种组合搭配的优势。
与CMS收集器相关的几个重要参数的具体含义、默认值和相关说明详见表。
在这里插入图片描述
配置方式：需要添加到hbase-env.sh文件中
export HBASE_OPTS="-XX：+UseConcMarkSweepGC" -XX：CMSInitiatingOccupancyFraction=70 -XX：
+UseCMSCompactAtFullCollection
4）JVM堆大小设置
堆内存大小参数hbase-env.sh文件中设置，设置的代码如下：
export HBASE_HEAPSIZE=16384
在上面代码中指定堆内存大小是16284，单位是MB，即16GB。当然，这个值需要根据节点实际的物理内存来决
定。一般不超过实际物理内存的1/2。

服务器内存的分配，比如服务器内存64GB，为操作系统预留出8G_{16GB。此外给Yarn留出8G}16GB，如果没有其
他框架，把剩余的留给HBase

Hbase调优

1）调节数据块（data block）的大小
HFile数据块大小可以在列族层次设置。这个数据块不同于之前谈到的HDFS数据块，其默认值是65536字节，或
64KB。数据块索引存储每个HFile数据块的起始键。数据块大小的设置影响数据块索引的大小。数据块越小，索引越
大，从而占用更大内存空间。同时加载进内存的数据块越小，随机查找性能更好。但是，如果需要更好的序列扫描
性能，那么一次能够加载更多HFile数据进入内存更为合理，这意味着应该将数据块设置为更大的值。相应地，索引
变小，将在随机读性能上付出更多的代价。
可以在表实例化时设置数据块大小，代码如下：
hbase（main）：002：0> create ‘mytable’，{NAME => ‘colfam1’， BLOCKSIZE => ‘65536’}
如果mytable表在实际业务中，随机查找业务多，就调小。
如果范围查询（顺序扫描）业务多，就调大。
2）适当时机关闭数据块缓存
把数据放进读缓存，并不是一定能够提升性能。
如果一个表或表的列族只被顺序化扫描访问或很少被访问，
则Get或Scan操作花费时间长一点是可以接受的。在这种情况下，
可以选择关闭列族的缓存。
关闭缓存的原因在于：如果只是执行很多顺序化扫描，会多次使用缓存，
并且可能会滥用缓存，从而把应该放进缓存获得性能提升的数据给排挤出去。
所以如果关闭缓存，不仅可以避免上述情况发生，而且可以让出更多缓存给其他表和同一表的其他列族使用。数据
块缓存默认是打开的。

可以在新建表或更改表时关闭数据块缓存属性：
hbase（main）：002：0> create ‘mytable’， {NAME => ‘colfam1’， BLOCKCACHE => ‘false’}
如果预见到mytable的范围查询（顺序查找）业务较多，
这种场景可以将mytable的读缓存机制关掉。
如果不关掉，会导致此表大量的范围数据都会加载到BlockCache里，
会挤掉其他表有用的随机查找数据。
3）开启布隆过滤器
数据块索引提供了一个有效的方法getDataBlockIndexReader（），在访问某个特定的行时用来查找应该读取的
HFile的数据块。但是该方法的作用有限。HFile数据块的默认大小是64KB，一般情况下不能调整太多。
如果要查找一个很短的行，只在整个数据块的起始行键上建立索引是无法给出更细粒度的索引信息的。例如，某行
占用100字节存储空间，一个64KB的数据块包含（64×1024）/100=655.53，约700行，只能把起始行放在索引位
上。要查找的行可能落在特定数据块上的行区间，但也不能肯定存放在那个数据块上，
这就导致多种可能性：该行在表中不存在，或者存放在另一个HFile中，甚至在MemStore中。这些情况下，从硬盘
读取数据块会带来I/O开销，也会滥用数据块缓存，这会影响性能，尤其是当面对一个巨大的数据集且有很多并发读
用户时。
布隆过滤器（Bloom Filter）允许对存储在每个数据块的数据做一个反向测验。当查询某行时，先检查布隆过滤
器，看看该行是否不在这个数据块。布隆过滤器要么确定回答该行不在，要么回答不知道。因此称之为反向测验。
布隆过滤器也可以应用到行内的单元格上，当访问某列标识符时先使用同样的反向测验。
使用布隆过滤器也不是没有代价，相反，存储这个额外的索引层次占用额外的空间。布隆过滤器的占用空间大小随
着它们的索引对象数据增长而增长，所以行级布隆过滤器比列标识符级布隆过滤器占用空间要少。当空间不是问题
时，它们可以压榨整个系统的性能潜力。
可以在列族上打开布隆过滤器，代码如下：
hbase（main）：007：0> create ‘mytable’， {NAME => ‘colfam1’， BLOOMFILTER => ‘ROWCOL’}
布隆过滤器参数的默认值是NONE。另外，还有两个值：ROW表示行级布隆过滤器；ROWCOL表示列标识符级布
隆过滤器。行级布隆过滤器在数据块中检查特定行键是否不存在，列标识符级布隆过滤器检查行和列标识符联合体

是否不存在。ROWCOL布隆过滤器的空间开销高于ROW布隆过滤器。
4）开启数据压缩
HFile可以被压缩并存放在HDFS上，这有助于节省硬盘I/O，此外，可以节省带宽。
性能瓶颈：cpu，内存，磁盘，带宽
但是读写数据时压缩和解压缩会抬高CPU利用率。压缩是表定义的一部分，可以在建表或模式改变时设定。除非确
定压缩不会提升系统的性能，否则推荐打开表的压缩。只有在数据不能被压缩，或者因为某些原因服务器的CPU利
用率有限制要求的情况下，有可能需要关闭压缩特性。
HBase可以使用多种压缩编码，包括LZO、SNAPPY和GZIP，LZO和SNAPPY是其中最流行的两种。
当建表时可以在列族上打开压缩，代码如下：
hbase（main）：002：0>
create ‘mytable’， {NAME => ‘colfam1’， COMPRESSION => ‘SNAPPY’}
注意，数据只在硬盘上是压缩的，在内存中（MemStore或BlockCache）或在网络传输时是没有压缩的。
5）设置Scan缓存
HBase的Scan查询中可以设置缓存，定义一次交互从服务器端传输到客户端的行数，设置方法是使用Scan类中
setCaching（）方法，这样能有效地减少服务器端和客户端的交互，更好地提升扫描查询的性能。
下面的代码展示了如何使用setCaching（）方法。
6）显式地指定列
当使用Scan或Get来处理大量的行时，最好确定一下所需要的列。因为服务器端处理完的结果，需要通过网络传输
到客户端，而且此时，传输的数据量成为瓶颈，如果能有效地过滤部分数据，使用更精确的需求，能够很大程度上
减少网络I/O的花费，否则会造成很大的资源浪费。如果在查询中指定某列或者某几列，能够有效地减少网络传输
量，在一定程度上提升查询性能。下面代码是使用Scan类中指定列的addColumn（）方法。

7）关闭ResultScanner
ResultScanner类用于存储服务端扫描的最终结果，可以通过遍历该类获取查询结果。但是，如果不关闭该类，可能
会出现服务端在一段时间内一直保存连接，资源无法释放，从而导致服务器端某些资源的不可用，还有可能引发
RegionServer的其他问题。所以在使用完该类之后，需要执行关闭操作。这一点与JDBC操作MySQL类似，需要关
闭连接。代码的最后一行rsScanner.close（）就是执行关闭ResultScanner。
8）使用批量读
通过调用HTable.get（Get）方法可以根据一个指定的行键获取HBase表中的一行记录。同样HBase提供了另一个方
法，通过调用HTable.get（List）方法可以根据一个指定的行键列表，批量获取多行记录。使用该方法可以
在服务器端执行完批量查询后返回结果，降低网络传输的速度，节省网络I/O开销，对于数据实时性要求高且网络传
输RTT高的场景，能带来明显的性能提升。

9）使用批量写
通过调用HTable.put（Put）方法可以将一个指定的行键记录写入HBase，同样HBase提供了另一个方法，通过调用
HTable.put（List）方法可以将指定的多个行键批量写入。这样做的好处是批量执行，减少网络I/O开销。

10）关闭写WAL日志
在默认情况下，为了保证系统的高可用性，写WAL日志是开启状态。写WAL开启或者关闭，在一定程度上确实会对
系统性能产生很大影响，根据HBase内部设计，WAL是规避数据丢失风险的一种补偿机制，如果应用可以容忍一定
的数据丢失的风险，可以尝试在更新数据时，关闭写WAL。该方法存在的风险是，当RegionServer宕机时，可能写
入的数据会出现丢失的情况，且无法恢复。关闭写WAL操作通过Put类中的writeToWAL（）设置。

11）设置AutoFlush
HTable有一个属性是AutoFlush，该属性用于支持客户端的批量更新。
该属性默认值是true，即客户端每收到一条数据，立刻发送到服务端。
如果将该属性设置为false，当客户端提交Put请求时，将该请求在客户端缓存，
直到数据达到某个阈值的容量时（该容量由参数hbase.client.write.buffer决定）
或执行hbase.flushcommits（）时，才向RegionServer提交请求。
这种方式避免了每次跟服务端交互，采用批量提交的方式，所以更高效。
但是，如果还没有达到该缓存而客户端崩溃，该部分数据将由于未发送到RegionServer而丢失。这对于有些零容忍
的在线服务是不可接受的。所以，设置该参数的时候要慎重。

12）预创建Region
在HBase中创建表时，该表开始只有一个Region，插入该表的所有数据会保存在该Region中。随着数据量不断增
加，当该Region大小达到一定阈值时，就会发生分裂（Region Splitting）操作。并且在这个表创建后相当长的一
段时间内，针对该表的所有写操作总是集中在某一台或者少数几台机器上，这不仅仅造成局部磁盘和网络资源紧
张，同时也是对整个集群资源的浪费。这个问题在初始化表，即批量导入原始数据的时候，特别明显。为了解决这
个问题，可以使用预创建Region的方法。

13）调整ZooKeeper Session的有效时长
参数zookeeper.session.timeout用于定义连接ZooKeeper的Session的有效时长，这个默认值是180秒。这意味着
一旦某个RegionServer宕机，HMaster至少需要180秒才能察觉到宕机，然后开始恢复。或者客户端读写过程中，
如果服务端不能提供服务，客户端直到180秒后才能觉察到。
在某些场景中，这样的时长可能对生产线业务来讲不能容忍，需要调整这个值。
此参数在HBase-site.xml中，通过<property></property>

上一篇 13.大数据学习之旅——HBase第三天

14.大数据学习之旅——HBASE表设计&HBase优化

HBASE表设计

Rowkey设计

列族的设计

HBase优化

猜你喜欢