HBase整体架构与常用Shell操作

  一,HBase整体架构

 二,HBase常用Shell命令操作

  • 创建一张mytest表, 包含base_info、extra_info两个列族 
  • 向mytest表中插入信息,row key为 rk1,列族base_info中添加name列标示符,值为wang
  • 向mytest表中插入信息,row key为rk1,列族base_info中添加age列标示符,值为30
  • 向mytest表中插入信息,row key为rk1,列族extra_info中添加address列标示符,值为shanghai
hbase(main):001:0> create 'mytest', 'base_info', 'extra_info'

或

create 'mytest', {NAME => 'base_info', VERSIONS => '3'},{NAME => 'extra_info',VERSIONS => '3'}

<VERSIONS 是指此单元格内的数据可以保留最近的 3 个版本>


hbase(main):001:0> put 'mytest', 'rk1', 'base_info:name', 'wang'
hbase(main):001:0> put 'mytest', 'rk1', 'base_info:age', 30
hbase(main):001:0> put 'mytest', 'rk1', 'extra_info:address', 'shanghai'
  • hbase(main):001:0> get 'mytest', 'rk1' 
  • 获取lagou表中row key为rk1,base_info列族的所有信息
  • 获取表中row key为rk1,base_info列族的name、age列标示符的信息
  • 获取lagou表中row key为rk1,base_info、extra_info列族的相关的信息
hbase(main):001:0> get 'mytest', 'rk1'
hbase(main):001:0> get 'mytest', 'rk1', 'base_info'
hbase(main):008:0> get 'mytest', 'rk1', 'base_info:name', 'base_info:age'

hbase(main):010:0> get 'mytest', 'rk1', 'base_info', 'extra_info'
或
hbase(main):011:0> get 'mytest', 'rk1', {COLUMN => ['base_info', 'extra_info']}
或 <特指定相关的信息>
hbase(main):012:0> get 'mytest', 'rk1', {COLUMN => ['base_info:name', 'extra_info:address']}
  • 获取表中row key为rk1,cell的值为wang的信息
  • 获取表中row key为rk1,列标示符中含有a的信息 (模糊查询)
  • 查询mytest表中的所有信息
hbase(main):001:0> get 'mytest', 'rk1', {FILTER => "ValueFilter(=, 'binary:wang')"}
hbase(main):001:0> get 'mytest', 'rk1', {FILTER => "(QualifierFilter(=,'substring:a'))"}
hbase(main):000:0> scan 'mytest'
  • 查询表中列族为 base_info 的信息
  • 查询mytest表中列族为 base_info 和 extra_info且列标示符中含有a字符的信息
  • 查询mytest表中列族为base_info,rk范围是[rk1, rk3)的数据(rowkey底层存储是字典序)按rowkey顺序存储。
  • 查询mytest表中row key以rk字符开头的
hbase(main):001:0> scan 'mytest', {COLUMNS => 'base_info'}
或
hbase(main):002:0> scan 'mytest', {COLUMNS => 'base_info', RAW => true, VERSIONS => 3}
## Scan时可以设置是否开启Raw模式,开启Raw模式会返回包括已添加删除标记但是未实际删除的数据
## VERSIONS指定查询的最大版本数

hbase(main):001:0> scan 'mytest', {COLUMNS => ['base_info', 'extra_info'], FILTER => "(QualifierFilter(=,'substring:a'))"}

hbase(main):001:0> scan 'mytest', {COLUMNS => 'base_info', STARTROW => 'rk1', ENDROW => 'rk3'}

hbase(main):001:0> scan 'mytest',{FILTER=>"PrefixFilter('rk')"}

 * Hbase中 Scan查询会影响性能,因为列族的原因,row key为唯一性条件查询列,所以建议使用row key参与的条件查询,也就是上面标记为红色的查询方式为最好的。

# 更新操作同插入操作一模一样,只不过有数据就更新,没数据就添加,这里不做多的操作,之前分析时对timeStamp有说明,仅仅更改版本信息。

  • 删除mytest表row key为rk1,列标示符为 base_info:name 的数据
  • 删除 base_info 列族
  • 删除mytest表数据
  • 删除mytest表
hbase(main):002:0> delete 'mytest', 'rk1', 'base_info:name'

hbase(main):035:0> alter 'mytest', 'delete' => 'base_info'

hbase(main):001:0> truncate 'mytest'

#先disable 再drop
hbase(main):036:0> disable 'mytest'
hbase(main):037:0> drop 'mytest'
#如果不进行disable,直接drop会报错
ERROR: Table user is enabled. Disable it first.

猜你喜欢

转载自blog.csdn.net/qq_42773863/article/details/121366185