为什么要构建二级索引
- Hbase使用Rowkey作为唯一索引,只有使用Rowkey前缀进行查询,才是索引查询
- 导致大部分的查询都是不走索引,性能比较差
为什么二级索引能提高查询性能?
- 使用走两次索引代替全表扫描
- 先走索引查询索引表,获取原表的rowkey
- 再根据原表的rowkey查询原表的数据
Phoenix为什么可以实现二级索引?
Phoenix底层封装了大量的协处理器
create [local] index indexName on Tbname(col) [include]
什么是全局索引?
-
创建全局索引,会自动构建一张索引表
-
索引表结构
- Rowkey:索引字段+原表的rowkey
- 列:占位置x
-
特点
- 如果查询字段或者查询条件不是索引字段,就不会走索引
-
应用
-
适合于读多写少
-
所有索引的构建都会阻塞原表的请求
-
什么是覆盖索引?
-
创建覆盖索引,会自动构建一张索引表
-
索引表结构
- Rowkey:索引字段+原表的rowkey
- 列:将include中的列放入索引表
-
特点
-
如果查询字段或者查询条件不是索引字段,就不会走索引
-
如果查询的字段在索引表中,直接从索引表返回结果
-
什么是本地索引?
-
创建覆盖索引,会自动基于原表构建一个列族来实现索引存储
-
原表的数据中:多了一个索引列族
-
特点
- 不论查询字段是否是索引字段,都会走索引
- 将索引与数据存储在同一台RegionServer,提高索引读写性能
-
注意
-
本地索引会修改原数据表,对于本地索引只能使用Phoenix来操作表的数据
-
盐表不能使用本地索引
-