HBase应用实践专场-HBase for Solr - 代码天地

HBase应用实践专场-HBase for Solr

编程语言 2021-04-01 14:51:52 阅读次数: 0

HBase检索能力增强思路

(1)HBase

主表一个rowkey，只能设计一个rowkey=X|Y这种场景。

合适场景：

X=a
X>=a, X>a
X<=a,或者X<a
X=a and Y = b
X=a and Y <= b
X=a and Y>=b

优点：

高并发、高效快速

缺点：

只有一个rowkey设计，后期业务变化不不能修改rowkey结构
检索场景简单，有局限性，一个rowkey必须由前缀X出现才能快速查找，比如上述只提供Y=b的话，依然需要全表扫描

(2)Phoenix/自建HBase索引

扩展更多rowkey设计，允许更多rowkey=X|Y rowkey=Y|Z rowkey=X|Z等这种设计。

合适场景：

一个表，允许更更多类似左边的场景
更多X、Y、Z...条件来组合来进⾏行行
类似左边描述的条件查询

优点：

依然保持高并发、高效rowkey查询。允许有更多rowkey设计，最大化hbase rowkey检索优势

缺点：

表变多，如果业务有U/V/W/X/Y/Z 6个条件两两组合的业务场景，就需要15个表，数据膨胀，例如这个时候，X在索引⾥里里被保存了5次
查询也有局限性

(3)Solr/ES

任意条件 X、Y、Z。

合适场景：

X = a or Y= b (rowkey设计不不能实现的)
X> a and Y < b (rowkey设计不不能实现的)
X like “%hbase%”
Geo地理距离检索
支持分词查询
支持facet/group分类分组查询返回，例如一个关键词搜索新闻网站，它可以分政治、体育、经济等类别返回统计与结果
任意条件组合查询等

优点：

支持检索功能更丰富； OR 组合查询，多个条件范围组合查询，like、分词等全文检索，这些查询使用hbase rowkey设计是难以满足的
对于类似U/V/W/X/Y/Z 6个条件两两组合的业务场景,数据膨胀率远低于 hbase的rowkey方案

缺点：

类似hbase这种简单kv查询下，并发不如hbase高效快速

HBase for Solr介绍

HBase rowkey查询已经不能满足复杂多变的用户业务查询需求，HBase for Solr就是为了满足广大HBase用户日益变化的查询需求，是HBase查询检索能力的补充，是大数据多模式数据库发展趋势的基础之一，比如一些图、时空等应用，都可以使用solr提供的索引服务。

猜你喜欢

转载自blog.51cto.com/15060465/2679315

HBase应用实践专场-HBase for Solr

solr hbase 大数据

HBase应用实践专场-HBase问题排查思路

Solr与HBase架构设计

HBASE同步数据到SOLR

cdh solr 索引hbase数据

solr应用

Hbase到Solr数据同步及Solr分离实战

Hbase到Solr同步常用操作

基于Solr的HBase多条件查询测试

Hbase_Solr_Indexer(Cloudera Manager版本)

JanusGraph-hbase-solr环境搭建

hbase全文服务(solr) 系列资料

HBase + Key-Value Store Indexer + Solr

中国HBase技术社区第四届MeetUp上海站——HBase应用实践专场

Hbase+Solr解决Hbase多条件查询

Solr+Hbase+Hbase Indexer查询方案流程整合（转载）

Solr系列一：Solr（Solr介绍、Solr应用架构、Solr安装使用）

solr快速实践

solr入门实践

solr 应用相关

Solr SpellCheck 应用

Solr Facet 技术应用

solr的基本应用

Solr技术分析及应用

solr应用入门实例

Solr Facet的应用

中国HBase技术社区第八届MeetUp ——HBase应用实践专场【培训视频及资料下载】

Hbase二级索引 Solr 异常 The most likely cause is another Solr server (or another solr core in this server)

hbase coprocessor 应用实践

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)