Solr与HBase架构设计 - 代码天地

Solr与HBase架构设计

编程语言 2018-05-10 01:51:07 阅读次数: 0

1.1 一次性创建索引

l、删除全索引

效率很高，可以关闭Solr后，直接删除Data文件。

2、重新创建全索引

拉取HBase中全数据，分批次创建索引。

1.2 增量创建索引

1、触发器发送数据到Solr建索引。

配置并使用HBase触发器功能，配置实现如下：

alter 'angelHbase', METHOD => 'table_att', 'coprocessor' => '/home/hbase/hbase-0.94.18-security/lib/solrHbase.jar|solrHbase.test.SorlIndexCoprocessorObserver|1073741823|'

alter 'angelHbase', METHOD =>'table_att_unset', NAME => 'coprocessor$1'

然后编写SorlIndexCoprocessorObserver extendsBaseRegionObserver，重写postPut方法。在postPut方法中，需要正确地读出写入HBase的数据结构及数据，然后转化为相应的SolrInputDocument，再使用ConcurrentUpdateSolrServer方式向Solr服务器发送 SolrInputDocument数据，具体使用方法如之前博文介绍Solr的使用方法、性能对比所示。

注意：需要把Solr相关的jar包放入lib下，并且删除版本不一致的jar（有很多）。更新jar后要重启HBase才能生效。

具体性能如之前博文介绍Solr的使用方法、性能对比所示。 http://www.cnblogs.com/wgp13x/p/3742653.html http://www.cnblogs.com/wgp13x/p/3748764.html

2、触发器发送数据到RabbitMQ，Solr端从RabbitMQ获取数据建索引。

embedded方式官方不推荐使用。而使用ConcurrentUpdateSolrServer性能与上种方式并无区别。

3、建议：

在HBase中只存储1列，存储值为PB或Json串。（存在由bean到SolrInputDocument转化的类及annotation，以及各自的压缩算法）

或者：插入HBase的数据均以Bytes.toBytes(String)类型存储，如long型数值2存储为Bytes.toBytes(""+2)。否则在postPut()中需要知道每列的具体类型才能生成正确的SolrInputDocument，因为SolrInputDocument中需要的是String类型的数据。

具体的postPut方法代码，如有需要可以留言或直接跟本人联系。 http://www.cnblogs.com/wgp13x/

1.3 HBase与Solr系统架构设计

使用HBase搭建结构数据存储云，用来存储海量数据；使用SolrCloud集群用来搭建搜索引擎，将要查找的结构化数据的ID查找出来，只配置它存储ID。

1、具体流程：

wd代表用户write data写数据，从用户提交写数据请求wd1开始，经历wd2，写入MySQL数据库，或写入结构数据存储云中，wd3，提交到Solr集群中，从而依据业务需求创建索引。

rd代表用户read data读数据，从用户提交读数据请求rd1开始，经历rd2，直接读取MySQL中数据，或向Solr集群请求搜索服务，rd3，向Solr集群请求得到的搜索结果为ID，再向结构数据存储云中通过ID取出数据，最后返回给用户结果。

转发地址：http://itindex.net/detail/49796-solr-hbase-%E6%9E%B6%E6%9E%84

猜你喜欢

转载自1028826685.iteye.com/blog/2325489

Solr与HBase架构设计

HBase架构设计

Hbase小记--架构设计

HBase_HBase 简介与架构设计

HBase 的功能原理、设计思路、架构设计及源码的解析

HBase的架构设计为什么这么厉害!

缓存架构设计

架构设计参考

架构设计比较

Redis架构设计

架构设计原则

架构设计思考

架构设计文章

SaaS架构设计

架构设计

软件架构设计

Flume架构设计

web架构设计

Tumblr 架构设计

架构设计的度

前端架构设计

秒杀架构设计

Mesos的架构设计

yarn架构设计

架构设计方法

架构设计思路

架构设计概述

分层架构设计

Vuex架构设计

MapReduce架构设计

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)