(基础)CDH Solr 一点通

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xiewendong93/article/details/54970622

前言

我用5天时间从零开始了解使用Solr,仅仅是片面的了解了Solr大概使用
博文目的,只是用于记录 和 给刚开始学习Solr的朋友一些参考
都是个人理解,如内容有错误请见谅并给予评论

概述

需求说明

使用Solr搜索引擎提高内容检索效率

组件说明

CDH组件
Hbase :分布式的、面向列的开源数据库,用于存储数据
Solr : 基于Lucene的,独立的,企业级搜索应用服务器
ZooKeeper :用于SolrCloud各节点间共享配置等
Key-Value Store Indexer :Hbase到Solr生成索引的中间工具 ,使用的是Lily HBase NRT Indexer服务.
Lily HBase Indexer:一款灵活的、可扩展的、高容错的、事务性的,并且近实时的处理HBase列索引数据的分布式服务软件

组件流程

Solr是通过对检索目标设置索引来提高检索响应速度,所以
流程一: 启动 收集器 与 索引生成器 , 该流程内容包括:
:创建Hbase数据表
:生成并设置Solr配置文件:scheme.xml(自定义Hbase检索列(名称,类型,是否建索引,是否保存),分词 , 合并其他列等)
:创建collection(收集器,个人理解),并将上一步生成设置的配置文件上传Zookeeper,供Solr集群节点下载使用,然后启动收集器
:生成并配置Lily HBase Indexer配置文件,用于注册Hbase索引,并启动该服务(个人理解:索引生成器)(启动需指定收集器名)
说明:一,二,三步目的是设置索引项,启动收集器,并没有与Hbase表相映射和建立索引项的索引,四步中则是配置Hbase表名及列名与scheme.xml中自定义索引列名的映射关系并启动
写入Hbase的数据会通过索引生成器近实时的创建索引,供客户端搜索
流程二:使用Solr JAVA客户端对索引项进行搜索

猜你喜欢

转载自blog.csdn.net/xiewendong93/article/details/54970622