Solr(搭建solr本地服务器)

Solr使用记录

Solr介绍:

    Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。

    Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。

Solr与Lucene的区别:
    Lucene是一个开放源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎,Lucene提供了完整的查询引擎和索引引擎,目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者以Lucene为基础构建全文检索引擎。

     Solr的目标是打造一款企业级的搜索引擎系统,它是一个搜索引擎服务,可以独立运行,通过Solr可以非常快速的构建企业的搜索引擎,通过Solr也可以高效的完成站内搜索功能。


Solr整合tomcat:

步骤一:创建一个文件夹,将tomacat以及Solr放入,再创建一个solrhome目录.



步骤二:将solr-4.10.3  -> example ->solr中的全部文件复制到solrhome目录中




步骤三:将solr-4.10.3  -> example ->webapps中的solr.war复制到tomcat的webapps目录,并解压



注意:解压完成后,一定要删除solr.war,否则启动时,tomcat会自动解压solr.war,覆盖掉solr文件夹


步骤四:将solr-4.10.3  -> example ->lib ->ext文件夹下的所有jar包复制到tomcat中solr -> WEB-INF -> lib中




步骤五:打开tomcat中的 solr -> WEB-INF -> web.xml,将<env-entry>标签的注释打开。




注意保存。

步骤六:打开tomcat -> bin -> startup.bat,启动tomcat



步骤七:运行tomcat,查看是否有错误信息,如果没有错误信息。即可访问 solr后台




扩展:配置中文分词器(IKAnalyzer)

    在solr安装完成后,默认的分词器,都是标准分词器。标准分词器对中文的支持极差,所以我们需要自行配置中文分词器。配置步骤如下:

    

    准备工作:将IKAnalyzer的jar包复制到 WEB-INF下的lib中。再将配置文件复制到WEB-INF下的classes中,如果没有classes目录,需要自行创建。




    第一步、打开 solrhome -> collection1 -> conf -> schema.xml。



第二步、在schema.xml中末尾配置。(位置随意,只要标签不胡乱嵌套即可)

<!-- IKAnalyzer-->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>


第三步、在schema.xml中使用 text_ik 配置域类型。(这里的text_it为你配置的IKAnalyzer分词器的name属性值)

<!--IKAnalyzer Field-->
    <field name="title_ik" type="text_ik" indexed="true" stored="true" />
    <field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>


保存配置。重启服务。这样在新增的时候即可选择配置了 IKAnalyzer 的域名称了。

猜你喜欢

转载自blog.csdn.net/qq1031893936/article/details/80229339