Solr配置安装(二)--之中文分语器IKAnalyzer

Solr自带的分词器对英文支持较好,但不适合针对中文的分词,我们这里使用IKAnalyzer为例讲解Solr的分词器配置

一、下载

        见附件

二、拷贝IKAnalyzer2012FF_u1_custom.jar文件至'运用路径'/WEB-INF/lib下

       注:“运用路径”一般有两种,第2种solr-webapp在服务每次重启后,会从example/webapps/solr.war重新解压一份

       1、tomcat部署solr:apache-tomcat/webapp/solr/WEB-INF/lib

       2、Solr自带jetty:solr/example/solr-webapp/webapp/WEB-INF/lib

三、打开core(如:example/solr/collection1)-->conf-->schema.xml

       在最后</scheml>内加入

<fieldType name="text_ik" class="solr.TextField">
   <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
   <analyzer type="query" isMaxWordLength="true"  class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

 
 四、自定义分词器使用

        在需要使用中文分词器的field标签配置fieldType的引用,type="text_ik"要和fieldType的name一致

<field name="shortName" type="text_ik" indexed="true" required="false" stored="true"/>

附言:

1、schema.xml中的copyField作用:创建文档索引时将指定字段

2、如果Solr启动提示java.lang.UnsupportedClassVersionError:org/wltea/analyzer/lucene/IKAnalyzer

     则请下载IKAnalyzer另一个版本,再进行测试。如果问题仍旧,请升级JDK版本

配置完毕,重启Solr即可

猜你喜欢

转载自fuhuijun.iteye.com/blog/2316966