前两篇已经介绍了然后搭建solrCloud环境,这篇介绍一下然后集成分词器
下载IK-Analyzer
官方地址:https://github.com/wks/ik-analyzer
由于官方ik-analyzer已经很长时间未更新,已经不能和solr6直接集成。
修改版下载地址:http://download.csdn.net/detail/devefx/9630310
配置步骤
如果是solrCloud,请将步骤1-3在每个solr实例中操作一遍
1、把下载的IK-Analyzer-Final.zip解压,将IK-Analyzer-2015FF.jar复制到server\solr-webapp\WEB-INF\lib目录
2、把ext_stopword.dic、IKAnalyzer.cfg.xml复制到server\solr-webapp\WEB-INF\classes目录(没有则新建一个classes目录)
3、在IKAnalyzer.cfg.xml同级目录中创建mydict.dic文件,作为自定义分词库(推荐搜狗分词库)
4、修改solr_home/核心名称/conf/managed-schema文件,添加IK分词器配置
<fieldType name="text_ik" class="solr.TextField">
<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
如果你的配置是用zookeeper管理的,则从之前上传的配置文件目录找到managed-schema文件按上面的方法修改,然后通过solr/scripts/cloud-scripts目录中的zkcli目录更新配置文件
zkcli -zkhost 127.0.0.1:2181,127.0.0.1:2182,127.0.0.1:2183 -cmd putfile /configs/newconfig/managed-schema config/managed-schema
/configs/newconfig/managed-schema 是zookeeper中配置文件路径
config/managed-schema 是你需要上传的配置文件路径
5、重启solr
分词测试
打开solr web页面,找到Analysis,将FieldType选择为之前配置的text_ik。
输入测试文本,点击Analyse Values 按钮