elasticsearch安装篇(4):安装IKAnalyzer中文分词器

ElasticSearch的ik分词器下载地址:https://github.com/medcl/elasticsearch-analysis-ik/releases。

分析器Analyzer:ik_smart,ik_max_work,

分词器Tokenizer:ik_smart,ik_max_work

1、安装ik分词器

安装ik分词器时注意版本与elasticsearch版本保持一致(https://github.com/medcl/elasticsearch-analysis-ik/releases)。选择下载版本如下图:

我们选择zip包进行下载,安装操作如下:

[root@wzy10 ~]# su - elk -s /bin/bash
#解压
[elk@wzy10 ~]$ unzip elasticsearch-analysis-ik-6.2.x.zip 
#unzip后的目录名称为elasticsearch
[elk@wzy10 ~]$ll
drwxrwxrwx 3 elk elk       213 May  6  2018 elasticsearch
#把目录名改一下,防止安装别的插件时同名冲突;这里修改为ik-analyzer
[elk@wzy10 ~]$ mv elasticsearch ik-analyzer
[elk@wzy10 ~]$ mv ik-analyzer /usr/local/elasticsearch/plugins/
[elk@wzy10 ~]$ cd /usr/local/elasticsearch/plugins/
[elk@wzy10 plugins]$ ll
total 0
drwxrwxrwx 3 elk elk 213 May  6  2018 ik-analyzer
[elk@wzy10 plugins]$ cd ik-analyzer/
[elk@wzy10 ik-analyzer]$ ll
total 1420
-rw-r--r-- 1 elk elk 263965 May  6  2018 commons-codec-1.9.jar
-rw-r--r-- 1 elk elk  61829 May  6  2018 commons-logging-1.2.jar
drwxr-xr-x 2 elk elk    299 May  6  2018 config
-rw-r--r-- 1 elk elk  51438 May  6  2018 elasticsearch-analysis-ik-6.2.4.jar
-rw-r--r-- 1 elk elk 736658 May  6  2018 httpclient-4.5.2.jar
-rw-r--r-- 1 elk elk 326724 May  6  2018 httpcore-4.4.4.jar
-rw-r--r-- 1 elk elk   1805 May  6  2018 plugin-descriptor.properties

重启一下ElasticSearch 

[elk@wzy10 ~]$ jps
2546 Jps
2458 Elasticsearch
[elk@wzy10 ~]$ kill 2458
[elk@wzy10 ~]$ /usr/local/elasticsearch/bin/start.sh

 2、扩展词库

     由于我们ElasticSearch安装目录是/usr/local/elasticsearch/,ik中文分词器的目录是/usr/local/elasticsearch/plugins/ik-analyzer,所以扩展词库文件/usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml

【默认IKAnalyzer.cfg.xml配置】

[elk@wzy10 ~]$ cat /usr/local/elasticsearch/plugins/ik-analyzer/config/IKAnalyzer.cfg.xml      
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
        <comment>IK Analyzer 扩展配置</comment>
        <!--用户可以在这里配置自己的扩展字典 -->
        <entry key="ext_dict"></entry>
         <!--用户可以在这里配置自己的扩展停止词字典-->
        <entry key="ext_stopwords"></entry>
        <!--用户可以在这里配置远程扩展字典 -->
        <!-- <entry key="remote_ext_dict">words_location</entry> -->
        <!--用户可以在这里配置远程扩展停止词字典-->
        <!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

【我们自定义】

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
	<comment>IK Analyzer 扩展配置</comment>
	<!--用户可以在这里配置自己的扩展字典 -->
	<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
	 <!--用户可以在这里配置自己的扩展停止词字典-->
	<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
 	<!--用户可以在这里配置远程扩展字典 -->
	<entry key="remote_ext_dict">location</entry>
 	<!--用户可以在这里配置远程扩展停止词字典-->
	<entry key="remote_ext_stopwords">http://xxx.com/xxx.dic</entry>
</properties>

 3、测试ik分词器

 

猜你喜欢

转载自blog.csdn.net/u013089490/article/details/84304732