ES IK自定义分词词库配置

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_32502511/article/details/86229444

参考地址:https://blog.csdn.net/whb3299065/article/details/80104323

一、业务场景
    在利用ik分词的过程中,当ik的分词规则不满足我们的需求了,这个时候就可以利用ik的自定义词库进行筛选,举个例子:当我要将“我是中国人,我想测试一下”这句话通过分词,将“我想测试一下”分为一个词的时候,就需要利用ik的自定义词库进行灌入指定的词。

二、新建词库
1.到elasticsearch/plugins中寻找ik插件所在的目录

2.在ik中的config文件中添加词库

vim taimei_words.dic

输入你定义的词,例如: (注:一行输入一个词)

     成都双流
     双流机场

:wq!保存命令

3.检查新建词库内容(注意内容中的编码格式)

cat taimei_words.dic

三、修改ik配置

修改config中的IKAnalyzer.cfg.xml文件(注:词库的位置根据该配置文件的位置来决定所写的路径,一般放在平级目录或者下一级目录下)

   vim IKAnalyzer.cfg.xml

  :wq!保存命令

四、重启es

1.修改为es账户

例如:su es_admin

2.查看es进程号

ps aux|grep elastic

五、测试
可以在postman中测试查看效果,如下图所示,可以看到已经将我设置的“成都双流”当成了一个词典进行分词:


 

猜你喜欢

转载自blog.csdn.net/qq_32502511/article/details/86229444