elasticsearch 中文分词(elasticsearch-analysis-ik)


elasticsearch 中文分词(elasticsearch-analysis-ik)

******************************

默认中文分词:将中文分割成单独的字

示例

         

         

******************************

elasticsearch-analysis-ik

官网地址:elasticsearch-analysis-ik

**********************

安装elasticsearch-analysis-ik

创建容器

docker run -it --net fixed --ip 172.18.0.33 -p 9201:9200 -p 9301:9300  \
-e ES_JAVA_OPTS="-Xms512m -Xmx512m"  \
-v /usr/elasticsearch/single/conf/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \
--name es-single2 elasticsearch:7.5.1

进入容器安装elasticsearch-analysis-ik,重启后生效

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip

elasticsearch-plugin相关命令

            

查看安装的插件

           

**********************

测试 analysis-ik

ik_max_word:将文本做最细粒度的拆分,适合term query

           

           

ik_smart:会将文本做最粗粒度的拆分,适合phrase query,常使用该分词方式

          

          

 

**********************

添加本地词库:词库修改后需重启生效

词典配置文件位置:/usr/share/elasticsearch/config/analysis-ik/IKAnalyzer.cfg.xml

在目录:/usr/share/elasticsearch/config/analysis-ik新增hot.dic

厉害了
厉害了我的国
厉害了,我的国

修改配置文件后,重启elasticsearch

         

测试分词

        

        

 

**********************

添加远程词库:词库修改后只要重启远程应用,elasticsearch不需要重启就会自动加载最新词库

未添加远程词库分词测试

         

******************

添加远程词库相关操作

创建应用,使用docker创建容器

               

配置文件添加远程词库

         

*********************

测试远程词库分词

撒浪嘿

          

*****************

动态添加远程词库,之后重启远程应用:撒浪嘿撒浪嘿

未添加前

          

添加后,重启远程应用

          

发布了320 篇原创文章 · 获赞 91 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/weixin_43931625/article/details/103949550
今日推荐