Elasticsearch——IK分词器自定义词库 - 代码天地

Elasticsearch——IK分词器自定义词库

其他 2020-03-06 10:36:22 阅读次数: 0

一、业务场景

Elasticsearch是一个基于Lucene的搜索服务器，其引入IK分词器后，可以对中文进行分词。IK分词器分词的原理是在源文件中收集了很多词汇，仅在其中一个主要词汇文件main.dic文件中就有27W的词汇量。但是有的时候仅用分词器本身提供的通用词汇无法满足自己的项目特定的业务需求，比如说我要以“最长的电影”这一歌名作为搜索条件，所得到的结果如下图所示。

二、新建词库文件

很显然，这并不是我们要的结果。而IK分词器本身也提供了自定义词库，对于开发者来说也是简单实用的。首先IK分词器是在elasticsearch安装目录的puligins文件夹中。进入plugins-->ik-->config目录，新建一个mydic.dic的文件,并在这一个文件中写入词汇，如下图所示。

三、引入自定义词库

引入自定义词库，需要进入plugins-->ik-->config目录，修改IKAnalyzer.cfg.xml文件的内容。如下图所示，在<entry key="ext_dic>标签中写入自定义词库的路径。如下图所示。

四、重启ES

在添加词库后，需要将elasticsearch重启。在linux系统中可以采用kill进程的方式关闭后重启，windows系统中将命令行窗口关闭，重新运行.bat文件就可以了。

五、测试结果

再次使用postman进行测试，得到的结果如图所示，成果得到想要的结果。

发布了48 篇原创文章 · 获赞 52 · 访问量 2万+

私信关注

猜你喜欢

转载自blog.csdn.net/y506798278/article/details/91303054

Elasticsearch——IK分词器自定义词库

Elasticsearch5.6.11+Ik分词器和自定义词库的配置与使用

Elasticsearch之中文分词器插件es-ik的自定义词库

Elasticsearch配置ik中文分词器自定义词库

Elasticsearch 之（24）IK分词器配置文件讲解以及自定义词库

IK分词器配置文件讲解以及自定义词库

ik分词器修改配置文件，自定义词条词库

IK中文分词_IK分词器配置文件讲解以及自定义词库

Elasticsearch安装IK分词器、配置自定义分词词库

ElasticSearch安装ik分词器_使用_自定义词典

ik分词器动态加载数据到ik的系统词库（不采用配置文件配置自定义词库的方式）...

进阶-第30__彻底掌握IK中文分词_IK分词器配置文件讲解以及自定义词库实战

Solr动态加载分词器的自定义词库扩展词库解决方案

HanLP - 分词器 - 自定义词典

ElasticSearch1.7之ik（中文）分词器的自定义分词扩展方式

elasticsearch ik分词器配置使用，自定义分词

安装IK分词器及自定义扩展分词

Elasticsearch自定义分词器

elasticsearch 自定义分词器

EditPlus导致ElasticSearch中IK分词器添加自定义字典无法实现

ElasticSearch第五篇：IK分词器，自定义扩展字典

elasticsearch实现中文分词+远程自定义词库(nginx)

elasticsearch-analysis-ik中文分词插件安装及配置Ik自定义词典+拼音分词

庖丁解牛分词之自定义词库[自定义词典]

使用Docker快速安装部署ES和Kibana并配置IK中文分词器以及自定义分词拓展词库

ElasticSearch-分词与内置、自定义分词器

如何在基于Lucene的中文分词器中添加自定义词典（如Paoding、mmseg4j、IK Analyzer）

ElasticSearch-IK拓展自定义词库（1）：手动添加热词文件方式

ElasticSearch-IK拓展自定义词库（2）：HTTP请求动态热词内容方式

结巴分词完全禁用默认词库（仅使用自定义词库）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)