Elasticsearch集群下安装IK中文分词器 - 代码天地

Elasticsearch集群下安装IK中文分词器

其他 2020-03-08 10:50:51 阅读次数: 0

1.什么是分词

分词就是指将一个文本转化成一系列单词的过程，也叫文本分析，在Elasticsearch中称之为Analysis。

举例：我是中国人 --> 我/是/中国人

2.分词api

#指定分词器进行分词

POST /_analyze
{
  "analyzer": "standard",
  "text": "hello world"
}

在结果中不仅可以看出分词的结果，还返回了该词在文本中的位置。

#指定索引分词

POST /itcast/_analyze
{
  "analyzer": "standard",
  "field": "hobby",
  "text": "听音乐"
}

3.中文分词

常用中文分词器，IK、jieba、THULAC等，推荐使用IK分词器。

IK Analyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始，IKAnalyzer已经推出了3个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。新版本的IK Analyzer 3.0则发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。

采用了特有的“正向迭代最细粒度切分算法“，具有80万字/秒的高速处理能力采用了多子处理器分析模式，支持：英文字母（IP地址、Email、URL）、数字（日期，常用中文数量词，罗马数字，科学计数法），中文词汇(姓名、地名处理）等分词处理。优化的词典存储，更小的内存占用。

IK分词器 Elasticsearch插件下载地址：https://github.com/medcl/elasticsearch-analysis-ik

#安装方法

#wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.2.0/elasticsearch-analysis-ik-7.2.0.zip

#三台elasticsearch主机都要配置

#cd /usr/share/elasticsearch/plugins

#mkdir -pv ik

#unzip elasticsearch-analysis-ik-7.2.0.zip

#ll

#重启elasticsearch

#systemctl restart elasticsearch

#测试

POST /_analyze
{
  "analyzer": "ik_max_word",
  "text": "我是中国人"
}

猜你喜欢

转载自www.cnblogs.com/llwxhn/p/12441198.html

Elasticsearch集群下安装IK中文分词器

docker下elasticsearch安装ik中文分词器

Centos 7 下安装kibana，ik中文分词器以及ElasticSearch集群教程

Centos 7 下安装kibana，ik中文分词器以及ElasticSearch集群教程

Elasticsearch的ik中文分词器的安装

Elasticsearch安装中文分词器IK

ElasticSearch安装中文分词器 ik

Elasticsearch安装ik中文分词器

Elasticsearch下安装ik分词器

ElasticSearch集群配置&IK中文分词器配置

在elasticsearch中安装ik中文分词器

安装elasticsearch-analysis-ik中文分词器

ElasticSearch 6.5.4 安装中文分词器 IK和pinyiin

docker 安装ElasticSearch的中文分词器IK

es（elasticsearch）安装IK中文分词器

ElasticSearch中文分词器-IK分词器的使用

Elasticsearch分词器-中文分词器ik

Elasticsearch 中文分词器IK

Elasticsearch(四) - IK中文分词器

Elasticsearch---中文分词器IK

Elasticsearch(四):Linux下安装插件ik分词器

ElasticSearch - 分词器介绍及中文分词器es-ik安装

本地elasticsearch中文分词器 ik分词器安装及使用

elasticsearch安装ik分词器

Elasticsearch 安装IK分词器插件

elasticsearch ik分词器安装

Elasticsearch安装使用IK分词器

elasticsearch–ik分词器的安装

ElasticSearch 安装IK分词器

Elasticsearch 安装 ik分词器

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)