solr（二）：Solr配置中文分词器IKAnalyzer2012FF_u1

其他 2019-05-01 15:11:05 阅读次数: 0

一、目的

通过使用比较高效的IKAnalyzer2012FF_u1分词器对中文内容进行检索分词，利于最终的全文检索。

二、环境

1.CentOS6.4

2.CDH5.7.0

3.solr-4.10.3-cdh5.7.0

三、实现步骤

1.下载ik分词器IKAnalyzer2012FF_u1

https://download.csdn.net/download/u010886217/11147669

2.把IKAnalyzer2012FF_u1.jar添加到tomcat解压缩后的solr/WEB-INF/lib目录下

/opt/modules/tomcat-8.5.12/webapps/solr/WEB-INF/lib/IKAnalyzer2012FF_u1.jar

3.复制IKAnalyzer的配置文件和自定义词典和停用词词典（ext.dic、IKAnalyzer.cfg.xml、stopword.dic三个文件），拷贝到solr的classpath下，也就是在/opt/modules/tomcat-8.5.12/webapps/solr/WEB-INF/classes目录下。如果没有classes，则新建classes目录：

cd /opt/modules/tomcat-8.5.12/webapps/solr/WEB-INF/classes
# ls
IKAnalyzer.cfg.xml  log4j.properties  stopword.dic

4.在schema.xml中添加一个自定义域类型fieldType，从而使用中文分析器。

<!-- IKAnalyzer-->
<fieldType name="text_ik" class="solr.TextField">
  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

5.定义域field，使用刚刚定义的域类型text_ik，指定field的类型fieldtype属性为text_ik

<!--IKAnalyzer Field-->
<field name="title_ik" type="text_ik" indexed="true" stored="true" />
<field name="content_ik" type="text_ik" indexed="true" stored="false" multiValued="true"/>

6.重启tomcat

cd /opt/modules/tomcat-8.5.12
bin/shutdown.sh
bin/startup.sh

四、校验

1.打开solr

http://hadoop01:9999/solr/#/collection1

2.选择刚刚定义的content_ik分词器域

3.选择《背影》经典作为检验

我说道：“爸爸，你走吧。”他往车外看了看说：“我买几个橘子去。你就在此地，不要走动。”我看那边月台的栅栏外有几个卖东西的等着顾客。走到那边月台，须穿过铁道，须跳下去又爬上去。父亲是一个胖子，走过去自然要费事些。

分词效果非常好

猜你喜欢

转载自blog.csdn.net/u010886217/article/details/89598795

solr（二）：Solr配置中文分词器IKAnalyzer2012FF_u1

solr 4.x 中文分词: IKAnalyzer2012FF_u1.jar

Solr-4.10 配置中文分词器(IKAnalyzer)

Solr7.5.0配置中文分词器IKAnalyzer

Solr配置Ikanalyzer分词器

Solr4：加入中文分词IKAnalyzer2012 FF

Solr----3、solr7.2.0配置IKAnalyzer和自带的中文分词器

Solr 4.10.3 集成 IK Analyzer 2012FF 中文分词器

solr中安装中文分词器IKAnalyzer

solr5.5配置IKAnalyzer分词器

solr7.4 配置ikanalyzer和自带的中文分词器

Solr 添加 IKAnalyzer分词器

Solr 7 配置中文分词器

IK中文分词器源码分析（2012FF_u1）

Solr搜索引擎第六篇-Solr集成中文分词器IKAnalyzer

IKAnalyzer中文分词器V2012_FF使用手册

solr IKAnalyzer 搜索中文分词配置过程

Solr 6.6.0 配置IKAnalyzer中文分词

Solr7.3.0入门教程，部署Solr到Tomcat，配置Solr中文分词器

Solr安装、使用、配置中文分词器

配置solr的schema.xml加入中文分词器

solr与中文分词器的安装配置

Solr-4-配置中文分词器

Solr学习总结 IK 配置中文分词器

配置中文分词器 IK-Analyzer-Solr7

Solr - 中文分词器IK Analyzer的简介及配置

2018-11-09 Solr学习笔记(二)-Solr5.5.5服务器配置中文分词器

Solr配置安装（二）--之中文分语器IKAnalyzer

solr8.0 ik中文分词器的简单配置（二）

IKAnalyzer中文分词器

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)