在Solr中使用IKAnalyzer遇到的一个问题 - 代码天地

在Solr中使用IKAnalyzer遇到的一个问题

编程语言 2018-05-14 12:19:32 阅读次数: 2

最近在项目中使用Solr做全文检索功能，使用了IKAnalyzer中文分词器（在此感谢：http://linliangyi2007.iteye.com/category/27277）。在使用过程中一切都很顺利。因为太顺利了，所以测试没有做得很细，在给用户测试时，发现一个奇怪的现象：

对于有些词组或句子，索引库中明明存在，但就是检索不出来，例如：

对于“企业所得税”这个词组，按照“企业所得税”能检索到内容，但去掉中间空格，按“企业所得税”来检索，却怎么也搜索不到。

在Solr管理界面分析页面（http://127.0.0.1:8080/solr/admin/analysis.jsp），分析得到分词结果是：

Index Analyzer：

企业所

企业

所得税

所得

Query Analyzer：

PanskyESE 管理页面 <script type="text/javascript"></script>

企业所

所得税

奇怪，两个分词出来的结果竟然不一样。检查配置文件，在schema.xml文件中，IKAnalyzer的配置如下：

      <analyzer type="index">
	<!--IK分词器-->
	<tokenizer class = "org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="false" />
         ...
      </analyzer>

      <analyzer type="query">
	<!--IK分词器-->
	<tokenizer class = "org.wltea.analyzer.solr.IKTokenizerFactory" isMaxWordLength="true" />
         ...
      </analyzer>

这是按照IKAnalyzer附带的安装手册做的配置，但是不明白为什么在索引时和搜索时isMaxWordLength要设置成不一样 。不管三七二十一，先把下面那个isMaxWordLength="true"改成isMaxWordLength="false"试试。

改完，重启服务器，再搜索“企业所得税”，终于搜到结果了。

问题算是解决了，但不明白原因，有明白人请赐教。

猜你喜欢

转载自sheng.iteye.com/blog/710959

在Solr中使用IKAnalyzer遇到的一个问题

spring boot Controller中使用注解@RequestBody遇到的一个问题

cocos中使用tinyxml2遇到的一个小问题

在使用KVO遇到的一个问题

rcu使用遇到的一个问题

使用 bootstrap 遇到的一个问题

关于数组中使用indexOf碰到的一个问题

使用加密签名时遇到的一个问题

在使用mesos framework中遇到的一个问题

vue父子组件使用时遇到的一个问题

idea使用时遇到的一个小问题

php 取地址&符号使用遇到的一个问题

使用 Ant Design of Blazor遇到的一个问题

使用 uniswap 模拟交易时遇到一个问题

记录sdwan使用中遇到的一个小问题

谈谈在Vue.js中使用Nginx遇到的一个坑

在stylus中使用媒体查询遇到的一个坑

GitHub使用问题（遇到一个记一个）

一个ViewPager使用多个Adapter时遇到的一个问题

记录一个使用pnpjs时遇到的一个问题

vue 遇到的一个问题......

jeesite中的遇到一个问题

Firefox遇到的一个奇怪问题

今天遇到一个奇怪的问题

Masonry中遇到的一个的问题

HiveServer遇到一个问题

安装webpack遇到的一个问题.

遇到一个闭包的问题~

遇到一个抓狂的问题

一个网友遇到的重载问题

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)