Solr 分词器(analyzer)是怎么传到Luence的 - 代码天地

Solr 分词器(analyzer)是怎么传到Luence的

企业开发 2018-05-13 17:58:12 阅读次数: 0

Solr 分词器(analyzer)是怎么传到Luence的

(2011-11-02 17:41:48)

标签：

solr

分词器

luence

it

分类：架构与开发

Solr的分词器我们都知道，是配置在schema.xml配置文件中，不同的fieldType我们都可以给他配置分词器。Solr有两个地方分别是创建索引(INDEX)和查询(query),通过Solr的源码如下：

          if (queryAnalyzer==null) queryAnalyzer=analyzer;
          if (analyzer==null) analyzer=queryAnalyzer;
          if (analyzer!=null) {
            ft.setAnalyzer(analyzer);
            ft.setQueryAnalyzer(queryAnalyzer);
          }
   queryAnalyzer 为查询时用到的分词器，    analyzer为建索引时用到的分词器。从上面可以看出，如果我们没有配查询的分词  器，则用创建的分词器，同理，如果创建时的分词器为空，则用查询的分词器。如果两个都为空，就是没有分词器了。
注意，这里的analyzer和queryAnalyzer 都是TokenizerChain，里面包含了一个分词器的链。

主要问题是，Solr是在什么时候用到这些分词器的呢，通过调试，发现，Solr是在DirectUpdateHandler2的addDoc(AddUpdateCommand cmd)方法里面的两行代码如下：
synchronized (this) {
        // adding document -- prep writer
        openWriter();
        tracker.addedDocument( cmd.commitWithin );
} // end
addDoc方法是我们新建索引时调用的。openWriter是打开indexWriter，这里会判断indexWriter是否为空，如果为空则会创建一个createMainIndexWriter实例，代码如下：
if (writer==null) {
      writer = createMainIndexWriter("DirectUpdateHandler2", false);  //这里就是new一个SolrIndexWriter实例
}
createMainIndexWriter方法就是new一个SolrIndexWriter实例，会传一个schema给SolrIndexWriter通过构造函数。
SolrIndexWriter继承luence的IndexWriter，创建indexWriter时会把schema的analyzer传给IndexWriterConfig。
这样luence的indexWriter就分词器就保存在IndexWriterConfig上。

猜你喜欢

转载自rongdmmap-126-com.iteye.com/blog/1424046

Solr 分词器(analyzer)是怎么传到Luence的

Solr安装与IK Analyzer(中文分词器)

配置中文分词器 IK-Analyzer-Solr7

Solr - 中文分词器IK Analyzer的简介及配置

【solr】添加分词器ik-analyzer-solr solr7.2.1+tomcat8.5.37+jdk8安装配置

Solr 4.10.3 集成 IK Analyzer 2012FF 中文分词器

Solr6.0集成IK-Analyzer分词器

solr搜索引擎配置中文分词器IK-Analyzer

solr7.3 环境搭建配置中文分词器 ik-analyzer-solr7 详细步骤

solr8.2 环境搭建配置中文分词器 ik-analyzer-solr8 详细步骤

solr4.3默认的分词器

Solr设置IK分词器

Solr 7 配置中文分词器

Solr 添加 IKAnalyzer分词器

solr无法加载IK分词器

Solr配置IK分词器

solr配置IK分词器报错

Solr配置Ikanalyzer分词器

Solr IK分词器配置

Solr中IK分词器的配置

solr 的analyzer

集成分词器-----solr自带分词器和IK分词器对比

Solr7.3.0入门教程，部署Solr到Tomcat，配置Solr中文分词器

Solr安装、使用、配置中文分词器

Solr多核心及分词器（IK）配置

Solr分词器大补贴：mlcsseg

配置solr的schema.xml加入中文分词器

solr 添加 IK 分词器和sougou词库

Solr 7.2 安装实例与中文分词器

Solr 7.2安装实例与中文分词器

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)