12) 第二章索引：规则(Norms) - 代码天地

12) 第二章索引：规则(Norms)

企业开发 2018-05-14 14:50:51 阅读次数: 2

在索引阶段，文档(Document)中每个被索引的域(Field)都可能有一个优先权重因数(boost)，它是一个浮点值。该值由三部分联合计算得到：文档自身的boost值；每个域的值；Lucene根据各词元在域中的频度算出的boost值；

得到最终的boost值后，Lucene会通过一些巧妙的方法把它转换成一个字节，并将其存入文档的各个域。待到搜索阶段，每个被查询域的规则都将被加载到内存，将字节解码成浮点数并依此为该文档打分(打出的分数用来为文档排序)。

使用规则时经常遭遇的一个问题是：查询期间的高内存消耗。原因很明显，每个文档的每个域的规则都要在内存中占用一个字节。如果你的索引文件很大，其中包含了大量的文档，而每个文档又包含了许多域，那么，大量内存的占用便是理所当然的！还好，你可以通过调用 Field.setOmitNorms(true); 将规则选项关掉，然而由于同时失去了boost的相关信息，这一操作可能对排序存在着潜在的影响。好在这种影响不大，尤其是当各个域的长度差不多时，或者是你根本没手动设置过boost值时。

注意一点：你需要在索引之前关闭规则选项！如果你想在索引中途做此事，那么，你必选重建整个索引！

猜你喜欢

转载自bun-ny.iteye.com/blog/1074984

12) 第二章索引：规则(Norms)

第二章索引

第二章教程12：地图管理器

8) 第二章索引：基本索引操作

14) 第二章索引：用Lucene索引数字

6) 第二章索引：Lucene索引的文档模型

17) 第二章索引：优化索引(Optimizing)

第二章疯狂Caché 语法规则

16) 第二章索引：设置Field的截断

15) 第二章索引：设计用来排序的域

11) 第二章索引：文档优先策略(Boosting)

9) 第二章索引：Field的设置

第二章创建高性能索引

Fk12-21作业及第二章章节练习

第二章 Vue快速入门--12 事件修饰符的介绍

第二章第12节Java语言基础(使用变量的注意事项)

《剑指Offer》第二章（一）题 9 -12

第二章第10~12节预测版本、仓库档案、收发类别

13) 第二章索引：用Lucene索引日期和时间

7) 第二章索引：理解Lucene索引过程

javascript-语法-第二章js的语法规则

《数学之美》第二章自然语言处理——从规则到统计

学习笔记(70):第二章：海量数据的处理与挖掘-关联规则挖掘01

微服务之Sentinel-第二章-限流规则

Introduction to 3D Game Programming with DirectX 12 学习笔记之 --- 第二章：矩阵代数

java编程思想第二章（一切都是对象）练习 2.11 练习12

2018年12月20日；第二章变量与数据类型及运算符

DirectX12 3D游戏开发实践（龙书）第二章_矩阵代数

华为数通2022年11月 HCIP-Datacom-H12-821 第二章

第12章：索引-1

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)