关于lucene实时更新的纠结 - 代码天地

关于lucene实时更新的纠结

企业开发 2018-05-14 22:31:05 阅读次数: 2

仿百度文库这个小项目中，文档信息分别存入数据库和lucene

JavaBean:docInfo	OracelTable:DOC_INFO	comment	luceneIndex
docId	DOC_ID	主键ID	docId
userId	USER_ID	用户ID	userId
logId	LOG_ID	用户名	logId
title	TITLE	文档名	title
summary	SUMMARY	文档简介，查询列表下的几行小字	summary
mime	MIME	文档后缀名	mime
createTime	CREATE_TIME	文档创建时间	createTime
hits	HITS	点击次数	hits
无	无	文档内容	context

其中hits更新很频繁，数据库可以承受，但是lucene的更新时删除原索引然后重新创建，这个频繁的更新并不是很好。
全文检索查询的只是lucene，并不去查数据库，lucene不更新，就无法做到实时。

最普通的做法：先更新索引，再更新数据库，这样能实时，但是显然还是很慢。特别是索引文件很大的时候。

用Job任务定时执行：索引文件的更新只能用线程定时根据条件触发更新。这样带来的问题是做不到实时。新增的数据用不到索引会很慢。

建立缓存：加一层缓存，数据结构根据业务定，hashmap也好，treemap也好，新增的数据放入缓存，等到缓存满一定容量的时候去触发线程更新索引文件。
查询的时候顺序是索引，缓存。先全文检索索引，再查缓存看有没有改变，然后将改变封装进来。
这样就不会因为索引的更新而影响效率了。
是不是很痛苦！

猜你喜欢

转载自xinyangwjb.iteye.com/blog/1513873

关于lucene实时更新的纠结

用Lucene构建实时索引的文档更新问题

关于离职，内心是纠结的

Lucene实时思路

lucene准实时检索

纠结的很

纠结

lucene 部分更新，实例

用Lucene构建实时的索引

lucene NRT实时索引学习

lucene实现近实时索引

关于缓存机制实时更新的一些参考建议

我关于人工智能的若干感悟【实时更新】

关于hibernate修改数据之后不能实时更新数据

关于 NFT 和版权的纠结真相

有关Lucene的问题：用Lucene构建实时索引

*lucene索引_的删除和更新

lucene 分布式实时搜索

Python中遇到的比较纠结的问题记录-----持续更新

lucene关于中文分词的问题

关于SCI2的那个python脚本的纠结。

关于一直纠结学啥语言好的事宜

今日任务-实时更新

highcharts jquery实时更新

echart数据的实时更新

总结（实时更新中）

开源站点-实时更新

杂记实时更新

实时任务更新

经典语句(实时更新):

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)