lucene的企业级搜索引擎 - 代码天地

lucene的企业级搜索引擎

编程语言 2018-05-09 23:49:16 阅读次数: 1

lucene的企业级搜索引擎
企业级：持久化数据
大量数据，很多人同时访问数据，大量用户操作界面，
通常需要与散步在企业周围的其他应用进行集成。

企业级分为两类：
面向企业用户HRM ERM
面向消费者

什么是lucene：
是一个高效的，基于java全文搜索库。
数据类型分为两大类：
1 结构化数据固定格式的数据，sql 元数据
2 非结构化数据 grep ps aux|grep xxx
3 半结构化 html xml

顺序扫描法
非结构化数据中提取的然后重新组织的信息索引
软件包分析
org.apache.lucene.analysis 分词器
org.apache.lucene.doument 封装索引所需要的类 Doument ，field
org.apache.lucene.index 协助创建索引的类，以及对象索引进行更新
org.apache.lucene.search 对建立好的索引搜索所需要的类

Document，field,indexWriter directory FSD RAM

如果现从数据库查询出索引文档，再取得数据，和数据库一样了。
如果数据发生变化了，如何更新文档呢，
1.判断文档存在
merge 归并算法，个别文件和原来有区分文件合并操作。
可以使用定时任务去更新。

solr lucene
1.兼容性好
2.实现了分块索引建立小文件，提升索引速度
3.易于学习
4.易于扩展
4.自带比较强力的模糊查询

缺点：
1.对磁盘占用太大，频繁操作磁盘 1024T
2.不支持API
3.不支持集群继承Directory solr Nutch+Hadoop indexServer nutch集成

总结：
java 开源搜索引擎里面 lucene

项目中：
solr-solrj-4.10.4-sources.jar，
保存只有在定时任务里使用，保存的时候取DB数据，再保存到solr
solrServer.addBean(Object);
solrServer.commit();
solrServer.deleteById(id);

猜你喜欢

转载自572327713.iteye.com/blog/2347148

lucene的企业级搜索引擎

Windows10安装Apache solr-6.5.1（企业级搜索引擎）

Apache Solr 8.7.0 发布，最流行的 Java 企业级搜索引擎

Apache Solr 8.8.1 发布，Java 企业级搜索引擎

Lucene搜索引擎

搜索引擎---Lucene

Lucene搜索引擎-索引

Lucene搜索引擎-搜索

lucene搜索引擎简单应用

[Lucene]搜索引擎简介

Lucene搜索引擎入门

搜索引擎Lucene-02

搜索引擎Lucene-01

Lucene--01.Lucene入门&全文搜索引擎

【大数据】5分钟快速快速搭建Solr企业级搜索引擎,附Java操作SDK实战搜索

【大数据】5分钟快速快速搭建Solr企业级搜索引擎,附Java操作SDK实战搜索

Lucene开源搜索引擎的索引目录结构

搜索引擎学习（五）Lucene操作索引

搜索引擎系列二：Lucene（Lucene介绍、Lucene架构、Lucene集成）

利用lucene构建自己的搜索引擎

Lucene4.3搜索引擎开发之路分享

Lucene+Nutch搜索引擎开发一：介绍

利用Lucene打造站内搜索引擎的思路

Lucene于搜索引擎技术(Analysis包详解)

Lucene与搜索引擎技术(Document包详解）

Lucene与搜索引擎技术（index包详解）

Apache Lucene 7.3.1 发布，Java 搜索引擎

Apache Lucene全局搜索引擎入门教程

开源搜索引擎评估:lucene sphinx elasticsearch

Lucene系列一：搜索引擎核心理论

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)