初识Lucene全文索引

1、Lucene是什么呢?

Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,

但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,

部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的

工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。Lucene

是一套用于全文检索和搜寻的开源程式库,由Apache软件基金会支持和提供。Lucene提供了一个简单却强

大的应用程式接口,能够做全文索引和搜寻。在Java开发环境里Lucene是一个成熟的免费开源工具。

就其本身而言,Lucene是当前以及最近几年最受欢迎的免费Java信息检索程序库人们经常提到信息检索程序库,

虽然与搜索引擎有关,但不应该将信息检索程序库与搜索引擎相混淆。

2、Lucene能干什么呢?

 比如:你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你要搜索的关键字出现在哪里,

在这个基础上你可以做任何符合这个条件的事情。在实际项目中应用于大数据量的查询部分,就像天猫首页

中搜索商品,如果使用模糊查询先不说性能会非常差,其次用户体验效果非常不好。

 就拿天猫上来说,在首页搜索框中输入:洗面奶 (中间很多空格) 外套。

点击搜索


会同时搜索出洗面奶、外套的所有商品,如果用模糊查询这肯定是做不到的。

初识Lucene全文搜索引擎,对它有概念上的认识就OK了。

猜你喜欢

转载自blog.csdn.net/lifupingcn/article/details/64920876