lucene简单介绍

lucene的简单介绍

什么是lucene

lucene是一堆的jar包,我们可以使用lucene做一个类似于百度、京东的搜索引擎。为了更加方便的搜索,并且不会因为数据量的加大而明显的加长搜索时间。

常见的搜索算法

  1. 顺序扫描法(正排索引算法): 查询时带着关键字,从数据的开始到结尾,全部查询一遍,将所有带关键字的数据都查询出来,然后进行一个排列,排序,将最接近搜索的数据排在最前。
    当数据量小的时候,很快,但是数据量很大,海量数据的时候,全部查询出来是不太可能的,太浪费时间。
    缺点:查询速度慢、随着数据量的不断加大,搜索时间会变得越来越长。
    优点:准确率高。
  2. 倒排索引算法(全文检索算法): 将数据库中的所有信息查询出来,然后进行切分词,生成目录,然后将要存储的数据放在文档中,数据库中的一列数据就是一个文档。索引和文档组成索引库,检索时,先查询到索引,然后通过索引与文档之间的联系,查询数据信息。数据之间,会有一个默认的打分效果,会把与搜索内容最为相似的数据排在最前面。
    缺点:生成的文档占空内存空间,是一种空间换时间的算法
    优点:查询效率高,不会因为数据量的大家而出现明显的时间延迟。
    举例:字典:把所有的字偏旁部首都取出来,组成目录,目录与后面的内容有联系, 通过目录能快速的找到字的详细

猜你喜欢

转载自blog.csdn.net/zcdnswzhda/article/details/84870031
今日推荐