Lucene全文检索原理的理解

全文检索在很多领域都有广泛的应用,比如:

         1、互联网全文检索(百度,谷歌)

          2、站内全文检索(淘宝,京东)

          3、优化数据库查询(like采用的是顺序扫描法,查询速度慢)

Lucene检索的算法是倒序索引算法,类似于字典的查询。将文件中的内容提取出来,将文字拆封成一个一个词,然后组成索引,搜索的时候,先搜索索引,通过索引找文档。其中分词去掉停用词。其搜索很快,但是耗空间,创建索引时间很长,通常需要进行索引优化。

猜你喜欢

转载自blog.csdn.net/zwgoldroad/article/details/82997646
今日推荐