全文检索缓存及速度.doc

关键字   Solr  缓存机制  索引结构   搜索速度

 

搜索引擎的缓存包括两类,一个是solr的,一个是lucene自身的。通过讲常用的数据缓存到内存,减少对磁盘的访问,能够快速的得到相要的结果。

 

出了缓存外,全文检索内部的索引结构---倒排序反向索引(关键字到文档的索引)和数据组织结构方式是它区别于普通数据库及数据库索引的关键。详细内容可以参考我们写的《全文检索介绍.ppt》文档。

 

4个solr缓存

如下:

filterCache

该缓存存储了满足一个过滤查询条件的所有文档的一个未排序的文档ID号集合。用于分面搜索和对结果排序。该缓存的key是过滤查询条件。

fieldValueCache

该缓存与lucene底层fieldCache相似,主要区别是它支持文档字段的多值(词元)情况。用于分面搜索。该缓存的key是字段名称,值为文档ID到值段字的映射。

queryResultCache

该缓存是查询结果的缓存,存储了一个排序的文档ID集合,它是满足一个查询条件的前N条查询文档。

documentCache

该缓存存储已经从磁盘取得的lucene文档对象。

 

Lucene缓存

 

fieldCache

该缓存与solr缓存fieldValueCache,该缓存的key是字段名称,值为文档ID到值段字(词元)的映射。

 

 

猜你喜欢

转载自myq526180048.iteye.com/blog/2005395