Lucene 索引文件结构分析

  lucence的索引结构是一种反向索引结构,什么是反向索引结构(inverted index)呢,反向索引是以索引项为中心,每个索引都指向一个文档序列,该序列中所有文档都包含这个索引项。相反,在正向索引中,文档占据了中心的位置,每个文档指向了一个它所包含的索引项的序列。你可以利用反向索引轻松的找到那些文档包含了特定的索引项。Lucene正是使用了反向索引作为其基本的索引结构。
索引文件的逻辑视图
    lucence有索引块为基本的索引单位,每个索引块都包含一定数目的文档,我们能够对单独的每个索引块进行检索。下图显示索引块的逻辑结构。索引块的个数由索引的文档的总数以及每个索引块所能包含的最大文档数来决定。
图2:索引文件的逻辑视图


猜你喜欢

转载自forgetableboy.iteye.com/blog/1129358
今日推荐