Lucene索引文件

如何产生一个segment?
当IndexWriter执行commit时,会产生一个segment。

下述文件每个segment一个:
.fnm:存储一个segment中Field个数,Field名称,Field的属性(是否索引、存储etc)

.fdt:存储一个segment中,每个document中所有Field的域号、Field属性(是否分词、是否二进制、是否压缩etc),Field中存储的值

.fdx:存储一个segment中,每个document在.fdt中的偏移

.tvx, .tvd, .tvf存储了从Index->Document->Filed->Term的正向信息。
.tvf:存储一个segment中的所有Field,对每个Field,保存了Field中的所有Term信息,包含Term的文本、频率、位置、偏移量信息
.tvd:存储了一个segment中的每个Document的所有域在.tvf中的偏移量
.tvx:存储了一个segment中Document在.tvd中的偏移量以及第一个Field在.tvf中的偏移量

猜你喜欢

转载自nepshi.iteye.com/blog/1256884