如何产生一个segment?
当IndexWriter执行commit时,会产生一个segment。
下述文件每个segment一个:
.fnm:存储一个segment中Field个数,Field名称,Field的属性(是否索引、存储etc)
.fdt:存储一个segment中,每个document中所有Field的域号、Field属性(是否分词、是否二进制、是否压缩etc),Field中存储的值
.fdx:存储一个segment中,每个document在.fdt中的偏移
.tvx, .tvd, .tvf存储了从Index->Document->Filed->Term的正向信息。
.tvf:存储一个segment中的所有Field,对每个Field,保存了Field中的所有Term信息,包含Term的文本、频率、位置、偏移量信息
.tvd:存储了一个segment中的每个Document的所有域在.tvf中的偏移量
.tvx:存储了一个segment中Document在.tvd中的偏移量以及第一个Field在.tvf中的偏移量
Lucene索引文件
猜你喜欢
转载自nepshi.iteye.com/blog/1256884
今日推荐
周排行