転置インデックスの原則の補足


- - - - - - - - - - - - - -前書き - - - - - - - - - - - -----
転置インデックス、誰もがそのように呼んでいるようです。
転置インデックスに対応する英語の用語は転置インデックスであり、一部の論文も転置ファイルになり、それらはすべて同じことを話します。転置インデックスは順インデックスとは異なります。

---------------------------私はテキストです------------------- --------
ドキュメントは多くの単語で構成されており、それぞれが同じドキュメント内で何度も繰り返される可能性があります。もちろん、同じ単語が異なるドキュメントに表示されることもあります。

フォワードインデックス:ドキュメントの観点からドキュメント内の単語を見ると、各ドキュメント(ドキュメントIDで識別される)に含まれる単語、各単語の出現回数(単語の頻度)、およびその位置(ドキュメント)ヘッダーのオフセット)。

転置インデックス(転置インデックス、または転置ファイル):単語の観点からドキュメントを見て、それらのドキュメント内の各単語を識別し(ドキュメントID)、各ドキュメントに各単語が出現する回数(単語の頻度)と出現場所(ドキュメントの先頭からのオフセット)。

覚えておいてください:
フォワードインデックス:ドキュメント--->ワード
インバーテッドインデックス:ワード--->ドキュメント

- - - - - - - - - - - - - -結論 - - - - - - - - - - - -----
転置インデックスには、検索エンジン、大規模データベースインデックス作成、ドキュメント検索、マルチメディア検索/情報検索など、幅広いアプリケーションシナリオがあります。要するに、転置インデックスは検索分野における重要なインデックスメカニズムです。

おすすめ

転載: blog.csdn.net/GoSaint/article/details/106829102