小さなデータ・ストレージ・アルゴリズム

質問を記録します。ファイルの10Gの大きさがあり、ファイルが2G数の統計的要件は、最も頻繁に出現するために与えられたメモリのライン内の整数を使用することができます。

1、ストリーミングデータ処理(これを書き戻すの個片、埋め込みピット....)

図2に示すように、サブファイル処理

      モールド10の原稿読取部と、ファイルに同一の数値。そして、10個のファイルを処理しました。統計出現の最大数。

      私は上記のスキームは、この事件を解決することができると思います。ファイルの値が繰り返されていません。以下リピートケース

極端なケースを想定します。すべてのモジュロファイルの内容はすべて同じです。あるいは、上記の方法では2Gを超えない適用。同じファイルに同じ番号がより適しています。

     状況が異なるソリューションが同じではないです。特効薬はありません
---------------------
著者:ジョー・セイル
出典:CSDN
オリジナルます。https://blog.csdn.net/weixin_40596063/article/details/82895458
免責事項:この記事はブロガーのオリジナルの記事、再現され、ボーエンのリンクを添付してください!

おすすめ

転載: www.cnblogs.com/stone531/p/10992547.html