1.1 ブルームフィルタ
図1に示すように、ブルームフィルタ - 理論
集合構造は非常に正確ではないように事実においては、ブルームフィルタを見ることができ、それは、オブジェクトが存在する場合に偽があるかどうかを決定するための方法が含まれています。
前記ブルームフィルタは、特定の値がある値が存在しない場合、それは確かに存在していない間、それは、存在しないかもしれないと述べました。
2、アプリケーションのシナリオ
1)シナリオ1(ユーザーにニュースを推奨)
1.あなたがニュースを読んで、何の強気のニュースがないため、除外することにしてくださいは、(偽陽性)のごく一部をフィルタリングすることがあります。
2.これは完全にニュースが繰り返されないことを保証するために、ユーザーにプッシュされます。
2)シーン2(重量へのURLクローラ)
1.クローラーシステムでは、我々は、URLに重い行く必要はもはやページをクロールしないクロールされてい
数千万人へのURLまでは、コレクションはこれらのURLアドレスを保持する場合はスペースの無駄である2
3.ブルームフィルタが大幅に重複排除ストレージの消費量を削減するだけでなく、システムは小さな爬虫類のページを欠場する可能性があります使用します
図3に示すように、ブルームフィルタアプリケーション
1.ブルームのNoSQLデータベースにフィールドで非常に幅広いアプリケーションをフィルタリング
場合メモリ2ブルームフィルタは著しく、データベースIO要求の数を減らすことができ