大きな特性データ(4V + 1O)

 

データの量(ボリューム):第1の特徴は、記憶及び計算は非常に大きい、コレクションを含む大量のデータです。測定の単位を開始することは、少なくとも大きなデータP(T番目1000)、E(T番目億)またはZ(T番目の100億)です。

タイプ品種(品種):第二の特徴は、タイプ及び多様性の源です。構造化、半構造とを含む非構造化データ、特定のパフォーマンスのネットワークのログなど、オーディオ、ビデオ、写真、位置情報、データのデータ処理能力の多くの種類が前方に高い要求を入れました。

低密度の値(値):第三の特徴は、データ密度の比較的低い値、又はセントーサに波が、貴重です。インターネットの普及や物事のインターネット、情報知覚どこでも、情報の洪水が、密度の低い値では、どのように組み合わせるためにビジネスロジックをマシンの値にし、強力なデータマイニングアルゴリズムではあるビッグデータ時代のほとんどの問題を解決しようとします。

高速エイジング(ベロシティ):第4の特徴データのより速い成長率は、処理速度が速い、タイムクリティカルな要件です。例えば、検索エンジンのユーザーのクエリに数分前に要件のニュースをパーソナライズすることができ推薦アルゴリズムは、勧告を完了するために、可能な限りリアルタイムを必要とします。これは、伝統的なビッグデータの異なるマイニング大きな特徴。

データは、(オンライン)オンラインである:データは常にオンラインで、かつ機能ビッグデータの最大の伝統的なデータとは異なる計算、いつでも呼び出すことができます。今、私たちがビッグデータについて話していることがちょうど大きくない、より重要なバックグラウンドでのインターネットの急速な発展の特徴であるオンラインデータの変更、です。例えば、タクシーのためのツールは、リアルタイムオンラインデータでタクシー運転手と顧客データは、このデータは理にかなっています。ディスクが上とオフラインの場合、データをオンラインには、よりはるかに少ないの商業的価値大。

おすすめ

転載: www.cnblogs.com/liuys635/p/11586435.html