近年のビッグデータ分析は、そうであっても、多くの組織は、既存のデータマイニングと分析技術はまだビッグデータ処理タスクを行うことができないことが判明し、非常に暑いです。この質問のために、可能な解決策は、Hadoopクラスタを構築することですが、それはすべての状況には適していません。Hadoopクラスタを使用することの利点と欠点を見てみましょう。
Hadoopのクラスタとは何ですか?
Hadoopクラスタは、特に非構造化データと設計の膨大な量を格納し、分析するためのクラスタの特定のタイプです。データの並列処理するように、本質的に、それは、コンピューティング・クラスタ、クラスタの複数のノードに割り当てられた、すなわちデータ解析ジョブです。
優位性を構築するためのHadoopクラスタ
Hadoopクラスタの最大を使用する利点は、大規模データ解析のための理想的であるということです。ビッグデータは通常、広範かつ構造化されていません。そしてHadoopのに非常に適したそのようなデータから、原理はHadoopのが断片にデータを分割し、各「スライス」は、特定のノードのクラスタ分析に割り当てられていることです。各データ片を別々に別のクラスタ・ノードで処理されるので、データが均等に分散される必要はありません。
Hadoopクラスタ付加的な利点のスケーラビリティ。そして、他のタイプのデータなど、ビッグデータ分析の重要な質問に面しが増加しているが、データの量です。そして、最大の利点は、ビッグデータを分析し、リアルタイムまたはほぼリアルタイムに処理することができるということです。Hadoopのクラスタの並列処理能力は、分析の速度を向上させることができるが、分析されるべきデータの量の増加に伴って、クラスタの処理能力が影響を受けることができます。しかし、良いニュースは、あなたが効果的に追加のクラスタノードを追加することで、クラスタを展開することができ、あります。
第三の利点は、Hadoopのクラスタのコストという点です。これは奇妙に聞こえるかもしれない、結局のところ、大規模データの解析は、エンタープライズクラスのIT活動であるエンタープライズクラスのITアプリケーションが安いではありませんでしたされています。しかし、結局のところ、Hadoopクラスタは確かに費用対効果の高いソリューションです。
Hadoopのは、2つの主な理由のために安くクラスタ化します。あなたはコストを削減することができるようにそれは、ソフトウェアがオープンソースである必要。実際には、あなたが自由のApache Hadoopのディストリビューションをダウンロードすることができます。コモディティ・ハードウェアをサポートすることにより、同時に、Hadoopクラスタ管理コスト。サーバークラスのハードウェアを購入しなくても、あなたは強力なHadoopクラスタを構築することができます。
別の利点は、フォールトトレランスHadoopクラスタです。データ片を分析のためにノードに送信されると、クラスタ内の他のノード上のデータのコピーが存在することになります。データがまだ分析して処理することができるように、このようにして、ノード障害が発生した場合でも、データノードの追加コピーは、他の場所クラスタ内依然として存在します。
欠点Hadoopクラスタ
利点及び利益数多く以上でのHadoopクラスタが、しかし、それはすべての企業のデータ分析ソリューションには適用されません。例えば、データの量は、同社はデータの待望の分析は、Hadoopクラスタの恩恵を受けていないことがあっても、比較的小さいです。
使用Hadoopクラスタさらなる欠点は、溶液が「分離」ベースのクラスタであり、並列処理は、上記データ内の個々のノードで実行することができることです。分析は処理環境を平行に適していない場合は、Hadoopクラスタは、このタスクを達成するための適切なツールではありません。
欠点は、Hadoopクラスタを使用することができ、操作、保守およびサポートは急カーブで、最も重要な建物のクラスタです。あなたはIT部門でのHadoopの専門家を持っている、または必要なデータ分析タスクをクラスタを構築し、実行する方法を学ぶために起こる場合を除き、いくつかの時間を費やす必要があります。
それはケースであること、私たちはHadoopクラスタを構築する必要がありますか?答えはあなたのデータ分析要件に依存しては、Hadoopクラスタ機能と一致しています。あなたは会社がHadoopクラスタの恩恵を受けているかどうかわからない場合は、大規模なクラスタを構築するために提出する前に、あなたはどのように余分なハードウェアを確認するようにApache Hadoopのをダウンロードしてインストールすることができます。
推奨読書
40 +すべてここにビッグデータ開発[W]チュートリアルの年俸!
大規模なデータ配列を共有するためのトレーニングプログラマはシェルで説明します