ビッグデータフレームワークのHadoopエコシステムのエピソード

1.4 Hadoopのリリース

Hadoopのは、オープンソースのApache(現在はGitHubの)プロジェクトが、Hadoopの業界ではあるが、まだ人々がより簡単に目標としてのHadoopを使用する際に役立つ、新しい企業が多数登場。これらの企業のほとんどは、改善し、すべてのソフトウェアおよび技術サポートを提供することを確保するために協力し、Hadoopのディストリビューションをパッケージ化されます。さて、Apacheはまた、Hadoopの使用を簡素化するために、独自のより多くのツールを開発して、その機能を拡張します。これらのツールは独自のものであり、様々です。一部のツールは、Apache Hadoopのプロジェクトの新しい家族のための基礎になります。その中でも、そのうちのいくつかは、Apache2のGitHubのオープンソースプロジェクトにライセンスしています。これらの企業のすべては、Apache Hadoopのディストリビューションに基づいていますが、それら全てがわずかに異なるとのHadoopのビジョンを持っているが - それを完了するために、どのように、どの方向を選択する必要があります。

これらの企業の最大の違いは、以下のとおりです。Apacheのソースコードを使用して。MAPR会社に加えて、すべてのソースのApache Hadoopのプロジェクトによって定義されるべきです。その代わり、MAPRは、ちょうどApacheのコードの参照実装は、ベースのAPI Apacheは彼らのニーズを満たすために提供することができると思います。このアプローチは、MAPRは、これら2つの基本的なHadoopのより信頼性の高い、より高いパフォーマンスのように、特にHDFSとHBaseの面で、MAPR記憶機構を偉大な技術革新を行ってます。MAPRは、高速ネットワーク・ファイル・システム(NFS)を立ち上げ、あなたは大幅にエンタープライズアプリケーションの数の統合を簡素化HDFSにアクセスすることができます。

懸念のHadoopディストリビューションの上位2つの程度はありますが、AmazonやMicrosoftがリリースされました。どちらも、PaaSのサービスを提供し、対応するクラウドサービスプラットフォーム(アマゾンやアズール)上で実行して、プリインストールのHadoopのバージョンを提供しています。彼らはだけでなく、ローカルのHDFSのHadoopの、HDFSは、MicrosoftとYahooのマッピングデータ・ストレージ・メカニズム(AmazonのS3、アズールとWindows Azureストレージメカニズム)を活用することができ、開発者が利用することを可能にする拡張サービスを提供しています。Amazonはまた、上記S3の関数のHBaseのコンテンツを保存し、復元しています。

表1-1に、主要なHadoopのリリースの主な機能を示しています。

表1:異なるHadoopのベンダー

もちろん、リリースの多数は、あなたが会社/部署が特定のバージョンを採用することを決めたとき、次の点を考慮しなければならないだろう作る「私は使うべきどのディストリビューション?」:

技術的な詳細 -独自の機能のようなHadoopのバージョン、コンポーネント、を含みます。

導入が容易なように、管理をアップグレードし、展開を実現するために、ツールボックスを使用してパッチを適用して- 。

維持しやすい -ように、クラスタ管理、多施設、災害復旧支援、およびサポートを含みます。

コスト -針リリース実装コスト、課金モデルやライセンスを含みます。

エンタープライズ統合サポート-他の部品とのエンタープライズアプリケーション統合でのHadoop。

選択はあなたがどのような問題を解決するためにHadoopを使用する予定のバージョンによって異なります。私は、各リリースで提供された値であることがわかりので、書籍版は、議論とは何の関係もありません。

高度の記事を読んでお勧めします

40 +すべてここにビッグデータ開発[W]チュートリアルの年俸!

ゼロベースのビッグデータクイックスタートチュートリアル

Javaの基礎コース

チュートリアルをWebベースのフロントエンド開発

ビッグデータのエンジニアは、7の概念を理解する必要があります

クラウドコンピューティングの未来とビッグデータファイブ動向

すぐに大規模なデータの独自の知識を構築する方法

おすすめ

転載: blog.csdn.net/chengxvsyu/article/details/92430886