ビッグデータ、科学技術のトレンドをリードする人工知能技術は、ビッグデータの時代への扉を開きました!アップ国立親指!政策支援は、見通しは抜群です!すると、ちょうど川の鯉、無限のストリームを超えるビッグデータの才能のような学習!全体的な状況、繁盛!ここで、私たちは、あなたに手を助けるビッグデータ技術を学ぶために優秀なプログラマードライテクノロジーを送信、我々はより少ないリソースでより多くの前に、ちょうどので、トレーニングの質に注意を払う必要があります!次に、それは、大規模なデータ必修の3つのコースであなたのためです!
A、Hadoopのエコシステム
Hadoopのは、Apache財団によって開発された、分散型システムアーキテクチャです。ユーザーは、分散アプリケーションの開発の基礎となる詳細を知らなくても分散することができます。高速の計算能力とストレージのクラスタをフルに活用。HadoopのHDFSは言及、分散ファイルシステム(Hadoopの分散ファイルシステム)を実装しています。
ビッグデータは、学習、業界を満たしている入門の過程では、体系的な学習パスの欠如は、システム計画を学ぶ、あなたが私の大きな学習データ交換スカートの参加を歓迎します:529 867 072、スカート文書は、大規模なデータの調査マニュアルソートの私の年を持っています、開発ツール、書籍とPDF文書は、あなたは自分自身をダウンロードすることができます。
複数のコンポーネントで構成されるHadoopの「スタック」。含みます:
1.Hadoop分散ファイルシステム(HDFS):デフォルトのストレージ層のすべてのHadoopクラスタ
2.ノードの名前は:Hadoopクラスタでは、データ格納先ノード障害およびノード情報が提供されます。
3つのノード:バックアップのノード名は、定期的にデータストア名とノード障害ケースのノード名を複製します。
4.ジョブトラッカー:Hadoopクラスタのノードは、MapReduceのデータ処理タスクまたはジョブを開始し、調整します。
通常ノードHadoopクラスタノードと記憶データからジョブトラッカから取得するデータ処理命令:ノード5.。
二、スパーク生態系
スパークは、オープンソースのHadoopクラスタ・コンピューティング環境でのものに似ていますが、両者の間にいくつかの違いが残っている、特定のワークロードのパフォーマンスがスパーク間のこれらの有益な違いは、Sparkを有効にするために、他の言葉で、優れていましたメモリ分散型データセットは、インタラクティブクエリを提供することに加えて、それはまた、反復ワークロードを最適化することができます。ビッグデータの学習交換基:251 956 502
スパークは、それは、そのアプリケーションフレームワークとしてのScala、Scalaの言語で実装されています。そして、異なるHadoopのは、スパークとScalaはしっかりとScalaは、分散データ・セットを操作するように簡単にオブジェクトのローカルコレクションとして動作することができる、統合することができます。
三、嵐リアルタイム開発
ストームは無料で、オープンソースの分散リアルタイムコンピューティングシステムです。嵐は簡単に嵐がリアルタイムデータを扱うことができ、同様に確実に、大量のデータを処理するために、Hadoopのような無制限のデータ・ストリームを扱う使用して行うことができます。シンプルな嵐、あなたは、任意のプログラミング言語を使用することができます。
ストームは、次の特性があります。
開発者は、アプリケーション・ロジックに集中する必要がある、とHadoopのと同様の、嵐は、プログラミングプリミティブは非常に簡単です提供しています。1.プログラミングは簡単です
2.高性能、低レイテンシー:検索エンジン広告は、このようなシナリオに適用することができる広告主操作リアルタイム応答を必要とします。
3.分散:あなたは簡単に大量のデータを扱うことができ、1つのシーンを扱うことができません
4.スケーラブル:ビジネスの発展に伴い、データ量及び計算量が増加すると、システムのレベルを拡張することができます
5.フォールトトレランス:単一ノードは、アプリケーションがハングアップには影響しません
6.メッセージが失われていません。保証メッセージング