スパークはじめに
スパークのHadoopのMapReduceの利点を有しているが、出力をメモリに格納することができ、ノーライトHDFSよう
MapReduceのプログラミングモデルを交換するための責任のデータ火花を計算することは、ストレージシステムは、HDFSを置き換えることはできません
スパーク特徴:
- 計算速度、メモリ100は、Hadoopのは畳む計算され、ハードディスクは10倍速くすることができ
- 簡単に使用するには、Java、Scalaの、Pythonと他のプログラミングを使用することができます
- 一般的な、SQL、リアルタイムストリーミング計算、MLIBの機械学習、graphXマップ計算
- これは、さまざまなプラットフォーム上で実行することができます
なぜ火花を学びます: