2020冬の休暇（1）

休日大規模なデータのためのいくつかの時間前最後の学期我々は可視化ツールの少し要約行う echarts 参照Bのいくつかのセクションを学ぶためにスタンドを。

次の休日は、学ぶことができますスパークを。

う今日スパークインストールが完了し、学生moocをその上スパーク章ビデオ学習仕上がり。分け6 節。

スパーク、概要スパーク生態系を、スパークは建築、実行されているスパークSQL 、スパーク展開とアプリケーションモード、スパークプログラミングプラクティスを。

正常にインストール火花

スパークは、と比較して、大規模なデータ並列コンピューティングフレームメモリに基づいて計算されたディスク・ベースのコンピューティングHadoopの低レイテンシ、高速の利点を有するコンピューティングフレームワークを。
スパークエコシステムは、スパークコア（設けられたインメモリコンピューティング）、スパークSQL （対話型分析を提供する）、スパークストリーミング、（フロー計算機能を提供する）MLLib （機械学習アルゴリズムは、コンポーネントライブラリを提供する）とGraphx （図コンピューティングを提供します）およびその他のコンポーネント。

3. ファイル名を指定して実行アーキテクチャ

スパークのプロセスを実行しています：

スパーク使っエグゼキュータの利点を

①起動時のオーバーヘッドの作業を減らす、特定のタスクを実行するために複数のスレッドを使用

②使用BlockManagerを低減するために記憶モジュールをIOのオーバーヘッドを

4.sparkのSQL：ハイブ互換性のレベルが唯一の依存HiveQLは、解決ハイブメタデータを。

スパーク実験の準備ができて、次の日