「Spark fast big data analysis」がついにそれを手に入れました。ソースコードの読み取りを開く正しい方法です。

近年、ビッグデータはだんだん暖かくなっており、なぜビッグデータが重要なのかとよく聞かれます。私たちはデータ爆発の時代にあり、

多数の新興のスマートフォン、タブレット、ウェアラブルデバイス、およびIoTデバイスが、時々新しいデータを生成しています。

ビッグデータソリューションには通常、ストレージ、コンピューティング、ネットワーキングなどのハードウェアレイヤーからデータ処理まで、複数の重要なコンポーネントが含まれています

エンジン、そして改善された統計および計算アルゴリズムとデータ視覚化を使用してビジネスの洞察を得るための分析レイヤー。途中で

データ処理エンジンは非常に重要な役割を果たします。データ処理エンジンはビッグデータをCPUのように扱うと言っても過言ではありません

コンピュータに、または人間に脳。

 

 

情報を入手する

エグゼクティブサマリー

この本は、Spark開発者とコアメンバーが共同で作成し、効率的かつ高速に説明しています

データをすばやく分析および処理するためのツール-Sparkは、読者がSparkを使用して海の収集、計算、単純化、および保存をすばやく習得するのに役立ちます

データの測定方法、相互作用の分析、反復分析、増分分析、パーティション化、データのローカリゼーション、カスタムシリアライゼーションの問題の解決。

この本は、ビッグデータの時代にデータ分析を必要とするすべての人に適しています。

この本の特徴

この本の構成は明確で、章は表から表の順に読んでいます。各章の始めに、

この章のどのサブセクションがデータサイエンティストにとってより重要であり、どのサブセクションがエンジニアにとってより有用であるかは明らかです。ことば

それでも、本のすべての内容が両方のタイプの読者に役立つことを願っています。

最初の2つの章では、まず始めに、コンピューター上で基本的なSparkを構築し、Sparkを使用できるようにします。

何ができるかという基本的な概念があります。SparkターゲットとSparkのインストールを理解した後、開始します

Sparkシェルを再導入します。Sparkシェルは、Sparkアプリケーションのプロトタイプを開発するときに非常に役立つツールです。次の章について詳しく説明します

Spark API、クラスターでSparkアプリケーションを実行する方法、Sparkが提供する高レベルのライブラリーの紹介

SQL(データベースサポート)やMLlib(機械学習ライブラリ)などのサポート。

ディレクトリのスクリーンショット

 

 

高度なSparkプログラミング

 

 

 

クラスターでSparkを実行する

 

 

 

スパークストリーミング

 

 

 

MLlibに基づく機械学習

 

おすすめ

転載: www.cnblogs.com/yunxi520/p/12674555.html