《Spark快速大数据分析》终于搞到了,源码阅读的正确打开方式。

近年来大数据逐渐升温,经常有人问起大数据为何重要。我们处在一个数据爆炸的时代,

大量涌现的智能手机、平板、可穿戴设备及物联网设备每时每刻都在产生新的数据。

一套大数据解决方案通常包含多个重要组件,从存储、计算和网络等硬件层,到数据处理

引擎,再到利用改良的统计和计算算法、数据可视化来获得商业洞见的分析层。这中间,

数据处理引擎起到了十分重要的作用。毫不夸张地说,数据处理引擎之于大数据就像 CPU

之于计算机,或大脑之于人类。

 

获取资料

内 容 提 要

本书由 Spark 开发者及核心成员共同打造,讲解了网络大数据时代应运而生的、能高效迅

捷地分析处理数据的工具——Spark,它带领读者快速掌握用 Spark 收集、计算、简化和保存海

量数据的方法,学会交互、迭代和增量式分析,解决分区、数据本地化和自定义序列化等问题。

本书适合大数据时代所有需要进行数据分析的人员阅读。

本书特色

本书结构清晰,章节是按照从前到后依次阅读的顺序组织的。在每一章的开头,我们会说

明本章中的哪些小节对于数据科学家们更重要,而哪些小节则对于工程师们更为有用。话

虽如此,我们还是希望书中的所有内容对两类读者都能有一定的帮助。

前两章将会带你入门,让你在自己的电脑上搭好一个基础的 Spark,并且让你对于用 Spark

能做什么有一个基本的概念。等我们弄明白了 Spark 的目标和 Spark 的安装之后,就会着

重介绍 Spark shell。Spark shell 是开发 Spark 应用原型时非常有用的工具。后续几章则会详

细介绍 Spark API、如何将 Spark 应用运行在集群上,以及 Spark 所提供的更高层的程序库

支持,例如 SQL(数据库支持)和 MLlib(机器学习库)。

目录截图

 

Spark编程进阶

 

在集群上运行Spark

 

Spark Streaming

 

基于MLlib的机器学习

猜你喜欢

转载自www.cnblogs.com/yunxi520/p/12674555.html