Spark2.X 傻瓜教程

Spark2.X 傻瓜视频教程_Spark2视频教程下载
课程分享链接:https://pan.baidu.com/s/1t2x6zEpR1PABC_y0TyXLBw
密码:ltyt

本课程照顾到零基础学员,从最基础的Linux入手,到Hadoop技术,再到Spark官方指定语言Scala,再到最后的SparkSQL,Spark Stream技术,一站式全链路教学,Spark技术一课搞定,电商项目全程贯穿,如果您是一个从未接触过Spark技术的小白,如果您对Spark流实时计算技术感举趣,那么此套课程一定是你需要的

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。

Spark 有以下三个特点:
首先,高级 API 剥离了对集群本身的关注,Spark 应用开发者可以专注于应用所要做的计算本身。
其次,Spark 很快,支持交互式计算和复杂算法。
最后,Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等,而在 Spark 出现之前,我们一般需要学习各种各样的引擎来分别处理这些需求。

猜你喜欢

转载自blog.51cto.com/14115667/2331380