大数据学习路线教程图，如何快速入门Spark - 代码天地

大数据学习路线教程图，如何快速入门Spark

企业开发 2019-12-21 00:10:15 阅读次数: 0

随着互联网的发展，大数据已经成为了新一代的“网红”，各行各业几乎都和大数据产生着关系。Spark是大数据中重要的框架之一，下面为大家分享如何快速入门spark。

Apache Spark是在大数据工业界里用的最多的基于内存的技术框架，尤其是RDD的特性以及应用，对帮助理解Spark和任务提交的流程以及缓存机制。

通过以上教程可以让大家掌握Spark的环境搭建，任务调度流程，以及RDD代码的应用。

课程目录：

第1章 Spark知识讲解

01_为什么学习Spark

02_Spark和MapReduce的对比.mp4

03_Spark框架体系

04_Spark下载

05.Spark运行模式介绍

06.Spark集群安装

07.Spark程序执行流程

08.Spark相关名词解释

09_SparkShellLocal

10_SparkShellCluster

11_Spark2.2和Spark1.6Shell对比

第2章 Maven和IDEA

12_Maven和IDEA下载

13_Maven安装

14_IDEA安装

15_IDEA中配置Maven

16_Scala环境安装和IDEA中配置Scala插件

17_IDEA创建Spark工程

18_Spark开发WordCount程序

19_Spark程序打包

20_Spark集群运行打包程序

第3章 RDD知识讲解

21_RDD概念

22_RDD执行流程

23_RDD属性

24_RDD弹性

25_RDD的两种创建

26_RDD编程API

第4章 Transformation算法

27_Transformation算法

28_Action算法

29_Map

30_filter

31_flatMap

32_sample

33 union

34 intersection

35 distinct

36 join

37_leftOuterJoin

38_rightOuterJoin

39_cartesian

40_groupBy

41_mapPartition

42_mapPartitionWithIndex

43_sortby

44_sortbykey

45_repartition

46_coalesce

47_partitionBy

48_repartitionAndSortWithinPartitions

49_reduce

50_reduceByKey

51_aggregateByKey

52_combineByKey

第5章 Action算法

53_collect

54_count

55_top

56_take

57_takeOrdered

58_first

59_saveAsTextFile

60_foreach

61_其他算子之countByKey

62_其他算子之countByValue

63_其他算子之filterByRange

64_其他算子之flatMapValues

65_其他算子之foreachPartition

66_其他算子之keyBy

67_其他算子之keys和values

68_其他算子之collectAsMap

69_RDD函数传递

70_RDD的依赖关系

71_RDD任务划分

72_Lineage血统

73_RDD缓存(持久化)

猜你喜欢

转载自blog.51cto.com/14489558/2460157

大数据学习路线教程图，如何快速入门Spark

如何快速入门Spark——大数据教程免费领取

大数据学习路线如何快速入门，一共分为这几个阶段

大数据入门学习路线

大数据框架Spark基础入门学习教程汇集

大数据开发学习路线，如何快速成为大数据工程师？

如何快速入门大数据学习，有哪些入门技巧

大数据spark计算引擎快速入门

[大数据之Spark]——快速入门

最全的大数据入门学习路线

大数据入门篇及学习路线

大数据入门介绍和学习路线

大数据spark开发入门教程

大数据Spark入门教程

好程序员大数据学习路线hbase快速入门

好程序员大数据学习路线hbase快速入门Hbase简介

大数据Hadoop学习系列之Hadoop、Spark学习路线

【备忘】大数据学习从入门到精通学习路线视频教程 100G

如何通过合理的学习规划，快速入门大数据开发

如何快速掌握大数据知识，按照学习路线来

大数据入门的知识体系，大数据学习路线

2020年整理的大数据基础入门教程总结和学习路线

大数据Hadoop快速入门教程

大数据学习如何从入门到精通？这些系统路线你看了吗？

大数据--scala语言快速入门（为学习spark而学scala）

大数据学习路线

大数据的学习路线

大数据入门学习路线｛附上学习资料｝

大数据入门学习路线指导｛附上学习资料｝

大数据学习从入门到精通学习路线

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)