大数据学习（09）--spark学习

其他 2019-04-12 09:40:54 阅读次数: 0

文章目录

目录

1.spark介绍

1.1 spark介绍
1.2 scale介绍
1.3 spark和Hadoop比较

2.spark生态系统
3.spark运行框架

3.1 基本概念
3.2 架构的设计
3.3 spark运行基本流程
3.4 spark运行原理
3.5 RDD运行原理

3.5.1 设计背景
3.5.2 RDD概念和特性
3.5.3 RDD之间的依赖关系
3.5.4 stage的划分
3.5.5 RDD的运行过程

4.spark SQL

4.1 shark的介绍
4.2 spark SQL的介绍

5.spark的部署和运行

5.1 三种部署方式
5.2 从Hadoop+Strom 架构转向spark架构
5.3 Hadoop 和spark的统一部署

6.spark编程实践

6.1 spark安装
6.2 启动spark shell
6.3 spark RDD的操作
6.4 spark应用程序

目录

1.spark介绍

1.1 spark介绍

在这里插入图片描述

spark不仅仅是一个计算框架，而是一个大数据处理的平台，或者说生态。

1.2 scale介绍

在这里插入图片描述

1.3 spark和Hadoop比较

在这里插入图片描述

spark将运行的中间结果写入内存，而不是如MapReduce那样每次都写入磁盘，所以速度非常快，那么肯定就有疑问，内存相比于磁盘来说，那么小，如何解决大数据的中间结果的存储，spark是采用优先写内存，内存写满后，才往磁盘中写入。

2.spark生态系统

在这里插入图片描述

3.spark运行框架

3.1 基本概念

在这里插入图片描述

3.2 架构的设计

在这里插入图片描述

3.3 spark运行基本流程

在这里插入图片描述

3.4 spark运行原理

在这里插入图片描述

3.5 RDD运行原理

3.5.1 设计背景

在这里插入图片描述

3.5.2 RDD概念和特性

在这里插入图片描述

3.5.3 RDD之间的依赖关系

在这里插入图片描述

3.5.4 stage的划分

在这里插入图片描述

3.5.5 RDD的运行过程

在这里插入图片描述

4.spark SQL

4.1 shark的介绍

在这里插入图片描述

4.2 spark SQL的介绍

在这里插入图片描述

5.spark的部署和运行

5.1 三种部署方式

在这里插入图片描述

5.2 从Hadoop+Strom 架构转向spark架构

在这里插入图片描述

5.3 Hadoop 和spark的统一部署

在这里插入图片描述

6.spark编程实践

6.1 spark安装

在这里插入图片描述

6.2 启动spark shell

在这里插入图片描述

6.3 spark RDD的操作

在这里插入图片描述

6.4 spark应用程序

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/wangzi11111111/article/details/89175287

大数据学习（09）--spark学习

spark大数据的学习

大数据学习之spark

大数据学习——spark笔记

大数据Hadoop，spark学习

大数据学习笔记09：MapReduce概述

Spark大数据学习资源汇总

大数据学习之SPARK计算天下

大数据框架学习：从 Hadoop 到 Spark

大数据学习笔记5 - Spark

大数据学习——spark运营案例

大数据系列：Spark学习笔记

大数据学习(十八)spark部署

大数据技术学习代码纪录——Spark

大数据学习之MapReduce基础与Yarn集群安装09

大数据学习day09----hadoop--day06-------

大数据Hadoop学习系列之Hadoop、Spark学习路线

大数据学习开发：Spark之数据倾斜调优

大数据学习笔记（六）-spark streaming demo 运行【原创】

大数据学习笔记（四）-spark 安装【原创】

大数据学习笔记（七）-运行spark脚本【原创】

大数据学习笔记（五）-spark demo 运行【原创】

学习Scala 进击大数据Spark生态圈

大数据学习[20]---Spark基本架构及原理[转]

Scala 学习进击大数据Spark生态圈

(视频)Scala 学习进击大数据Spark生态圈

如何系统的学习大数据框架 hadoop 和spark？

在大数据学习中Hadoop和Spark哪个更好就业？

Python学习笔记——大数据之SPARK核心

Python学习笔记——大数据之Spark简介与环境搭建

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)