Spark简单介绍笔记

其他 2018-11-29 02:03:02 阅读次数: 0

参考资料：http://dockone.io/article/1723

https://blog.csdn.net/pangjiuzala/article/details/50838591

http://wiki.baidu.com/pages/viewpage.action?pageId=488923228

https://blog.csdn.net/do_what_you_can_do/article/details/53128480

https://blog.csdn.net/chenxun_2010/article/details/79218083

spark中的executor和task的关系：http://wenda.chinahadoop.cn/question/4465

一、spark架构

架构简介

spark中executor和task 的关系：

一、Standalone模式流程

1、使用SparkSubmit提交任务的时候(包括Eclipse或者其它开发工具使用new SparkConf()来运行任务的时候)，Driver运行在Client；使用SparkShell提交的任务的时候，Driver是运行在Master上
2、使用SparkSubmit提交任务的时候，使用本地的Client类的main函数来创建sparkcontext并初始化它；
3、SparkContext连接到Master，注册并申请资源（内核和内存）。
4、Master根据SC提出的申请，根据worker的心跳报告，来决定到底在那个worker上启动StandaloneExecutorBackend（executor）
5、executor向SC注册
6、SC将应用分配给executor，
7、SC解析应用，创建DAG图，提交给DAGScheduler进行分解成stage(当出发action操作的时候，就会产生job，每个job中包含一个或者多个stage，stage一般在获取外部数据或者shuffle之前产生)。然后stage（又称为Task Set）被发送到TaskScheduler。TaskScheduler负责将stage中的task分配到相应的worker上，并由executor来执行
8、executor创建Executor线程池，开始执行task，并向SC汇报
9、所有的task执行完成之后，SC向Master注销

猜你喜欢

转载自blog.csdn.net/Noreaday/article/details/81200116

Spark简单介绍笔记

spark简单介绍

Spark Sql 简单介绍

Spark GraphX 简单介绍

Spark MLlib 简单介绍

Spark Streaming 简单介绍

Spark原理简单介绍

Spark SQL 笔记(4)——Spark SQL 介绍

Spark Streaming介绍以及简单使用

Spark SQL 快速入门系列(1) | Spark SQL 的简单介绍！

Spark Streaming 快速入门系列(1) | Spark Streaming 的简单介绍！

Avro简单笔记介绍

spark运行原理简单介绍和一些总结

Hadoop、storm和Spark Streaming简单介绍（非原创）

Spark SQL 快速入门系列(2) | SparkSession与DataFrame的简单介绍

Spark介绍

35-Spark Streaming反压机制、Spark的数据倾斜的解决和Kylin的简单介绍

Spark Streaming笔记整理（一）：基本工作原理介绍

【Android学习笔记】布局的简单介绍

linux学习笔记-----ps命令的简单介绍

android学习笔记——Socket简单介绍

一、VUE学习笔记-vue的简单介绍

Hadoop自学笔记（三）MapReduce简单介绍

Mongo db 简单介绍及命令笔记

学习VUE笔记（一）简单介绍

【JavaScript学习笔记10】JSON简单介绍

Python魔法函数简单介绍学习笔记

Docker学习笔记（一）：Docker的简单介绍

【前端笔记】indexDB使用简单介绍

spark学习笔记__chap4_spark基础原理__1_模块介绍

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)