Spark中的BlockManager及Spark HA - 代码天地

Spark中的BlockManager及Spark HA

其他 2019-05-02 15:31:24 阅读次数: 0

对于Executor中执行的BlockManager总结如下：

1、一个Executor中一个BlockManager

2、一个worker中可以有多个Executor

3、对于driver端拥有的是BlockManagerMaster。

在task执行过程中，读取广播变量的时候，第一次读取广播变量的时候，BlockManager中是没有广播变量的值的，是需要BlockManager去Driver端拉取。

一个BlockManager由四部分组成：Memery Store、Disk Store、ConnectionManager、BlockTransferService；

过程解释如下：

（1）线程池中的task第一次执行去Memert Store读取广播变量的时候，Executor中的BlockManager中的ConnectionManager首先与Driver端的ConnectionManager建立连接。

（2）由Executor端的BlockTransferService去Driver端的Memery Store拉取数据。

（3）拉取数据成功后放入Executor端的Memery Store 中，供Task运行时读取。

Spark HA

在Spark中实现HA，我们采用的是Zookeeper，Zookeeper不仅有存储功能，还有选举功能。

Zookeeper中可以存储Master的元数据信息（worker、Application、Driver等），将元数据信息存储到Znode临时节点上。

问题：

（1）在master的主备切换的过程中，能否提交新的Application任务？

答：不能，因为主备切换时需要时间的，不能接受Driver和Application的注册，也就不能分配资源。

（2）在master的主备切换的过程中，已经提交的Application会受到影响吗？

答：不会，因为spark是粗粒度的资源调用，当前运行的Application已经得到了运行所需要的全部资源，所以不会受到影响。

猜你喜欢

转载自www.cnblogs.com/learn-bigdata/p/10802326.html

Spark中的BlockManager及Spark HA

Spark HA

【Spark七十】Spark Standalone HA

spark集群HA搭建

spark的HA集群搭建

Spark 集成hadoop ha

大数据-Spark的HA

基于YARN HA集群的Spark HA集群

Spark | BlockManager

Spark Standalone Mode配置HA

hadoop2.7.0 ha Spark

Spark核心原理 - 容错与HA

Spark HA高可用部署

（二）spark HA安装部署

Spark的Driver高可用HA

Spark Streaming高可用HA

Spark配置高可用（HA）

【Spark】Spark 容错及 HA--Master 异常

【Spark】Spark 容错及 HA--Worker 异常

【Spark】Spark 容错及 HA--Executor 异常

搭建spark集群以及spark HA部署

Spark中Blockmanager相关代码解析

Spark的Standalone模式之HA集群搭建

Spark On Yarn(HDFS HA)详细配置过程

Spark HA(高可用)集群的搭建

（七）Spark学习笔记之HA

spark环境安装之HA 高可用

Spark 访问HA模式下的HDFS

Spark环境搭建——HA高可用模式

Spark集群HA环境搭建教程

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)