Spark源码剖析——SparkContext的初始化(四)_Hadoop相关配置及Executor环境变量

其他 2018-07-15 22:04:15 阅读次数: 0

4. Hadoop相关配置及Executor环境变量的设置

4.1 Hadoop相关配置信息

默认情况下，Spark使用HDFS作为分布式文件系统，所以需要获取Hadoop相关配置信息的代码如下：

获取的配置信息包括：

将Amazon S3文件系统的AccessKeyId和SecretAccessKey加载到Hadoop的Configuration；
将SparkConf中所有以spark.hadoop. 开头的属性都复制到Hadoop的Configuration；
将SparkConf的属性spark.buffer.size复制为Hadoop的Configuration的配置io.file.buffer.size；

注意：如果指定了SPARK_YARN_MODE属性，则会使用YarnSparkHadoopUtil，否则默认为SparkHadoopUtil。

4.2 Executor环境变量

对Executor的环境变量的处理，见代码如下。executorEnvs包含的环境变量将会在注册应用的过程中发送给Master，Master给Worker发送调度后，Worker最终使用executorEnvs提供的信息启动Executor，可以通过配置spark.executor.memory指定Executor占用的内存大小，也可以配置系统变量SPARK_EXECUTOR_MEMORY或者SPARK_MEM对其大小进行设置。代码如下：

猜你喜欢

转载自www.cnblogs.com/swordfall/p/9306113.html

Spark源码剖析——SparkContext的初始化(四)_Hadoop相关配置及Executor环境变量

spark 内核源码剖析四：SparkContext初始化

Spark2.2源码剖析——SparkContext初始化及Spark环境创建

Spark源码剖析——SparkContext的初始化(七)_TaskScheduler的启动

Spark源码剖析——SparkContext的初始化(八)_初始化管理器BlockManager

Spark-源码-SparkContext的初始化

Hadoop相关配置及Executor环境变量的设置

Spark源码剖析——SparkContext的初始化(五)_创建任务调度器TaskScheduler

Spark源码剖析——SparkContext的初始化(六)_创建和启动DAGScheduler

spark源码学习（一）- sparkContext 初始化过程

spark源码分析之SparkContext初始化一

Spark源码解读之SparkContext初始化

【Spark内核源码】SparkContext中的组件和初始化

七、初始化环境变量

Spark源码剖析——SparkContext实例化

Spark2.1.0——SparkContext初始化之Spark环境的创建

初始化SparkContext

SparkContext初始化

SparkContext的初始化

spark 源码分析之四 -- TaskScheduler的创建和启动过程 spark 源码分析之二 -- SparkContext 的初始化过程

spark学习-30-spark2.2.0的SparkContext初始化

spark之Executor与初始化SparkSession

spark2.11-2.3源码1_SparkContext初始化

Spark-Core源码学习记录 3 SparkContext、SchedulerBackend、TaskScheduler初始化及应用的注册流程

Spark架构原理-SparkContext的初始化原理

Mac环境变量配置错了以后初始化的方法

linux初始化环境变量配置文件详解

环境变量初始化与对应文件的生效顺序

Nginx源码剖析--模块配置信息初始化

hadoop配置环境变量

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)