Explication détaillée des paramètres de la tâche soumise dans SparkBase et du processus principal d'exécution du code

Lien vers le site officiel des paramètres de soumission Spark

Capture d'écran du site officiel: en savoir plus en anglais
Insérez la description de l'image ici

  • Cas Pi:
SPARK_HOME=/export/server/spark
${SPARK_HOME}/bin/spark-submit \
--master yarn  \
--deploy-mode client \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 1 \
--total-executor-cores 2 \
--class org.apache.spark.examples.SparkPi \
${SPARK_HOME}/examples/jars/spark-examples_2.11-2.4.5.jar \
10
  • ** Configuration des paramètres de base: ** Lors de la soumission pour exécuter Spark Application, certains paramètres de base doivent recevoir des valeurs, comme indiqué ci-dessous:

Insérez la description de l'image ici
Chargez dynamiquement les paramètres d'exécution de Spark Applicaiton et spécifiez via -conf
Insérez la description de l'image ici

  • Configuration des paramètres du programme de pilote:
    chaque exécution de l' application Spark dispose d'un programme de pilote , qui appartient à un processus de processus JVM et peut définir le nombre de cœurs de mémoire et de cœur de processeur (ressources)
    Insérez la description de l'image ici
  • Configuration des paramètres de l'exécuteur : (comprenez que si la quantité de données est importante, utilisez-la pour modifier la mémoire CPU)
    Insérez la description de l'image ici

Pour résumer:

Yarn:
--num-executors NUM     去启动的executors的数量,默认为2      
--executor-cores NUM 	每一个executor有多少cpu cores,yarn默认为1		
假如:num-executors=10个executors数量,每个executor有executor-cores=2,所有的executor的cpucores的数量10*2=20个
#Executor 的内存,真正执行计算的内存
--executor-memory MEM       Memory per executor (e.g. 1000M, 2G) (Default: 1G).         每个Executor的内存,1G	
假如:num-executors=10个executors数量,每个executor的内存--executor-memory=2G,所有参与计算的executors的内存是10*2=20G
	
--driver-cores NUM      Driver端使用的CPuCores集合,默认为1
#Driver 申请资源执行计算
--driver-memory MEM     Memory for driver (e.g. 1000M, 2G) (Default: 1024M).        Driver的内存,1G	
  • Processus principal d'exécution du code: à l'
    Insérez la description de l'image ici
    exception de l'ouverture et de la fermeture de SparkCOntext, toutes les autres parties sont terminées dans l'exécuteur

Je suppose que tu aimes

Origine blog.csdn.net/m0_49834705/article/details/112565794
conseillé
Classement