Azkaban多Executor模式下注意事项

Azkaban多Executor模式是指,在集群中多个节点部署Executor。在这种模式下, Azkaban web Server会根据策略,选取其中一个Executor去执行任务。

由于我们需要交给Azkaban调度的脚本,以及脚本需要的Hive,Sqoop等应用只在hadoop102部署了,为保证任务顺利执行,我们须在以下两种方案任选其一,推荐使用方案二

方案一:指定特定的Executor(hadoop102)去执行任务。

1)在MySQL中azkaban数据库executors表中,查询hadoop102上的Executor的id。

mysql> use azkaban;

Reading table information for completion of table and column names

You can turn off this feature to get a quicker startup with -A

Database changed

mysql> select * from executors;

±—±----------±------±-------+

| id | host      | port | active |

扫描二维码关注公众号,回复: 13921542 查看本文章

±—±----------±------±-------+

| 1  | hadoop103 | 35985 | 1 |

| 2  | hadoop104 | 36363 | 1 |

| 3  | hadoop102 | 12321 | 1 |

±—±----------±------±-------+

3 rows in set (0.00 sec)

2)在执行工作流程时加入useExecutor属性,如下

image-20210212161347907

方案二:在Executor所在所有节点部署任务所需脚本和应用。

1)分发脚本、hive、sqoop、spark、my_env.sh

猜你喜欢

转载自blog.csdn.net/zmzdmx/article/details/113795323