使用hue创建ozzie的pyspark action workflow

hue是一个Apache Hadoop ui系统,本篇文章介绍如何使用hue创建一个ozzie的pyspark action的workflow, 该workflow仅包含一个spark action。注意,本文使用的是python语言的pyspark。

  1. 编写一个python操作spark的程序。
    demo.py
from pyspark.sql import SparkSession

spark = SparkSession.builder.enableHiveSupport().appName(
"demo").getOrCreate()

# spark 的一些操作
.......

  1. 新建workflow
    在hue中创建workflow
    拖拽ozzie action

传入需要运行的python脚本
添加Python文件

  1. 对该action 进行一些属性的配置。
    spark 设置

对spark进行设置,可以选择spark的运行模式。
默认使用的是spark1 的库去执行,如果使用的是spark2,则需要设置属性oozie.action.sharelib.for.spark=spark2 如图所示。
在这里插入图片描述
进入2设置,进行一些变量的设置
oozie.libpath 需要使用到spark的一些jar包,填入路径jar包路径。

在这里插入图片描述
4. 该workflow已经设置成功,可以对其进行运行进行测试。

猜你喜欢

转载自blog.csdn.net/qq_22918243/article/details/89204111