大数据学习笔记之azkaban

版权声明:此博客为学习笔记所用不得转载! https://blog.csdn.net/weixin_43704599/article/details/84928184

Azakaban的安装部署

安装前准备

  1. 将Azkaban Web服务器、Azkaban执行服务器、Azkaban的sql执行脚本及MySQL安装包拷贝到hadoop102虚拟机/opt/software目录下
    azkaban-web-server-2.5.0.tar.gz
    azkaban-executor-server-2.5.0.tar.gz
    azkaban-sql-script-2.5.0.tar.gz
    mysql-libs.zip
  2. 选择Mysql作为Azkaban数据库

安装Azkaban

  1. 在/opt/module/目录下创azkaban目录
mkdir azkaban
  1. 解压azkaban-web-server-2.5.0.tar.gz、azkaban-executor-server-2.5.0.tar.gz、azkaban-sql-script-2.5.0.tar.gz到/opt/module/azkaban目录下
tar -zxvf azkaban-web-server-2.5.0.tar.gz -C /opt/module/azkaban/
tar -zxvf azkaban-executor-server-2.5.0.tar.gz -C /opt/module/azkaban/
tar -zxvf azkaban-sql-script-2.5.0.tar.gz -C /opt/module/azkaban/
  1. 对解压后的文件重新命名
mv azkaban-web-2.5.0/ server
mv azkaban-executor-2.5.0/ executor
  1. azkaban脚本导入
    进入mysql,创建azkaban数据库,并将解压的脚本导入到azkaban数据库。
mysql -uroot -p123456
mysql> create database azkaban;
mysql> use azkaban;
mysql> source /opt/module/azkaban/azkaban-2.5.0/create-all-sql-2.5.0.sql

注:source后跟.sql文件,用于批量处理.sql文件中的sql语句。

生成密钥库

Keytool是java数据证书的管理工具,使用户能够管理自己的公/私钥对及相关证书。
-keystore 指定密钥库的名称及位置(产生的各类信息将不在.keystore文件中)
-genkey 在用户主目录中创建一个默认文件".keystore"
-alias 对我们生成的.keystore 进行指认别名;如果没有默认是mykey
-keyalg 指定密钥的算法 RSA/DSA 默认是DSA

  1. 生成 keystore的密码及相应信息的密钥库
keytool -keystore keystore -alias jetty -genkey -keyalg RSA
输入密钥库口令:  
再次输入新口令: 
您的名字与姓氏是什么?
  [Unknown]:  
您的组织单位名称是什么?
  [Unknown]:  
您的组织名称是什么?
  [Unknown]:  
您所在的城市或区域名称是什么?
  [Unknown]:  
您所在的省/市/自治区名称是什么?
  [Unknown]:  
该单位的双字母国家/地区代码是什么?
  [Unknown]:  
CN=Unknown, OU=Unknown, O=Unknown, L=Unknown, ST=Unknown, C=Unknown是否正确?
  [否]:  y

输入 <jetty> 的密钥口令
        (如果和密钥库口令相同, 按回车):  
再次输入新口令:

注意: 密钥库的密码至少必须6个字符,可以是纯数字或者字母或者数字和字母的组合等等 密钥库的密码最好和<jetty> 的密钥相同,方便记忆
2. 将keystore 拷贝到 azkaban web服务器根目录中

mv keystore /opt/module/azkaban/server/

时间同步

时间同步见hadoop安装

配置文件

  1. 进入azkaban web服务器安装目录 conf目录,打开azkaban.properties文件
pwd
/opt/module/azkaban/server/conf
vim azkaban.properties
  1. 按照如下配置修改azkaban.properties文件
#Azkaban Personalization Settings
#服务器UI名称,用于服务器上方显示的名字
azkaban.name=Test
#描述
azkaban.label=My Local Azkaban
#UI颜色
azkaban.color=#FF3601
azkaban.default.servlet.path=/index
#默认web server存放web文件的目录
web.resource.dir=/opt/module/azkaban/server/web/
#默认时区,已改为亚洲/上海 默认为美国
default.timezone.id=Asia/Shanghai

#Azkaban UserManager class
user.manager.class=azkaban.user.XmlUserManager
#用户权限管理默认类(绝对路径)
user.manager.xml.file=/opt/module/azkaban/server/conf/azkaban-users.xml

#Loader for projects
#global配置文件所在位置(绝对路径)
executor.global.properties=/opt/module/azkaban/executor/conf/global.properties
azkaban.project.dir=projects

#数据库类型
database.type=mysql
#端口号
mysql.port=3306
#数据库连接IP
mysql.host=hadoop102
#数据库实例名
mysql.database=azkaban
#数据库用户名
mysql.user=root
#数据库密码
mysql.password=123456
#最大连接数
mysql.numconnections=100

# Velocity dev mode
velocity.dev.mode=false

# Azkaban Jetty server properties.
# Jetty服务器属性.
#最大线程数
jetty.maxThreads=25
#Jetty SSL端口
jetty.ssl.port=8443
#Jetty端口
jetty.port=8081
#SSL文件名(绝对路径)
jetty.keystore=/opt/module/azkaban/server/keystore
#SSL文件密码
jetty.password=000000
#Jetty主密码与keystore文件相同
jetty.keypassword=000000
#SSL文件名(绝对路径)
jetty.truststore=/opt/module/azkaban/server/keystore
#SSL文件密码
jetty.trustpassword=000000

# Azkaban Executor settings
executor.port=12321

# mail settings
mail.sender=
mail.host=
job.failure.email=
job.success.email=

lockdown.create.projects=false

cache.directory=cache
  1. web服务器用户配置
    在azkaban web服务器安装目录 conf目录,按照如下配置修改azkaban-users.xml 文件,增加管理员用户。
vim azkaban-users.xml
<azkaban-users>
	<user username="azkaban" password="azkaban" roles="admin" groups="azkaban" />
	<user username="metrics" password="metrics" roles="metrics"/>
	<user username="admin" password="admin" roles="admin,metrics" />
	<role name="admin" permissions="ADMIN" />
	<role name="metrics" permissions="METRICS"/>
</azkaban-users>

执行服务器配置

  1. 进入执行服务器安装目录conf,打开azkaban.properties
 pwd
 /opt/module/azkaban/executor/conf
 vim azkaban.properties
  1. 按照如下配置修改azkaban.properties文件。
#Azkaban
#时区
default.timezone.id=Asia/Shanghai

# Azkaban JobTypes Plugins
#jobtype 插件所在位置
azkaban.jobtype.plugin.dir=plugins/jobtypes

#Loader for projects
executor.global.properties=/opt/module/azkaban/executor/conf/global.properties
azkaban.project.dir=projects

database.type=mysql
mysql.port=3306
mysql.host=hadoop102
mysql.database=azkaban
mysql.user=root
mysql.password=123456
mysql.numconnections=100

# Azkaban Executor settings
#最大线程数
executor.maxThreads=50
#端口号(如修改,请与web服务中一致)
executor.port=12321
#线程数
executor.flow.threads=30

启动executor服务器

在executor服务器目录下执行启动命令

pwd
/opt/module/azkaban/executor
 bin/azkaban-executor-start.sh

启动web服务器

在azkaban web服务器目录下执行启动命令

pwd
/opt/module/azkaban/server
bin/azkaban-web-start.sh

注意: 先执行executor,再执行web,避免Web Server会因为找不到执行器启动失败。
jps查看进程

jps
3601 AzkabanExecutorServer
5880 Jps
3661 AzkabanWebServer

启动完成后,在浏览器(建议使用谷歌浏览器)中输入https://服务器IP地址:8443,即可访问azkaban服务了。
在登录中输入刚才在azkaban-users.xml文件中新添加的户用名及密码,点击 login。

Azkaban登录页面
Azkaban主页面

Azkaban操作

Azkaba内置的任务类型支持command、java

单一job

  1. 创建job描述文件
vim first.job
#first.job
type=command
command=echo 'this is my first job'
  1. 将job资源文件打包成zip文件
zip first.zip first.job

注意: 目前,Azkaban上传的工作流文件只支持xxx.zip文件。zip应包含xxx.job运行作业所需的文件和任何文件(文件名后缀必须以.job结尾,否则无法识别)。作业名称在项目中必须是唯一的。
3. 通过azkaban的web管理平台创建project并上传job的zip包
首先创建project
创建project
上传zip包
上传zip包
启动执行该job
启动job
点击执行工作流
在这里插入图片描述
点击继续
在这里插入图片描述
Job执行成功
在这里插入图片描述
点击查看job日志
在这里插入图片描述

扫描二维码关注公众号,回复: 4441633 查看本文章

多job工作流

  1. 创建有依赖关系的多个job描述
第一个job:start.job
vim start.job
#start.job
type=command
command=touch /opt/module/kangkang.txt

第二个job:step1.job依赖start.job

vim step1.job
#step1.job
type=command
dependencies=start
command=echo "this is step1 job"

第三个job:step2.job依赖start.job

vim step2.job
#step2.job
type=command
dependencies=start
command=echo "this is step2 job"

第四个job:finish.job依赖step1.job和step2.job

vim finish.job
#finish.job
type=command
dependencies=step1,step2
command=echo "this is finish job"
  1. 将所有job资源文件打到一个zip包中
zip jobs.zip start.job step1.job step2.job finish.job
updating: start.job (deflated 16%)
  adding: step1.job (deflated 12%)
  adding: step2.job (deflated 12%)
  adding: finish.job (deflated 14%) 
  1. 上传执行
    在这里插入图片描述
    在这里插入图片描述

java操作任务

  1. 编写java程序
import java.io.IOException;

public class AzkabanTest {
	public void run() throws IOException {
        // 根据需求编写具体代码
		FileOutputStream fos = new FileOutputStream("/opt/module/azkaban/output.txt");
		fos.write("this is a java progress".getBytes());
		fos.close();
    }

	public static void main(String[] args) throws IOException {
		AzkabanTest azkabanTest = new AzkabanTest();
		azkabanTest.run();
	}
}
  1. 将java程序打成jar包,创建lib目录,将jar放入lib内
mkdir lib
cd lib/
  1. 编写job文件
vim azkabanJava.job
#azkabanJava.job
type=javaprocess
java.class=com.test.azkaban.AzkabanTest
classpath=/opt/module/azkaban/lib/*
  1. 将job文件打成zip包
zip azkabanJava.zip azkabanJava.job 
  adding: azkabanJava.job (deflated 19%)
  1. 通过azkaban的web管理平台创建project并上传job压缩包,启动执行该job
    在这里插入图片描述
pwd
/opt/module/azkaban
cat output 
this is a java progress

HDFS操作任务

  1. 创建job描述文件
vim fs.job
#hdfs job
type=command
command=/opt/module/hadoop-2.7.2/bin/hadoop fs -mkdir /azkaban

  1. 将job资源文件打包成zip文件
zip fs.zip fs.job 
  adding: fs.job (deflated 12%)

  1. 通过azkaban的web管理平台创建project并上传job压缩包,并执行
    在这里插入图片描述
    在这里插入图片描述

mapreduce任务

  1. 创建job描述文件,及mr程序jar包
vim mapreduce.job
#mapreduce job
type=command
command=/opt/module/hadoop-2.7.2/bin/hadoop jar /opt/module/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /wordcount/input /wordcount/output
  1. 将所有job资源文件打到一个zip包中
zip mapreduce.zip mapreduce.job 
  adding: mapreduce.job (deflated 43%)
  1. 在azkaban的web管理界面创建工程并上传zip包并执行
    在这里插入图片描述
    在这里插入图片描述

Hive脚本任务

  1. 创建job描述文件和hive脚本
vim student.sql
use default;
drop table student;
create table student(id int, name string)
row format delimited fields terminated by '\t';
load data local inpath '/opt/module/datas/student.txt' into table student;
insert overwrite local directory '/opt/module/datas/student'
row format delimited fields terminated by '\t'
select * from student;
  1. Job描述文件:hive.job
vim hive.job
#hive job
type=command
command=/opt/module/hive/bin/hive -f /opt/module/azkaban/jobs/student.sql
  1. 将所有job资源文件打到一个zip包中
vim hive.job
#hive job
type=command
command=/opt/module/hive/bin/hive -f /opt/module/azkaban/jobs/student.sql
  1. 在azkaban的web管理界面创建工程并上传zip包并执行
    在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_43704599/article/details/84928184
今日推荐