Flink客户端操作命令
1.基于Yarn模式提交任务
使用平台jar包测试:
./bin/flink run -m yarn-cluster -p 2 ./examples/batch/WordCount.jar \
--input hdfs:///user/wupq/words.txt \
--output hdfs:///user/wupq/output2/2020122301
提交自己编写代码:
./bin/flink run -m yarn-cluster -yn 2 -c com.tencent.tbds.demo.KafkaSourceDemo /root/wupq/tbds-demo-1.0-SNAPSHOT.jar
注意:Flink1.12版本不支持-yn参数
2.flink run
-c,–class Flink应用程序的入口
-C,–classpath 指定所有节点都可以访问到的url,可用于多个应用程序都需要的工具类加载
-d,–detached 是否使用分离模式,就是提交任务,cli是否退出,加了-d参数,cli会退出
-n,–allowNonRestoredState 允许跳过无法还原的savepoint。比如删除了代码中的部分operator
-p,–parallelism 执行并行度
-s,–fromSavepoint 从savepoint恢复任务
-sae,–shutdownOnAttachedExit 以attached模式提交,客户端退出的时候关闭集群
3.flink yarn-cluster 模式
-d,–detached 是否使用分离模式
-m,–jobmanager 指定提交的jobmanager
-yat,–yarnapplicationType 设置yarn应用的类型
-yD <property=value> 使用给定属性的值
-yd,–yarndetached 使用yarn分离模式
-yh,–yarnhelp yarn session的帮助
-yid,–yarnapplicationId 挂到正在运行的yarnsession上
-yj,–yarnjar Flink jar文件的路径
-yjm,–yarnjobManagerMemory jobmanager的内存(单位M)
-ynl,–yarnnodeLabel 指定 YARN 应用程序 YARN 节点标签
-ynm,–yarnname 自定义yarn应用名称
-yq,–yarnquery 显示yarn的可用资源
-yqu,–yarnqueue 指定yarn队列
-ys,–yarnslots 指定每个taskmanager的slots数
-yt,–yarnship 在指定目录中传输文件
-ytm,–yarntaskManagerMemory 每个taskmanager的内存
-yz,–yarnzookeeperNamespace 用来创建ha的zk子路径的命名空间
-z,–zookeeperNamespace 用来创建ha的zk子路径的命名空间
4.flink info
info [OPTIONS]
5.flink list(显示正在运行或调度的程序)
-a,–all 显示所有应用和对应的job id
-r,–running 显示正在运行的应用和job id
-s,–scheduled 显示调度的应用和job id
#yarn-cluster模式
-m,–jobmanager 指定连接的jobmanager
-yid,–yarnapplicationId 挂到指定的yarn id对应的yarn session上
-z,–zookeeperNamespace 用来创建ha的zk子路径的命名空间
6. flink stop(停止一个正在运行的应用)
-d,–drain 在获取savepoint,停止pipeline之前发送MAX_WATERMARK
-p,–savepointPath 指定savepoint的path,如果不指定会使用默认值(“state.savepoints.dir”)
7.savepoint(触发一个正在运行的应用生成savepoint)
语法:savepoint [OPTIONS] []
-d,–dispose savepoint的路径
-j,–jarfile Flink的jar包