Flink流批一体计算(6):Flink配置

目录

配置说明

配置详情


配置说明

Flink所有的配置参数都可以在客户端侧进行配置,建议用户直接修改客户端的配置文件flink-conf.yaml进行配置:

  • 配置文件路径: flink/conf/flink-conf.yaml。
  • 文件的配置格式为key: value

例:taskmanager.heap.size: 1024mb

注意配置项key:value之间需有空格分隔。

配置详情

   •    JobManager & TaskManager:
JobManager和TaskManager是Flink的主要组件,针对各种安全场景和性能场景。

配置项包括通信端口,内存管理,连接重试等。
•    Blob服务端:
JobManager节点上的Blob服务端是用于接收用户在客户端上传的Jar包,或将Jar包发送给TaskManager,传输log文件等。

配置项包括端口,SSL,重试次数,并发等。
•    Distributed Coordination (via Akka):
Flink客户端与JobManager的通信,JobManager与TaskManager的通信和TaskManager与TaskManager的通信都基于Akka actor模型,相关参数可以根据网络环境或调优策略进行配置。

配置项包括消息发送和等待的超时设置,akka监听机制Deathwatch等。
•    SSL:
当需要配置安全Flink集群时,需要配置SSL相关配置项。

配置项包括SSL开关,证书,密码,加密算法等。
•    Network communication (via Netty):
Flink运行Job时,Task之间的数据传输和反压检测都依赖Netty,某些环境下可能需要对Netty参数进行配置。对于高级调优,可调整部分Netty配置项,默认配置已可满足大规模集群并发高吞吐量的任务。
•    JobManager Web Frontend:
JobManager启动时,会在同一进程内启动Web服务器,访问Web服务器可以获取当前Flink集群的信息,包括JobManager,TaskManager及集群内运行的Job。

Web服务器参数的配置项包括端口,临时目录,显示项目,错误重定向,安全相关等。
•    File Systems:
Task运行中会创建结果文件,支持对文件创建行为进行配置。

配置项包括文件覆盖策略,目录创建等。
•    State Backend:
Flink提供了HA和作业的异常恢复,并且提供版本升级时作业的暂停恢复。对于作业状态的存储,Flink依赖于state backend,作业的重启依赖于重启策略,用户可以对这两部分进行配置。

配置项包括state backend类型,存储路径,重启策略等。
•    Kerberos-based Security:
Flink安全模式下必须配置Kerberos相关配置项。

配置项包括kerberos的keytab、principal等。
•    HA:
Flink的HA模式依赖于ZooKeeper,所以必须配置ZooKeeper相关配置。

配置项包括ZooKeeper地址,路径,安全认证等。
•    Environment:
对于JVM配置有特定要求的场景,可以通过配置项传递JVM参数到客户端,JobMananger,TaskManager等。
•    Yarn:
Flink运行在Yarn集群上时,JobManager运行在Application Master上。JobManager的一些配置参数依赖于Yarn,通过配置YARN相关的配置,使Flink更好的运行在Yarn上。

配置项包括yarn container的内存,虚拟内核,端口等。
•    Pipeline:
为适应某些场景对降低时延的需求,设计多个Job间采用Netty直接相连的方式传递数据,即分别使用NettySink用于Server端、NettySource用于Client端进行数据传输。

配置项包括NettySink的信息存放路径、NettySink的端口监听范围、连接是否通过SSL加密以及NettySink监听所使用的网络所在域等。

猜你喜欢

转载自blog.csdn.net/victory0508/article/details/131435962