Flink的一些学习点

Task slot是一个TaskManager内资源分配的最小载体，代表了一个固定大小的资源子集，每个TaskManager会将其所占有的资源平分给它的slot。
通过调整 task slot 的数量，用户可以定义task之间是如何相互隔离的。每个 TaskManager 有一个slot，也就意味着每个task运行在独立的 JVM 中。每个 TaskManager 有多个slot的话，也就是说多个task运行在同一个JVM中。
而在同一个JVM进程中的task，可以共享TCP连接（基于多路复用）和心跳消息，可以减少数据的网络传输，也能共享一些数据结构，一定程度上减少了每个task的消耗

Flink – SlotSharingGroup

怎么判断operator属于哪个 slot 共享组呢？默认情况下，所有的operator都属于默认的共享组default，也就是说默认情况下所有的operator都是可以共享一个slot的。而当所有input operators具有相同的slot共享组时，该operator会继承这个共享组。最后，为了防止不合理的共享，用户也能通过API来强制指定operator的共享组，比如：someStream.filter(...).slotSharingGroup("group1");就强制指定了filter的slot共享组为group1。

Flink Rich 函数 open 方法是每来一条数据执行一次还是怎么执行？

open 方法是每个并发线程执行一次，一般用来初始化，而不是每条数据都执行一次。

Flink HA部署， Flink on Yarn搭建，这个~对新手可能会问一下，百度都有。
Flink 怎么设置jvm的参数，对应哪些参数
Flink rebalance算子使用？怎么看数据倾斜？
使用mapstate保存中间状态时，checkpoint会把缓存清空，不清楚怎么回事，有大佬了解么？
在flink遇到性能瓶颈，如何查看是哪个算子卡住了呢？

57，消费kafka数据的时候，如果遇到了脏数据，或者是不符合规则的数据等等怎么处理呢？

先做filter过滤算子呗，不符合要求的过滤或者缓存到哪里

flink jar包上传至集群上运行，挂掉后，挂掉期间kafka中未被消费的数据，在重新启动程序后，是自动从checkpoint获取挂掉之前的kafka offset位置，自动消费之前的数据进行处理，还是需要某些手动的操作呢？

明白一点，Flink+kafka 不需要我们去报错offset了，它会自动checkpoint

Flink jobManager跟 taskManager内存大小设置多少比较好？

这个没有标准答案，看你的数据量跟业务处理，因为数据量大的话你使用有状态的算子多，而且状态多的话，会吃内存，taskmanager 一般4G起步，如果日志报内存不足或者GC问题，要代码业务调优，加大内存资源。

taskManager Slot core的关系？

taskManager 里面有一个或者多个slot，一个slot有一个或者多个core，默认都是1个，需要调整的。

flink的Python api怎样？bug多吗？

哈哈哈哈，有朋友在使用python开发，可以用，但是部分算子 API不一样。

Flink VS Spark VS Storm ？？

Storm淘汰掉把。Spark离线处理，ML目前还是主流，Flink两者特点都有，干就完事了。

使用了ValueState来保存中间状态，在运行时中间状态保存正常，但是在手动停止后，再重新运行，发现中间状态值没有了，之前出现的键值是从0开始计数的，这是为什么？是需要实现CheckpointedFunction吗？

典型的没有理解state存储，state存储是在内存的是通过checkpoint异步存储到磁盘或者hdfs，肯定要开启checkpoint的。

Flink 1.9.0 ，flink-table_${scala_bin_version}这个artifact变成flink-table了，而且下载不到jar，我上central的repository看了，从1.7.2以上的版本，flink-table都缺少jar，哪位已经用起来1.9.0了，指点一下？

答：1.8之后就不再有flink-table的jar包了，都是用这个planner和common包

<dependency>
    <groupId>org.apache.flink</groupId>
    <artifactId>flink-table-planner_2.11</artifactId>
    <version>1.9.0<version>
  </dependency>

Baron_ND

发布了33 篇原创文章 · 获赞 7 · 访问量 9588

私信关注

Flink的一些学习点

猜你喜欢