1.美图
2.概述
2.1 DataStreaming 中的Broadcast
把元素广播给所有的分区,数据会被重复处理 类似于storm中的allGrouping dataStream.broadcast().这里我先介绍下这个broadcast分区。在之前的文章中说道Flink DataSet的hash分区以及range分区。他们都是把数据源分给不同的线程执行。而broadcast分区则是共享同一份数据。每一个线程的数据都是相同的,并且每一个map操作的并不是线程复制的副本,而是共享的变量。
因此下面我先演示下brocast的分区,看下他的分区规则。
2.2 Broadcast分区演示
package org