flink window

窗口分类可以分成:

1)翻滚窗口(Tumbling Window,无重叠)

2)滚动窗口(Sliding Window,有重叠)

3)会话窗口(Session Window,活动间隙)
窗口可以是时间驱动的(Time Window,例如:每30秒钟),也可以是数据驱动的(Count Window,例如:每一百个元素)。

raw data stream 代表用户的购买行为流,圈中的数字代表该用户本次购买的商品个数,事件是按时间分布的,所以可以看出事件之间是有time gap的。

Flink 提出了三种时间的概念:

1)event time(事件时间:事件发生时的时间)

2)ingestion time(摄取时间:事件进入流处理系统的时间)

3)processing time(处理时间:消息被计算处理的时间)。

Tumbling Time Window

翻滚窗口能将数据流切分成不重叠的窗口,每一个事件只能属于一个窗口。

Sliding Time Window

需要的窗口是不间断的,需要平滑地进行窗口聚合。一个元素可以对应多个窗口。
参考:https://blog.csdn.net/wwwxxdddx/article/details/51706900

猜你喜欢

转载自blog.csdn.net/jz1993/article/details/81985673