大数据_Flink_Java版_数据处理_Watermark_概念和原理---Flink工作笔记0052

然后我们开始来理解,waterMark的概念,可以看到.

首先,对于正常的数据流,来说可以看到,上面,从右边到左边,是1,2,3,4,5,6...代表

这些数据,是一个个流过来的,理想的情况下,假设,1秒来一个数据,我们时间窗口是5秒的话,

那么数据是,包含开始,不包含结束.所以,这里会把1,2,3,4,放到第一个时间窗口的桶中去.

然后,第二个窗口就会放,5,6,7,8...这样,这个是正常的情况.

 

       但是实际情况一般,数据不会,1,2,3,4,5,6....的这样按照顺序来,比如下面这个视情况的图,可以看到数据的产生顺序是,1,2,3,4,5,6..但是实际上,传输的时候,可以看到是,1,4,5...这样的顺序对吧,4和5先到的,而3,2是后到的对吧.

        我们知道在数据传输中,我们的时间级别,一般都是,毫秒级的,一般都是,数据几十毫秒,多的话,100,200,300毫秒就传输过来了,一般都不会达到秒级对吧.

        我们之前说,比如

扫描二维码关注公众号,回复: 13720290 查看本文章

猜你喜欢

转载自blog.csdn.net/lidew521/article/details/123422777