01-Apache Flink 中广播状态的实用指南

1 Apache Flink 中广播状态的实用指南

自版本 Flink 1.5.0 以来,Apache Flink 提供了一种新的状态类型,称为广播状态(Broadcast State)。在本文中,将解释什么是广播状态,并通过示例演示如何将广播状态应用在评估基于事件流的动态模式的应用程序,并指导大家学习广播状态的处理步骤和相关源码,以便在今后的实践中能实现此类的应用。

2 什么是广播状态

假设电子商务类型的网站获取了所有用户的操作行为数据作为用户的操作流,网站的运营团队致力于分析用户的操作,来提高销售额,改善用户体验,并监测和预防恶意行为。网站期望实现一个流应用程序,用于检测用户事件流中的模式,但需要避免在每次模式有变化的时候还要修改和重新部署应用程序,因此我们使用另外一个特征流来读取、更新当前特征,接下来我们通过一个实例逐步阐述如何通过 Apache Flink 中的广播状态来完成相应工作。
在这里插入图片描述
实例的程序获取两个数据流,第一个流提供了网站上的用户操作行为数据,如上图左上方所示,一个用户的交互事件由操作的类型(用户登录、用户注销、添加到购物车或者完成付款等)和用户的 ID(按颜色编码的)组成。

猜你喜欢

转载自blog.csdn.net/weixin_45098163/article/details/121605634