Spark Streaming 应用场景

Spark Streaming 应用场景

流ETL:将数据推入下游系统之前对其进行持续的清洗和聚合,这么做通常可以减少最终数据存储中的数据量。

触发器(Triggers):实时检测行为或异常事件,及时触发下游动作,例如当一个设备接近了检测器或者基地,就会触发警报。

数据浓缩:将实时数据与其他数据集连接,可以进行更丰富的分析,例如将实时天气信息与航班信息结合,以建立更好的旅行警报。

复杂会话和持续学习:与实时流相关联的多组事件被持续分析,以更新机器学习模型。例如与在线游戏相关联的用户活动流,允许我们更好地做用户分类。

猜你喜欢

转载自blog.csdn.net/chechelove886/article/details/86600168