Apache Flink-数据流之上的有状态的计算

官网给出的Flink应用场景图:

1.状态计算。

2.从上图看出的应用场景有?

-----事件驱动式的流处理

-----ETL管道

-----数据分析

3.一般性架构

从架构上来说与一般的流式架构没有太大的不同,任务调度和资源管理可以放在我们熟悉的yarn上进行,flink的特点如下:

所有流式应用场景:事件驱动应用程序,流和批处理分析,数据管道和ETL

正确性保证:"正好一次"状态的一致性,事件-时间处理,复杂的延迟数据处理

多层级的API支持:流式和批处理上的SQL,数据流API和数据集API,处理函数(时间和状态)

操作重点:灵活部署,高可用性设置,保存点

扩展到任何用户场景:横向扩展的架构,支持超大状态的计算,增量的检查点

优秀的性能:低延迟,高吞吐量,内存计算

猜你喜欢

转载自blog.csdn.net/javajxz008/article/details/82972113