Apache Flink 概览 - 有状态的流式计算

 

Flink的主要特性如下:

 

一、所有的流式使用用例

 

  • 事件驱动的应用
  • 流式 & 批量分析
  • 数据 Pipelines & ETL

二、保证正确性

  • 严格一次(Exactly-once) 状态一致性
  • 基于消息时间(Event-time)的 处理
  • 复杂的后期数据处理(Sophisticated late data handling)

三、分层的API

  • 基于流和批量数据的SQL
  • DataStream API 和 DataSet API
  • 基于时间和状态的处理函数

四、操作重点(Operational Focus)

  • 灵活的部署
  • 高可用的设置
  • 保存点(SavePoint)

五、扩展至任何用例

  • 横向扩展的架构(Scale-out architecture)
  • 支持大量的状态
  • 增量的checkpointing

六、卓越的性能

  • 低延时
  • 高吞吐
  • 基于内存的计算

笔者水平有限,有些地方如有翻译不适,尽请指出。

如想对flink特性了解更多,请参考:http://flink.apache.org/

打个广告,个人网站:http://www.leaderanking.com/

猜你喜欢

转载自1358440610-qq-com.iteye.com/blog/2426089