【分布式】流式计算Storm框架

Storm简介:

  Storm起源Twitter开源的一个类似于Hadoop的实时数据处理框架,不过两则还是有区别的,Hadoop是批量处理数据,而Storm处理的是实时的数据流。

Storm应用场景:

  1.推荐系统:实时跟新模型查询并推荐,根据下单或者加入购物车推荐相关商品。

  1.网站统计:实时销量,统计流量(PV,UV)。

  3.监控预警系统,各个金融系统(金融风控,信用卡反欺诈)。

Storm特性:

  1.适用场景非常广泛:实时处理和更新,持续并行化查询,满足大量场景。

  2.可伸缩性高:扩展计算任务,只需要加机器并提高并行度(主要是是使用zookeeper作为中间件保证各个节点通信)。

  3.保证数据无丢失:保证每条消息都会被处理。

  4.系统健壮:集群容易管理,可轮流重启节点。

  5.容错性好:消息处理过程出现异常,会进行重试,这也是各个分布式计算框架具备的一个特性。

  6.语言无关系:客户端可以使用多种语言编写。

猜你喜欢

转载自www.cnblogs.com/songgj/p/10828113.html