Linux上Storm集群环境的搭建

一：什么是Storm?

Storm是开源的一个分布式实时计算系统，用于数据的实时分析，持续计算，分布式RPC、在线机器学习、ETL等。例如，在电商购物网站购买商品时，会在网页旁边或者底端看到与自己所需要商品相关的系列商品，这就是使用类似Storm实时计算去做的。Hadoop适用于海量数据的离线数据分析，无法做到实时分析计算。

Storm系统的设计保证了消息能得到快速的处理，使用ZeroMQ作为其底层消息队列。Storm有一个"本地模式"，可以在处理过程中完全模拟Storm集群，可以使我们快速进行开发和单元测试。Storm支持水平扩展，具有高容错性，保证每个消息都会得到处理，而且处理速度很快，在一个小集群中，，每个结点每秒可以处理数以百万计的消息。Storm的部署和运维都很便捷，可以使用任意编程语言来开发应用。

二：Storm环境搭建

1：需要安装的软件

jdk的下载与安装，具体步骤参考https://mp.csdn.net/postedit/84196901这篇博客

zookeeper的下载与安装，具体步骤参考https://mp.csdn.net/postedit/84201320这篇博客

storm安装包的下载

下载地址：http://mirrors.hust.edu.cn/apache/storm/apache-storm-1.2.2/