Spark集群安装搭建

1.下载Spark

Spark是一个独立的内存计算框架,如果不考虑存储的话,可以完全独立运行,因此这里就只安装Spark集群

Spark下载地址:       http://spark.apache.org/downloads.html

选择好Spark和Hadoop的版本之后就可以下载了,从2.0版本开始,Spark默认使用Scala2.11

2.上传解压

将Spark的压缩包上传到集群的某一台机器上,然后解压缩

3.进行Spark的配置文件的配置

进入到Spark的目录下

cd conf
mv  spark-env.sh.template spark-env.sh
vi spark-env.sh

在该配置文件中添加如下配置

export JAVA_HOME=你的jdk所在目录

配置slaves文件

mv slaves.template slaves
vi slaves

在slaves中添加你的Spark集群子节点机器的主机名或者ip

4.将配置好的Spark传输到集群的其他机器上

使用scp命令,如果集群机器特别多的话,可以使用shell编程来循环自动传输,这里不在详细说明

5.启动Spark

进入到Spark的主目录下

sbin/start-all.sh

使用jps命令可以看出,该Spark集群有一个Master,三个Work

Spark集群的WEBUI界面:             Master所在的主机ip:8080

猜你喜欢

转载自blog.csdn.net/ys_230014/article/details/82973339