CentOS7安装CDH 第十章:CDH中安装Spark2

相关文章链接

1. CDH官网Spark2的安装教程网址

https://www.cloudera.com/documentation/spark2/latest/topics/spark2_installing.html

2. 下载对应的Spark2版本

1.查看CDH和Spark的对应版本列表(点击上述图片2中的地址即可跳转),在这里选择安装Spark的2.2和cloudera1版本,请注意,当前面选择cloudera1.jar时,后面对应的Parcel包也要选择cloudera1,不然会出错,特别是在版本升级方面,要格外注意,不要后面的Parcel包升级了,前面的cloudera.jar包就没升,会出问题:

查看网址:https://www.cloudera.com/documentation/spark2/latest/topics/spark2_packaging.html#packaging

2.下载Spark2对应的Parcel包(以Spark2.2和cloudera1举例):

下载网址:http://archive.cloudera.com/spark2/parcels/2.2.0.cloudera1/

3. 安装Spark2服务到CDH中

1、Spark2服务对其他服务有版本依赖要求:

查看网址:https://www.cloudera.com/documentation/spark2/latest/topics/spark2_requirements.html#cm_versions

2、给集群上所有节点的机器安装Scala2.11版本:

a) 执行如下命令,在所有机器上创建目录:

  mkdir -p /opt/software

b) 将scala-2.11.8.tgz包上传到所有机器上:

  

c) 执行如下命令,解压所有机器上的scala包:

  tar -zxvf scala-2.11.8.tgz

d) 执行如下命令,配置好Scala的环境变量,当能查看到版本时即可:

  echo "export SCALA_HOME=/opt/software/scala-2.11.8" >> /etc/profile

  echo "export PATH=$SCALA_HOME/bin:$PATH" >> /etc/profile

  source /etc/profile

  

3、将下载好的jar包和Parcel包上传到一台机器上,并配置好https:

4、使用下载好的jar包,给CDH上添加服务中加入一个添加Spark2的按钮:

a) 将下载好的jar包复制到CDH默认的csd目录下,并赋予好权限:

  

  

b) 重启CDH的server服务:service cloudera-scm-server restart

c) 进入到CDH的web界面,刷新界面,重新更新配置文件,重启CMS:

  

d) 此时点击cluster的添加服务,能看到Spark2的服务了:

  

5、配置Parcel,将Spark2的离线地址添加到Parcel的URL中:

a) 因为重启CDH的server服务,所以有很多默认的URL,将这些删除:

  

b) 将Spark2的离线地址添加进入:

  

6、对Spark2进行下载,分配,解压,激活:

  

7、安装Spark2服务:

a) 点击cluster的添加服务,添加spark2服务:

  

b) 因为安装了其他服务,Spark是一个内存计算服务,所以可以依赖其他服务,可以选择多服务的那一组,如下图:

  

c) 给Spark中的服务选择主机(history选一台,Gateway所有主机都要选):

  

d) 对Spark2服务进行审核更改,清空配置即可:

  

e) 对Spark2进行安装:

  

f) 完成安装:

  

猜你喜欢

转载自www.cnblogs.com/yangshibiao/p/10869558.html