Spark的Standalone HA模式的环境搭建 - 代码天地

Spark的Standalone HA模式的环境搭建

其他 2021-01-22 13:33:20 阅读次数: 0

简介: Spark Standalone集群是Master-Slaves架构的集群模式，和大部分的Master-Slaves结构集群一样，存在着Master单点故障（SPOF)的问题。

StandaloneHA的模式: 本质是基于ZK做一个leader的选举

- 搭建过程: 基于前面的Standalone模式做一些配置文件的修改就行了

在node01上配置：

vim /export/server/spark/conf/spark-env.sh
注释或删除MASTER_HOST内容：
# SPARK_MASTER_HOST=node1

增加如下配置
SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=node1:2181,node2:2181,node3:2181 -Dspark.deploy.zookeeper.dir=/spark-ha"
参数含义说明：
spark.deploy.recoveryMode：恢复模式
spark.deploy.zookeeper.url：ZooKeeper的Server地址
spark.deploy.zookeeper.dir：保存集群元数据信息的文件、目录。包括Worker、Driver、Application信息。

将spark-env.sh分发集群

cd /export/server/spark/conf
scp -r spark-env.sh root@node2:$PWD
scp -r spark-env.sh root@node3:$PWD

启动集群服务
启动ZOOKEEPER服务

zkServer.sh status
zkServer.sh stop
zkServer.sh start


node1上启动Spark集群执行
/export/server/spark/sbin/start-all.sh


在node2上再单独只起个master:
/export/server/spark/sbin/start-master.sh

查看WebUI
http://node1:8080/
http://node2:8080/

在这里插入图片描述

完成搭建

测试:

使用SparkShell交互式命令行

bin/spark-shell --master spark://node1:7077,node2:7077

在这里插入图片描述

wordcount测试:

sc.textFile("hdfs://node1:8020/wordcount/input/words.txt").flatMap(x=>x.split("\\s+")).map(x=>(x,1)).reduceByKey((a,b)=>a+b).collect

圆周率测试:

bin/spark-submit \
--master spark://node1:7077,node2:7077 \
--class org.apache.spark.examples.SparkPi \
/export/server/spark/examples/jars/spark-examples_2.11-2.4.5.jar \
10

在这里插入图片描述

验证HA模式:

在这里插入图片描述
效果 :

这里注意官网说的需要1-2min才可以从备用变成Alive状态
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/m0_49834705/article/details/112520543

Spark的Standalone HA模式的环境搭建

Spark环境搭建③ standalone-HA高可用模式

Spark的Standalone模式之HA集群搭建

Spark环境搭建之Standalone-HA

Spark 环境 Standalone 模式

Spark快速入门系列(6) | Spark环境搭建—standalone(3) 配置HA高可用模式

【Spark七十】Spark Standalone HA

Spark环境搭建之——standalone集群模式

Spark环境搭建② standalone集群模式

Spark Standalone单机模式环境搭建

Spark的Standalone模式部署

Spark Standalone模式部署

Spark的Standalone模式

Spark（5）——standalone模式

Spark的Standalone模式及案例

安装standalone模式的spark

spark在不同环境下的搭建|安装|local|standalone|yarn|HA|

spark集群搭建，standalone

Spark Standalone HA（高可用）模式

Spark Standalone Mode配置HA

Spark本地模式与Spark Standalone伪分布模式 Spark Standalone

Spark Standalone和Spark on Yarn环境的搭建

Spark环境搭建——HA高可用模式

spark standalone模式 zeppelin安装

spark standalone模式运行报错

Spark 2.4.0 standalone 模式安装

spark Standalone集群模式配置

spark运行模式之 ===> Standalone

spark standalone&&yarn模式

Apache Spark standalone集群模式

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)