大数据系列 : Spark集群环境搭建 - 代码天地

大数据系列 : Spark集群环境搭建

其他 2019-02-16 20:00:59 阅读次数: 0

前言

本文环境基于Hadoop - Yarn平台搭建

Yarn的平台环境默认已经搭建完毕

前置环境

Linux集群 , Java , Zookeeper , Hadoop , Scala , python-pip(pssh)

下载Spark安装包

官网地址 https://spark.apache.org/downloads.html

如果外网下载速度较慢 , 可以找到对应版本号后 , 下载国内源的镜像

镜像地址

清华大学镜像 - https://mirrors.tuna.tsinghua.edu.cn/apache/spark

上海大学镜像 - http://mirrors.shuosc.org/apache/spark/

Spark安装

下载成功

解压缩

修改配置文件

复制并修改spark-env.sh.template

export JAVA_HOME=/root/apps/jdk1.8.0_191
export SCALA_HOME=/root/apps/scala-2.12.8
export HADOOP_HOME=/root/apps/hadoop-2.8.5
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
#export SPARK_MASTER_HOST=hdp-01
#export SPARK_LOCAL_IP=0.0.0.0
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_MEMORY=1024m
export SPARK_WORKER_CORES=1
export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hdp-01:2181,hdp-02:2181,hdp-03:2181,hdp-04:2181 -Dspark.deploy.zookeeper.dir=/root/apps/spark-2.2.2-bin-hadoop2.6"

#export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=hdp-01,hdp-02,hdp-03"

######配置说明#####
#做了spark的HA配置 , 集群主从配置由Zookeeper接管
#Zookeeper会保存spark集群的所有状态信息 , 包括所有的workers、application、driver信息
#保存位置在/spark

复制并修改slaves.template

分发安装包到其它节点 , 视网络状态 , 需要几分钟时间

配置启动环境

分发环境配置

启动Spark

先启动zookeeper集群

再启动HDFS集群

最后启动Spark集群

查看hdp-01

其它节点

到此 , Spark集群的基本环境配置就完成了 , 可以通过浏览器查看集群状态

猜你喜欢

转载自blog.csdn.net/qq_40651717/article/details/85456337

大数据系列 : Spark集群环境搭建

Spark系列-初体验（数据准备篇） Cloudera Manager大数据集群环境搭建

大数据：spark集群搭建

大数据集群环境搭建：Hadoop、Spark、Flink分布式集群环境

6，数据挖掘环境搭建-Spark集群搭建

8.Spark大型电商项目-大数据环境搭建之Spark集群安装

大数据环境搭建 - cdh5.11.1 - spark源码编译及集群搭建

3.Spark大型电商项目-大数据环境搭建之-Hadoop（CDH）集群搭建

大数据集群环境搭建

大数据集群搭建（3）spark

Spark大数据学习笔记_第5篇_kafka集群环境搭建

Spark大数据学习笔记_第2篇_CDH集群环境搭建

Spark大数据学习笔记_第4篇_zookeeper集群环境搭建

Spark大数据学习笔记_第1篇_CentOS集群环境搭建

6.Spark大型电商项目-大数据环境搭建之kafka集群

5.Spark大型电商项目-大数据环境搭建之zookeeper集群

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解

入门大数据---Spark开发环境搭建

Spark系列(一)集群搭建

大数据入门教程系列之Hadoop环境搭建--Hadoop高可用集群搭建配置

大数据Hadoop集群环境搭建（六）

大数据Hadoop集群环境搭建（一）

大数据Hadoop集群环境搭建（五）

大数据Hadoop集群环境搭建（四）

大数据Hadoop集群环境搭建（三）

大数据Hadoop集群环境搭建（二）

大数据集群hadoop环境搭建

hadoop大数据平台集群环境搭建

1 大数据实战系列-spark+hadoop集成环境搭建

大数据学习系列之六 ----- Hadoop+Spark环境搭建

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)