基于Docker搭建大数据集群（四）Spark部署 - 代码天地

基于Docker搭建大数据集群（四）Spark部署

其他 2019-09-30 12:14:31 阅读次数: 0

主要内容

spark部署

前提

zookeeper正常使用
JAVA_HOME环境变量
HADOOP_HOME环境变量

安装包

微云下载 | tar包目录下

Spark2.4.4

一、环境准备

上传到docker镜像

docker cp spark-2.4.4-bin-hadoop2.7.tar.gz cluster-master:/root/tar

解压

tar xivf spark-2.4.4-bin-hadoop2.7.tar.gz -C /opt/hadoop

二、配置文件

spark-env.sh

SPARK_LOCAL_DIRS=/opt/spark/spark-2.4.4-bin-hadoop2.7
HADOOP_CONF_DIR=/opt/hadoop/hadoop-2.7.7/etc/hadoop
YARN_CONF_DIR=/opt/hadoop/hadoop-2.7.7/etc/hadoop
JAVA_HOME=/opt/jdk/jdk1.8.0_221
export SPARK_MASTER_IP=cluster-master
export SPARK_DAEMON_JAVA_OPTS="
-Dspark.deploy.recoveryMode=ZOOKEEPER
-Dspark.deploy.zookeeper.url=172.15.0.2:2181
-Dspark.deploy.zookeeper.dir=/sparkmaster"

slaves

cluster-slave1
cluster-slave2
cluster-slave3

spark-default.conf

spark.eventLog.enabled          true
spark.eventLog.dir              hdfs://jinbill/spark/eventLog
spark.history.fs.logDirectory   hdfs://jinbill/spark/eventLog
spark.eventLog.compress         true

三、启动

start-all.sh

四、UI界面

因为网段不同，所以得加路由才能访问

打开cmd，需要管理员权限
route add 172.15.0.0 mask 255.255.0.0 192.168.11.38 -p

Spark Master 访问地址
 Spark Slave1 访问地址
 Spark Slave2 访问地址
 Spark Slave3 访问地址
 Spark 历史任务访问地址

猜你喜欢

转载自www.cnblogs.com/njpkhuan/p/11611951.html

基于Docker搭建大数据集群（四）Spark部署

基于Docker搭建大数据集群（一）Docker环境部署

基于Docker搭建大数据集群（七）Hbase部署

基于Docker搭建大数据集群（三）Hadoop部署

基于Docker搭建大数据集群（五）Mlsql部署

基于Docker搭建大数据集群（六）Hive搭建

大数据：spark集群搭建

基于Docker搭建大数据集群（二）基础组件配置

大数据系列 : Spark集群环境搭建

大数据集群搭建（3）spark

实战：大数据Spark简介与docker-compose搭建独立集群

大数据笔记（四）：Hadoop 2.7.7+Scala+Spark 完全分布式集群搭建

Docker搭建Spark集群

基于大数据平台的毕业设计01：基于Docker的HDP集群搭建

大数据集群搭建：安装部署MySQL、SQL Server、Zookeeper、Hadoop、Spark、Flink、Kafka、Kettle、Airflow集群

大数据Hadoop集群环境搭建（四）

大数据入门（四）Hadoop集群搭建

基于docker搭建hadoop+spark+hive+hbase集群的过程

大数据处理 | Spark集群搭建及基本使用

大数据Doris（三十三）：Spark集群搭建

Docker 学习笔记 - 基于实例项目的集群部署（五）Docker搭建MySQL集群 | PXC集群

在Docker中搭建Spark集群

大数据集群部署

用docker搭建Hadoop/Spark/HDFS大数据环境

基于Hadoop的Spark集群搭建

搭建spark集群以及spark HA部署

大数据集群搭建

利用Docker搭建大数据处理集群

【大数据实战】Docker中Hadoop集群搭建

基于Docker部署Zookeeper集群

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)