以yarn client和分布式集群方式运行spark-2.3.2-bin-hadoop2.6 - 代码天地

以yarn client和分布式集群方式运行spark-2.3.2-bin-hadoop2.6

其他 2018-10-19 20:33:24 阅读次数: 0

一以分布式集群运行

修改配置文件/hadoop_opt/spark-2.3.2-bin-hadoop2.6/conf/spark-env.sh

export HADOOP_CONF_DIR=/hadoop_opt/hadoop-2.6.1/etc/hadoop
export JAVA_HOME=/hadoop_opt/jdk1.8.0_181
export HADOOP_HOME=/hadoop_opt/hadoop-2.6.1
export SCALA_HOME=/hadoop_opt/scala-2.12.7
export SPARK_MASTER_IP=192.168.197.128

修改/hadoop_opt/spark-2.3.2-bin-hadoop2.6/conf/slaves，在最后加入如下代码

master
slave1
slave2

2.slave执行和master相同的操作,登陆master执行向slave分发操作

scp -r /hadoop_opt/spark root@slave1 /hadoop_opt
scp -r /hadoop_opt/spark root@slave2 /hadoop_opt

3.在master终端输入
进入spark安装目录的sbin文件夹下，先启动master,再启动slaves

[root@master sbin]# ./start-master.sh
[root@master sbin]# ./start-slaves.sh

使用jps分别查看master和slave的进程

[root@master sbin]# jps
4786 Master
4850 Jps
3527 ResourceManager
3181 NameNode
3374 SecondaryNameNode

[root@slave1 hadoop01]# jps
1904 NodeManager
2421 Worker
3470 Jps

4.在浏览器中输入http://master:8080
在这里插入图片描述

二以yarn client运行

1.master 终端输入
spark-shell --master yarn-client即可，最后出现如下截图
在这里插入图片描述
注：输入命令spark-shell --master yarn --deploy-mode client也可

sprk的配置是按照分布式集群方式配置的，但是在这种方式配置下这两种方式都可以运行。
网上的配置方法有点把我绕晕了，有的没有安装hadoop就配置spark集群了，有的却需要安装hadoop。真是被搞晕了。

猜你喜欢

转载自blog.csdn.net/weixin_37353303/article/details/83065383

以yarn client和分布式集群方式运行spark-2.3.2-bin-hadoop2.6

Yarn on cluster 与 Yarn on client

yarn spark

Spark On Yarn

hadoop YARN

hadoop：yarn

Hadoop ---- YARN

hadoop的yarn

Hadoop| YARN

Hadoop（）Yarn

Hadoop - YARN

yarn cluster 与yarn client区别

【yarn】 yarn的安装和使用

Hadoop 分布式配置及Spark on yarn部署

Spark Yarn-cluster与Yarn-client

Spark On Yarn完全分布式搭建

【Hadoop】YARN 完全分布式配置

Yarn简单分布式集群搭建

spark-hadoop-yarn

Hadoop分布式物理机集群搭建（hdfs和yarn）版本：hadoop-3.3.0

搭建spark on yarn 集群

spark on yarn 集群搭建

Spark on Yarn的运行原理

Spark On Yarn 运行模式

Spark 在YARN上运行

yarn伪分布式

Hadoop（第二天，yarn上运行伪分布式，完全分布式集群的部署）

Spark yarn执行方式

spark on yarn 停止方式

Spark on Yarn和MapReduce on Yarn区别

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)