大数据学习(十八)spark部署 - 代码天地

大数据学习(十八)spark部署

其他 2020-02-10 13:40:16 阅读次数: 0

前期准备

终于到了spark了，前面我说过了hadoop中的Mapreduce计算框架有比较明显的短板。接下来我将用一些blog分享spark方面的一些我觉得重要的东西。

这次我们要安装spark
所以你的服务器上后者虚拟机上需要有以下环境

JDK
配置SSH免密

当然为了能更方便还是建议大家在host文件中配置一下主机名和Ip的映射。

伪分布模式部署

首先我们下载spark的tar包，大家到官网就可以找到，然后上传到服务器上。

这里我也放在网盘上了
链接：https://pan.baidu.com/s/1_avLEAVL_Rlm4OaFf61kew
提取码：aahf
2. 解压。

解压之后进入spark的根目录。

接下来就要敲黑板划重点了：

修改conf文件目录下的配置文件

首先将spark-env.sh.template 修改名字为spark-env.sh
vi 进入

配置JAVA路径
export JAVA_HOME=你的JDK路径
配置主节点名称（伪分布就是当前操作的主机名）
export SPARK_MASTER_HOST=主机名
export SPARK_MASTER_PORT=7077
配置slaves，首先将slaves.template 改名字为slaves
配置从节点主机名
例如：node1(这是我的主机名)
启动
进入sbin目录，
./start-all.sh 启动spark伪分布模式

注：可以从web dashBoard上查看，输入IP:8080,就可以查看。

停止的话使用stop-all.sh命令。

注：
spark有几种运行模式，这里我配置的是standalone，其他的模式后面我再做分享

全分布模型部署

其实全分布和伪分布部署的差别并不大，首先，我们将上面得到的spark目录全部拷贝到另外两个服务器或者虚拟机，用scp或者其他什么方式。然后修改conf配置：

只需要将slaves修改为slaver节点的主机名，
我配置了一个4台虚拟机的集群所以在slaves中写

node2
node3
node4

然后按照上述的方法启动就可以正常运行了。

发布了42 篇原创文章 · 获赞 46 · 访问量 6629

私信关注

猜你喜欢

转载自blog.csdn.net/qq_40742298/article/details/104227980

大数据学习(十八)spark部署

spark大数据的学习

大数据学习之spark

大数据学习——spark笔记

大数据Hadoop，spark学习

学习笔记:从0开始学习大数据-12. spark安装部署

centos部署单机spark大数据环境（二）--【安装spark】

大数据学习笔记——Spark完全分布式完整部署教程

大数据学习（09）--spark学习

Spark大数据学习资源汇总

大数据学习之SPARK计算天下

大数据框架学习：从 Hadoop 到 Spark

大数据学习笔记5 - Spark

大数据学习——spark运营案例

大数据系列：Spark学习笔记

大数据技术学习代码纪录——Spark

基于Docker搭建大数据集群（四）Spark部署

入门大数据---Spark部署模式与作业提交

大数据——spark安装部署和python环境配置

大数据Flink（五十八）：Flink on Yarn的三种部署方式介绍

大数据学习——平台环境部署（详细）

大数据学习——hive安装部署

大数据学习——Kafka集群部署

【spark实战】大数据部署平台spark扩展新增节点安装文档

大数据Hadoop学习系列之Hadoop、Spark学习路线

大数据学习开发：Spark之数据倾斜调优

大数据---spark

大数据之spark

大数据--spark

Python与Spark大数据

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)