spark2.1.0安装步骤

其他 2018-05-25 20:34:25 阅读次数: 2

0 机器分配

     IP        host      角色
172.29.41.153  master  Spark master   

172.29.41.154  slave1   Spark slave

172.29.41.155  slave2   Spark slave

1、安装scala

(2.10.6支持java7\java6 2.12.*只支持java8以上)
sudo tar -zxvf scala-2.10.6.tgz -C /usr/local
cd /usr/local
sudo mv scala-2.10.6 scala
sudo chown -R hadoop:hadoop scala

2、验证scala是否安装成功

sudo vi ~/.bashrc
export SCALA_HOME=/usr/local/scala
export PATH = $PATH:$SCALA_HOME/bin
source ~/.bashrc

scala -version

3、解压spark-2.10

sudo tar -zxvf spark-2.1.0-bin-hadoop2.7.tgz -C /usr/local
cd /usr/local
sudo mv sspark-2.1.0-bin-hadoop2.7 spark
sudo chown -R hadoop:hadoop spark

4、配置spark

进入spark目录，拷贝Spark环境模板文件为环境文件：cp conf/spark-env.sh.template conf/spark-env.sh，然后添加如下内容：

export SCALA_HOME=/root/dev/java/scala-2.12.1  
export SPARK_WORKER_MEMORY=1g  
export SPARK_MASTER_IP=your_server_ip  
export MASTER=spark://your_server_ip:7077  
# 如果SSH端口不是缺省的22时加入下面行  
export SPARK_SSH_OPTS="-p 22000"

生成Slave文件：cp conf/slaves.template conf/slaves。在这个文件中加入Worker节点的名称

5、配置spark环境变量

sudo vi ~/.bashrc
export SPARK_HOME=/usr/local/spark
export PATH = $PATH:$SPARK_HOME/bin
source ~/.bashrc

6、发往slave1\slave2

scp -r /usr/local/spark slave1:~
scp -r /usr/local/spark slave2:~

7、启动spark

进入$SPARK_HOME目录，启动Spark：./sbin/start-all.sh

进入到$SPARK_HOME目录，运行求PI的实例：./bin/run-example org.apache.spark.examples.SparkPi

运行spark-shell ./bin/spark-shell

8、spark-shell WordCount

在hdfs下建立文件/sparkTest/aaa 内容如下

进入sparkshell后运行wordcount :
scala> val file=sc.textFile("hdfs://master:9000/sparkTest/aaa")
scala> val count=file.flatMap(line => line.split(" ")).map(word => (word,1)).reduceByKey(_+_)
scala> count.collect()

至此spark环境已经成功安装到了集群

猜你喜欢

转载自blog.csdn.net/phn_csdn/article/details/78001844

spark2.1.0安装步骤

编译spark2.1.0

Spark2.1.0分布式集群安装

spark2.1.0 on yarn with CDH5.8.0 安装实战

Spark2.1.0——Spark初体验

Spark2.1.0——剖析spark-shell

Spark2.1.0之初识Spark

Spark2.1.0——Spark环境更新

Spark2.1.0入门：DStream转换操作

spark2.1.0之配置与源码分析

Spark2.1.0之内置RPC框架

Spark2.1.0之模块设计

Spark2.1.0之基础知识

Spark2.1.0之运行环境准备

Spark2.1.0之初体验

spark2.1.0发布了

Spark2.1.0——WebUI框架体系

Spark2.1.0之剖析spark-shell

Spark2.1.0之代码结构及载入Ecplise方法

spark2.1.0之源码分析——RPC配置TransportConf

Spark2.1.0之模型设计与基本架构

spark2.1.0集群环境搭建

Java Spark2.1.0 读取文本写入MySQL

Spark2.1.0之源码分析——事件总线

Spark2.1.0模型设计与基本架构（下）

spark2.1.0编译 cdh5.7.0版本

Spark2.1.0——Executor动态分配的实现原理

Spark2.1.0事件总线分析——LiveListenerBus详解

Spark2.1.0事件总线分析——ListenerBus的继承体系

spark-2.1.0安装

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)