在windows 7中安装部署spark(python版) - 代码天地

在windows 7中安装部署spark(python版)

其他 2018-11-24 17:09:58 阅读次数: 0

一、搭建的环境

windows7

spark-2.3.2

python-3.6.5

Java8

二、安装部署

1、安装Java/Jdk

下载jdk-8u152-windows-x64.exe，根据安装指南进行安装，配置环境变量JAVA_HOME，在Path中添加%JAVA_HOME%\bin和%JAVA_HOME%\jre\bin，在CLASSPATH中添加%JAVA_HOME%\lib;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar。

配置完成后，在CMD中运行java -version检查是否安装成功。

2、安装Spark

下载spark-2.3.2-bin-hadoop2.7.tgz，http://apache.communilink.net/spark/spark-2.3.2/spark-2.3.2-bin-hadoop2.7.tgz。解压到指定路径，添加环境变量SPARK_HOME到该路径，并在Path中添加%SPARK_HOME%\bin和%SPARK_HOME%\sbin

3、安装Python

下载python-3.6.5-amd64.exe，https://www.python.org/ftp/python/3.6.5/python-3.6.5-amd64.exe。根据安装指南进行安装。安装完成后，在CMD中运行python --version检查安装是否成功。

将spark\python\pyspark整个文件夹复制到Anaconda3\Lib\site-packages文件夹中。

另外，需要在python中安装py4j。

pip install py4j

4、安装Hadoop

根据下载的Spark版本，下载相应版本的hadoop2.7.7，http://mirror-hk.koddos.net/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz 。解压到指定路径，添加环境变量HADOOP_HOME为该路径，并在Path中添加%HADOOP_HOME%\bin。将hadoop.dll，winutils.exe拷贝到%HADOOP_HOME%\bin目录。

ps：可自行在windows7 中编译hadoop源码已得到相应的hadoop.dll，winutils.exe等，具体操作比步骤可参考https://blog.csdn.net/LiuQQu/article/details/83825304。

三、验证

打开IDLE，执行以下命令：

from pyspark import SparkConf, SparkContext
conf = SparkConf().setMaster("local[*]").setAppName("test")
sc = SparkContext(conf=conf)

这时，弹出一个dos窗口。

在IDLE中继续输入：

data = sc.parallelize(range(10))
sum = data.reduce(lambda x, y: x + y)
print(sum)

输出45。

验证成功，按Ctrl+D退出Spark shell。

参考文章：https://blog.csdn.net/hjxinkkl/article/details/57083549

猜你喜欢

转载自blog.csdn.net/LiuQQu/article/details/83859839

在windows 7中安装部署spark(python版)

在windows安装部署spark(python版)

在windows安装部署spark

windows安装pyspark(python版spark)

在Windows 7 中安装部署Mysql

Windows 7环境中Python3.7版本下Pyinstaller的安装

Python pycharm（windows版本）部署spark环境

利用Windows部署服务通过网络，批量安装Windows 7旗舰版

Python安装指南（Windows版）

在windows 7 中安装Cygwin

Windows 10 安装spark

windows下安装spark

Spark-windows安装

windows spark的安装

Windows 安装Spark 环境

RocketMQ部署----Windows版

windows下安装spark-python

Windows7 安装 PyTorch CPU版

ActiveMQ安装部署(Windows)

nginx Windows安装部署

node for windows 安装部署

Nginx安装部署（windows）

PaddleOCR Windows 安装部署

Windows安装部署nginx

Python中安装Xgboost(Windows)

在Windows系统中安装Python

Windows中Anaconda与Python安装

python环境部署（Windows）

maven安装（windows版）

mongdb windows版安装

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)