（1）安装----anaconda3下配置pyspark【单机】 - 代码天地

（1）安装----anaconda3下配置pyspark【单机】

其他 2018-10-09 12:07:44 阅读次数: 0

1、确保已经安装jdk和anaconda3。【我安装的jdk为1.8，anaconda的python为3.6】

2、安装spark，到官网 http://spark.apache.org/downloads.html 上下载，我下载的是spark-2.3.1-bin-hadoop2.7.tgz。

　　（1）将上面的压缩包解压在一个文件夹下：注意存放的路径一定不能带空格，我存放在目录下E:\programs2\spark\spark-2.3.1-bin-hadoop2.7，然后将其加入环境变量中。

新建：SPARK_HOME = 'E:\programs2\spark\spark-2.3.1-bin-hadoop2.7'

在Path中添加：

%SPARK_HOME%\bin
%SPARK_HOME%\sbin

（2）配置anaconda的python环境变量：

新建 PYTHONPATH = %SPARK_HOME%\python\lib\py4j-0.10.7-src;%SPARK_HOME%\python\lib\pyspark

（3）将E:\programs2\spark\spark-2.3.1-bin-hadoop2.7\python\pyspark整个文件夹复制到Anaconda3\Lib\site-packages文件夹中。

（4）添加系统环境变量
变量名：PYSPARK_DRIVER_PYTHON；变量值：ipython
变量名：PYSPARK_DRIVER_PYTHON_OPTS；变量值：notebook

3、安装Hadoop

到官网上下载hadoop-2.7.3.tar.gz，然后解压缩在E:\programs2\hadoop\hadoop-2.7.3

并且还需winutils.exe，winutils.pdb等，可在https://github.com/srccodes/hadoop-common-2.2.0-bin下载，然后复制到目录为：E:\programs2\hadoop\hadoop-2.7.3\bin

添加环境变量 HADOOP_HOME = E:\programs2\hadoop\hadoop-2.7.3

在Path中添加：%HADOOP_HOME%\bin;%HADOOP%\sbin

4、确认是否安装成功

当输入命令pyspark出现界面时表明spark安装配置完成了，如果环境变量配置成功的话，直接把jupyter notebook打开。

参考：https://www.e-learn.cn/content/python/786199

猜你喜欢

转载自www.cnblogs.com/Lee-yl/p/9759348.html

（1）安装----anaconda3下配置pyspark【单机】

Anaconda3下XGBoost的安装与配置

ANACONDA3安装与配置

Ubuntu18.04下Anaconda3的安装与配置

python配置-Linux下Anaconda3安装及使用

在Ubuntu下配置Anaconda3

win10下Anaconda3在虚拟环境python_version=3.5.3 中配置pyspark

Anaconda3下安装GraphLab Create

linux下安装Anaconda3

mac下anaconda3安装opencv

mac anaconda3下安装onnx

Centos 7下安装Anaconda3

Ubuntu环境下安装Anaconda3

Windows下安装anaconda3

Redhat 5.6下安装Anaconda3

Anaconda3在Linux下安装

Anaconda3安装与配置教程（2022.11）

安装anaconda3

安装 Anaconda3

Anaconda3安装

Mac下安装anaconda3，配置pytorch环境，安装jupyter

ubuntu16.04下anaconda3的安装和配置，jupyter notebook的简单使用

Mxnet/Gluon，window7，Anaconda3，环境下的配置安装

win10下通过Anaconda3安装tensorflow并配置pycharm （CPU）

【环境配置笔记】windows10 Anaconda3 Tensorflow环境下安装facenet

Linux下anaconda3、tensorflow-cpu、tensorflow-gpu安装配置

Ubuntu 下安装安装 Anaconda3 与Keras

Anaconda3下载及环境配置

PyCharm配置Anaconda3

vscode配置anaconda3

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)