如何在Jupyter里以不同的运行模式使用Pyspark - 代码天地

如何在Jupyter里以不同的运行模式使用Pyspark

其他 2018-04-28 15:14:40 阅读次数: 4

假设你的环境已经安装好了以下东西,如何详细的安装它们不在本文的讨论范围之内
具体的可疑参考三分钟搞定jupyter和pyspark整合

anaconda
findspark
pyspark

如何以不同的模式运行pyspark

我们都知道,spark是分为local,standalone,yarn-client,yarn-cluster等运行模式的.既然想用jupyter,自然是想要交互式的,那么如何以不同的模式来交互呢?

笔者总结如下:

local模式

import findspark
findspark.init()
from pyspark import SparkContext
sc = SparkContext("local", "First App")

2.standalone
需要传入地址和端口

import findspark
findspark.init()
from pyspark import SparkContext
sc = SparkContext("spark://192.168.5.129:7077", "First App")

3.yarn-client

import findspark
findspark.init()
from pyspark import SparkContext
sc = SparkContext("yarn-client", "First App")

3.yarn-cluster
cluster模式一般都是开发完成后,直接用来执行用的,不适用于交互模式,笔者也没有尝试过.在此就不介绍了.

关于SparkContext

其实SparkContext这个类,每个位置可以传的参数,是和shell命令行对应的,注意到了这一点,看看文档就知道每个参数可以接受什么样的值了.具体内容可以看spark官方文档.

猜你喜欢

转载自www.cnblogs.com/yuuken/p/8967767.html

如何在Jupyter里以不同的运行模式使用Pyspark

如何在Windows上的Jupyter Notebook中安装和运行PySpark

如何在rancher上运行jupyter notebook

如何在Jupyter Notebook里添加R核的详细步骤

如何在pycharm中使用jupyter

如何在Pychram中使用Jupyter notebooks

如何在jupyter上运行conda的虚拟环境

如何在pyspark里引用上传到hdfs上的文件

0485-如何在代码中指定PySpark的Python运行环境

如何在jsp页面里使用vue

centos7jupyter-notebook 使用pyspark

使用Jupyter Notebook 加速PySpark开发

如何在pycharm中使用jupyter（丘比特）（￥23）

如何在Jupyter Notebook中使用Python虚拟环境？

如何在不同的 IP 地址上运行多个 Docker 容器

如何运行jupyter notebook？

jupyter notebook远程连接服务器运行pyspark

[译] 如何在远程服务器上运行 Jupyter Notebooks

在 Pycharm 里使用 Jupyter Notebook

如何在debug模式下运行maven项目?

如何在无头模式下运行WebDriver？

如何在无头模式下运行WebDriver ？

【Vim模式】如何在jupyter notebook中将 jj 映射到 Esc

如何在svn里使用vss的share功能：svn:external

如何在 Linux 里使用 nmcli 添加网桥

如何在CRM WebClient UI里使用HANA Live Report

如何在maven里配置使用本地修改的代码

如何在SAP Fiori应用里使用React component

如何在powershell里快乐地使用中文

vue 如何在 style 标签里使用变量（数据）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)