使用Spark开发应用程序，并将作业提交到服务器 - 代码天地

使用Spark开发应用程序，并将作业提交到服务器

其他 2018-09-16 02:53:17 阅读次数: 0

1、pycharm编写spark应用程序

由于一些原因在windows上配置未成功（应该是可以配置成功的）、我是在linux上直接使用pycharm，在linux的好处是，环境可能导致的一切问题不复存在

111 新建一个普通python工程

编程环境使用spark使用的python环境

222 配置spark环境

进入下图

添加2个相应属性

PYTHON_PATH为spark安装目录下的python的路径

我的：/home/hadoop/app/spark-2.3.0-bin-2.6.0-cdh5.7.0/python

SPARK_HOMR为spark安装目录

我的：/home/hadoop/app/spark-2.3.0-bin-2.6.0-cdh5.7.0

完成后

导入两个包进入setting

包位置为spark安装目录下python目录下lib里

2、正式编写

创建一个python文件

from pyspark import SparkConf, SparkContext

# 创建SparkConf:设置的是spark的相关信息
conf = SparkConf().setAppName("spark0301").setMaster("local[2]")

# 创建SparkContext
sc = SparkContext(conf=conf)

# 业务逻辑
data = [1, 2, 3, 4, 5]
# 转成RDD
distdata = sc.parallelize(data)
print(distdata.collect())

# 好的习惯
sc.stop()

在linux系统用户家根目录创建一个script

将代码放入spark0301.py中

将appname和master去掉，官网说不要硬编码，会被自动赋值

然后进入spark安装目录下bin目录运行

./spark-submit --master local[2] --name spark0301 /home/hadoop/script/spark0301.py

因为速度太快结束网站是看不到的

猜你喜欢

转载自blog.csdn.net/qq_38723677/article/details/82262231

使用Spark开发应用程序，并将作业提交到服务器

将应用程序提交到spark环境并将结果输出到hdfs

提交Spark应用程序

git push 提交到服务器

应用程序服务器与web服务器

web 服务器，应用程序服务器

.Net开发服务器服务端应用程序 - WebApi后端开发框架

将作业提交到班级博客的一些注意事项

服务器程序和应用程序

从零开发B/S机架应用程序（九）高并发服务器

区分Web服务器、HTTP服务器、应用程序服务器

WEB服务器、应用程序服务器、HTTP服务器区别

Web服务器、HTTP服务器及应用程序服务器的区别？

WEB服务器、应用程序服务器、HTTP服务器的区别

关于jquery的ajax提交到服务器

Form表单提交到Web服务器

git 把本地代码提交到服务器

flink包提交到服务器（本地mac）运行

如何将文件提交到git服务器

git撤销已经提交到远程服务器的commit

本地项目提交到SVN服务器---简单几步

Git 创建分支并且提交到远程服务器

git 无法提交到远程服务器【转载】

本地文件提交到gitlab服务器

Spark提交应用程序之Spark-Submit分析

Spark之——Spark Submit提交应用程序

spark-submit spark应用程序提交和运行

Spark之——Spark Submit提交应用程序详解

使用Payara数据源在Payara服务器下运行Spring Boot应用程序

使用JDK工具进行Java服务器应用程序故障排除

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)