spark2.x-pyspark-windows环境搭建 - 代码天地

spark2.x-pyspark-windows环境搭建

其他 2018-05-08 23:00:00 阅读次数: 3

pyspark开发指南

1、pyspark 本地开发环境搭建
python版本最好与集群环境一致，我这里是 python 3.5.2
参考资料即可

http://blog.csdn.net/funfun0/article/details/77802590

注意:
windows 64位的Java安装在C:\Program Files\下，导致最终的PATH中包含了空格，
需将环境变量中的JAVA_HOME改成C:\progra~1\Java\jdk1.8.0_60 或者 “C:\Program Files”\Java\jdk1.8.0_60。
2、pyspark 任务提交
演示：以日起始里程统计作业为例，环境为研发环境

a、开发：
见StartStopMileage.py

b、提交：
spark任务提交脚本
sh StartStopMileage-dev.sh 20171120

#!/bin/bash

 /usr/local/spark/bin/spark-submit \
   --master yarn \ #指定资源管理器
   --deploy-mode client \ #指定提交模式
   --executor-memory 2G \ #指定executor内存大小
   --num-executors 10 \ #指定executor个数
   --executor-cores 2 \ #指定executor虚拟CPU核数
   --driver-memory 2G \ #指定driver内存大小
   --queue spark \ #指定资源队列
  /home/hadoop/StartStopMileage.py \ #指定运行的python脚本
   dev  \  #python
   $1

c、运行:

如果程序有错误，中间会报异常

d、spark web-ui监控

e、结果
生成hdfs 文件，说明运行成功！

3、交互式命令行
进入spark 安装目录
执行./bin/pyspark
进入pyspark命令行

内置加载了几个对象，不用声明可直接使用

spark = SparkSession.builder\
    .enableHiveSupport()\
    .getOrCreate()

sc = spark.sparkContext
sql = spark.sql

sqlContext = spark._wrapped
sqlCtx = sqlContext

演示：读取hdfs 文件

spark.read.parquet("/spark/vehicle/data/realinfo/year=2017/month=11/day=02").show



 sc.textFile("/tmp/zyt/StartStopMileage440004").take(1)

猜你喜欢

转载自blog.csdn.net/qq_16038125/article/details/79004776

spark2.x-pyspark-windows环境搭建

pyspark：连接spark集群Windows环境搭建

pyspark系列--pyspark2.x环境搭建

spark2.x-pyspark-集群环境搭建(centos6_python3)

Spark2.x学习笔记：6、在Windows平台下搭建Spark开发环境（Intellij IDEA）

spark2.3在Windows10当中来搭建python3的使用环境pyspark

PySpark+Windows开发环境的搭建

Spark在Windows下的环境搭建

windows下搭建spark环境

nexus2.x搭建maven私服教程（windows环境）

cocos2d-x Windows 环境搭建

spark (2)spark开发环境搭建

Windows下搭建spark源码阅读环境

windows下spark开发环境搭建

最全SPARK环境（集群、windows、linux）的搭建

Windows本地搭建Spark开发环境

Windows下搭建scala+spark环境

Windows 10 下单机 Spark 环境搭建

ubuntu + pyspark 开发环境搭建

window7下在pycharm上配置pyspark 搭建spark测试环境

PyCharm搭建Spark开发环境 + 第一个pyspark程序

一文速学-PySpark数据分析基础：Spark本地环境部署搭建

windows安装pyspark(python版spark)

Spark的这些事<一>——Windows下spark开发环境搭建

Spark学习笔记--Spark在Windows下的环境搭建（转）

Spark学习笔记--Spark在Windows下的环境搭建

spark开发环境——本地安装spark2.x及启动

cocos2d-x游戏开发系列教程-搭建cocos2d-x的windows开发环境

Cocos2d-x学习之windows 7 android环境搭建

Windows2008 R2 X64 PHP环境搭建步骤

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)