spark单机搭建 - 代码天地

spark单机搭建

其他 2018-07-28 16:30:22 阅读次数: 0

说明：单机版的Spark的机器上只需要安装Scala和JDK即可，其他诸如Hadoop、Zookeeper之类的东西可以一概不安装

只需下载如下三个包

1.安装jdk

配置环境变量

vim /etc/profile

路径根据自己的解压路径配置

之后将其生效

source /etc/profile

2安装scala

配置环境变量

同样执行命令source /etc/profile

3,最后安装spark

同样配置环境变量，执行命令使其生效,ps,path中的$PATH必须要加，否则bash脚本失效

那么现在看spark是否能成功启动

cd之spark的bin目录，执行./bin/spark-shell

则进入scala交互环境,则成功启动

写个python脚本测试下

# _*_ coding:utf-8 _*_
from __future__ import print_function

from pyspark.sql import SparkSession
from pyspark.sql import Row

def json_dataset_example(spark):
    sc = spark.sparkContext

    #读取json串
    path = "/home/hadoop/spark-2.2.0-bin-hadoop2.7/mydemo/employees.json"
    peopleDF = spark.read.json(path)

    peopleDF.printSchema()

    peopleDF.createOrReplaceTempView("employees")

    teenagerNamesDF = spark.sql("SELECT name FROM employees WHERE salary BETWEEN 3500 AND 4500")
    teenagerNamesDF.show()

    #直接字符串
    jsonStrings = ['{"name":"Yin","address":{"city":"Columbus","state":"Ohio"}}']
    otherPeopleRDD = sc.parallelize(jsonStrings)
    otherPeople = spark.read.json(otherPeopleRDD)
    otherPeople.show()

if __name__ == "__main__":
    spark = SparkSession \
        .builder \
        .appName("myPeople demo") \
        .getOrCreate()
    json_dataset_example(spark)
    spark.stop()

提交测试脚本

输出

没毛病,收工

猜你喜欢

转载自www.cnblogs.com/zixilonglong/p/9382343.html

spark单机搭建

Hadoop 单机搭建 Spark单机搭建

搭建Spark的单机版集群

Windows 10 下单机 Spark 环境搭建

用eclipse搭建Spark的运行环境(单机)

2 | Window 搭建单机 Hadoop 和Spark

Spark Standalone单机模式环境搭建

10 搭建Hadoop单机环境，使用spark操作Hadoop文件

mac下单机版 kafka + spark + python搭建与实例

Ubuntu系统搭建单机Spark注意事项

【Ubuntu14.04】【Spark】单机版搭建实录

linux上搭建单机版hadoop和spark

Ubuntu 18.04下搭建单机Hadoop和Spark集群环境

macbook 下 spark开发环境搭建（基于idea 和maven）及spark单机写运行jar

【Spark笔记】Windows10 本地搭建单机版Spark开发环境

01_PC单机Spark开发环境搭建_JDK1.8+Spark2.3.1+Hadoop2.7.1

Spark项目之环境搭建（单机）五配置eclipse的scala环境，并创建spark项目

Mac spark 单机部署

spark单机安装

spark 写入单机elasticsearch

一、spark单机安装

mac配置单机spark

Spark 单机环境配置

spark单机环境安装

spark单机模式安装

Hadoop及Spark 单机及分布式集群环境搭建、运行示例。

单机基于Docker搭建Hadoop2.7.1 Spark1.7 高可用集群

在Win7虚拟机下搭建Hadoop2.6.0+Spark1.4.0单机环境

【Windows】【Scala + Spark】【Eclipse】单机开发环境搭建 - 及示例程序

Ubuntu下搭建spark2.4环境（单机版）

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)