SparkSQL读取json文件简单实现（三） - 代码天地

SparkSQL读取json文件简单实现（三）

其他 2018-09-23 03:49:12 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/YaboSun/article/details/80624753

继上面实践了一些简单的读取文件，简单操作了SparkSQL的入口方法，但是要知道之前的方法都是已经过时了的方法，是Spark1.x中使用的，而最新的2.x版本使用SparkSession作为SparkSQL的入口函数
接下来我们通过简单的代码来在集群操作测试

定义

基本的使用格式：

val spark = SparkSession
  .builder()
  .appName("Spark SQL basic example")
  .config("spark.some.config.option", "some-value")
  .getOrCreate()

测试

了解了基本的定义格式，我们接下来还是以之前的json 文件进行测试：
在项目中新建一个SparkSessionApp，注意是新建的scala class 选择object 类型
代码如下：


/**
  * SparkSession的使用
  */
object SparkSessionApp {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder()
      .appName("SparkSessionApp")
      .getOrCreate()
    val people = spark.read.format("json").load("file:///usr/local/spark/examples/src/main/resources/people.json")
    people.show()
    spark.stop()
  }
}

具体的config 参数后面详细介绍，我们先按照官网案例进行简单的输出，运行：
这里写图片描述
出错了，仔细查看错误信息

org.apache.spark.SparkException: A master URL must be set in your configuration

应该是必须指定master
直接在SparkSession 后加上.master(local[2])
再次运行：
这里写图片描述
成功输出！

参考：
http://spark.apache.org/docs/2.1.0/sql-programming-guide.html#starting-point-sparksession

猜你喜欢

转载自blog.csdn.net/YaboSun/article/details/80624753

SparkSQL读取json文件简单实现（三）

SparkSQL读取json文件简单实现（二）

SparkSQL读取json文件简单实现（一）

SparkSql如何读取JSON数据

SparkSQL创建RDD：<1>读取json格式的文件创建DataFrame【Java，Scala纯代码】

java实现json文件的读取和解析

SparkSql如何读取parquet文件数据

Spark/SparkSQL读取Hadoop LZO文件概述

.NetCore 超简单读取Json配置文件

net core 简单读取json配置文件

java简单工具（一）：JSON文件读取和写入

103.android 简单的保存、读取本地json文件

Java Swing实现文件的简单读取

Python读写json文件的简单实现

JS简单实现读入JSON文件

读取json文件

读取与写入json文件

JavaScript读取JSON文件

java读取JSON文件

Python 读取json文件

java——读取JSON文件

pandas读取json文件

SpringBoot JSON文件读取

PHP读取Json文件

python读取json文件

springboot 读取 json 文件

js读取json文件

json 文件打读取

读取json文件参数

json文件保存与读取

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)