Spark九读取和保存数据之Spark SQL的结构化数据，数据库和键值对存储

其他 2018-07-05 18:06:54 阅读次数: 0

Spark SQL操作结构化和半结构化数据

读取数据 对数据源执行SQL查询，返回Row对象组成的RDD，每个Row对象是一条记录，记录访问基于下标，每个Row都有一个get()方法

1 Apache Hive

> Hadoop的结构化数据源

> Spark中复制hive-site.xml，创建HiveContext对象，使用HiveQL查询表

2 JSON

> 半结构化数据

> 不需要hive-site.xml，先创建HiveContext对象，调用HiveContext.jsonFile方法从整个文件中获取由Row对象组成的RDD

数据库

1 JDBC

> org.apache.spark.rdd.JdbcRDD

2 Cassandra

> 未支持Spark SQL

> 使用DataStax的Cassandra连接器

3 HBase

> org.apache.hadoop.hbase.io.ImmutableBytesWritable

> org.apache.hadoop.hbase.client.Result

4 Elasticsearch

> Elasticsearch是开源的，基于Lucene的搜索系统

> 使用Elasticsearch-Hadoop读写数据

> 依赖SparkContext的配置项

猜你喜欢

转载自blog.csdn.net/weixin_42129080/article/details/80920082

Spark九读取和保存数据之Spark SQL的结构化数据，数据库和键值对存储

Spark—数据读取和保存

spark sql 读取数据库并保存

Spark——数据读取与保存

Spark SQL是处理结构化的数据

Spark读取结构化数据

Spark（五）数据读取与保存

Spark SQL数据的读取和存储

Spark学习之使用Spark SQL读取数据库

Spark八读取和保存数据之文件格式与文件系统

Spark学习之数据读取与保存总结(二)

Spark之【数据读取与保存】详细说明

Spark（九）————数据倾斜解决

Spark 数据的加载和保存

【大数据】Spark数据读取与保存

九、Spark模块和安装

Spark-数据读取与保存（Scala版）

Spark优化(九)：优化数据结构

Spark使用Java读取mysql数据和保存数据到mysql

Spark 系列（九）—— Spark SQL 之 Structured API

spark sql 读取hbase中数据保存到hive

Spark SQL加载数据和保存数据通用方式

spark DataFrame 读写和保存数据

Spark Core快速入门系列(11) | 文件中数据的读取和保存

spark学习记录（九、MasterHA和Spark shuffle）

跟我一起学Spark之——数据读取与保存

元数据与数据治理｜Spark SQL结构化数据分析（第六篇）

spark读取数据库数据

Spark之读取Hbase数据库表并写入文件

Spark---WC---Spark从外部读取数据之textFile

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

Spark九 读取和保存数据之Spark SQL的结构化数据，数据库和键值对存储

猜你喜欢

Spark九读取和保存数据之Spark SQL的结构化数据，数据库和键值对存储