SparkSQL的介绍第一章 - 代码天地

SparkSQL的介绍第一章

其他 2020-04-19 11:08:32 阅读次数: 0

Spark SQL
Spark SQL官方介绍
●官网
http://spark.apache.org/sql/
Spark SQL是Spark用来处理结构化数据的一个模块。
Spark SQL还提供了多种使用方式，包括DataFrames API和Datasets API。
1、什么是SparkSQL?
用于处理结构化数据的Spark模块。
可以通过DataFrame和DataSet处理数据。
2、SparkSQL特点
1、易整合
可以使用java、scala、python、R等语言的API操作。
2、统一的数据访问
连接到任何数据源的方式相同。
3、兼容Hive
4、标准的数据连接（JDBC/ODBC）
3、SQL优缺点
优点：表达非常清晰，难度低、易学习。
缺点：复杂的业务需要复杂的SQL, 复杂分析,SQL嵌套较多。机器学习较难实现。
4、Hive和SparkSQL
Hive是将SQL转为MapReduce
SparkSQL可以理解成是将SQL解析成’RDD’ + 优化再执行
在这里插入图片描述
5、SparkSQL中的两个抽象
什么RDD？？
弹性分布式数据集。

什么是DataFrame？
DataFrame是一种以RDD为基础的带有Schema元信息的分布式数据集，类似于传统数据库的二维表格。

什么是DataSaet??
含有类型信息的DataFrame就是DataSet
（DataSaet=DataFrame+类型= Schema+RDD*n+类型）
DataSet包含了DataFrame的功能
在这里插入图片描述
RDD、DataFrame、DataSet的区别
结构图解：

RDD[Person]
以Person为类型参数，但不了解其内部结构。
DataFrame
提供了详细的结构信息schema列的名称和类型。这样看起来就像一张表了
DataSet[Person]
不光有schema信息，还有类型信息

发布了238 篇原创文章 · 获赞 429 · 访问量 25万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_45765882/article/details/105560112

SparkSQL的介绍第一章

第一章QTP的介绍

UNP --- 第一章介绍

第一章：Nginx介绍

第一章：介绍

StructuredStreaming的介绍_第一章

第一章 SDN介绍

Nodejs 第一章（介绍）

Mariadb第一章：介绍及安装--小白博客 mariadb（第一章）

第一章

第一章-

Scala --- 第一章入门介绍

第一章：Python语言介绍

第一章:我简单介绍下Kotlin

logback手册-第一章介绍

react入门------第一章react介绍

EOS合约开发第一章-EOS介绍

第一章 Docker介绍与安装

第一章：jmeter 文件目录介绍

精通比特币(第一章)【介绍】

第一章 Linux——系统介绍及环境搭建

第一章 Google软件测试介绍

SpringCloud—— 第一章：微服务架构介绍

火云邪神（第一章）介绍

第一章·MySQL介绍及安装

第一章：kubernetes 功能介绍

Chapter 1. Introduction(第一章：介绍)

水产宝介绍第一章下载与注册

第一章虚拟机的介绍

第一章MySQL介绍及安装

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)