SparkSql系列--需求01

其他 2018-07-20 16:09:22 阅读次数: 0

一.需求介绍

前些天碰见个需求，摘取其中一小部分，有用户表，医院表，地区表，以医院和日期（天）的维度下，获取总数。

在数据仓库没有搭建好的情况下，从mysql库ode(源数据)，处理完成导入到另一个库中，下面看图示意。

用户与医院是一对多的关系，这个是2B项目，医院分割用户，医院与地区是多对一的关系。

在源数据库处理完数据结果保存到上述表中。

二.技术介绍

Spark SQL是Spark提供的针对结构化数据处理的模块。不同于基本的Spark RDD API，SparkSQL提供的接口提供了更多的关于数据和计算执行的信息。在内部，SparkSQL使用这些额外信息完成额外的优化。这里有几种方式可以和SparkSQL相互操作，包括SQL和Dataset API。计算结果的时候使用相同的执行

实现方法：SparkSql系列--需求02

猜你喜欢

转载自blog.csdn.net/qq_19968255/article/details/80045003

SparkSql系列--需求01

SparkSql系列--需求02

SparkSQL-01

SparkSQL01

Spark系列-SparkSQL实战

SparkSQL快速入门系列（6）

sparksql系列(三) sparksql列操作、窗口函数、join

sparksql系列(四) sparksql 操作数据库

sparksql系列(六) SparkSql中UDF、UDAF、UDTF

sparksql

Spark系列——从零学习SparkSQL编程（上）

Spark系列——从零学习SparkSQL编程（下）

《掌握需求过程》阅读01

《需求工程》阅读笔记01

《软件需求》阅读笔记01

01 博客系统功能需求

Spark之【SparkSQL编程】系列(No4)——《IDEA创建SparkSQL程序》

6大数据实战系列-sparkSql实战

Spark之【SparkSQL编程】系列(No1)——《SparkSession与DataFrame》

sparksql系列(七) Json转Map,多文件生成

《软件需求最佳实践》阅读笔记01

Python与Excel--01需求与安装

【软件需求分析与设计】01 软件过程

01-BBS项目需求分析

《需求工程——软件建模与分析》01

《掌握需求过程》读后感-01

Hibernate系列教程01

算法系列01

Hadoop系列01

Spark报错系列01

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)