Spark Sql之Catalog - 代码天地

Spark Sql之Catalog

其他 2020-05-21 18:54:50 阅读次数: 0

基于版本：Spark 2.2.0
把一些概念搞清楚，Spark轮廓就清晰了。

什么是Catalog，中文翻译目录，那啥叫目录呢？下面是百度百科的解释：
`目录，是指书籍正文前所载的目次，是揭示和报道图书的工具。目录是记录图书的书名、著者、出版与收藏等情况，按照一定的次序编排而成，为反映馆藏、指导阅读、检索图书的工具。

简单说，目录是检索工具，那么Catalog就是Spark的检索工具。

我们从它实现的主要功能入手看一下：

获取SparkSession可见的数据库、表和函数（不可见就抛出异常）；
给定数据库名、表名和函数名，提供get函数获取这些实体的信息；
列举方法，包括列举可见的数据库，数据库中的表和函数；
判断数据库、表或者函数是否存在；
缓存/去缓存表数据、刷新数据库、表的内存meta信息；
创建外部表（createExternalTable）。

从上面实现的功能看，Catalog其实是Spark了解session级别可见实体（数据库、表和函数）的一个入口，在它的具体实现CatalogImpl中还包括了创建一个新数据库、表和函数的功能。

总结下就是：Catalog围绕数据库、表和函数三种实体，提供创建、检索、缓存数据和删除的功能。

猜你喜欢

转载自www.cnblogs.com/itboys/p/12932555.html

Spark Sql之Catalog

spark SQL之Catalog API使用

Spark SQL之Catalog API介绍和使用

Spark之spark.sql

Spark学习之Spark SQL

spark笔记之Spark SQL

Spark SQL 之 Join

spark笔记-spark sql

Spark SQL之延伸Hive On Spark

Spark SQL

Spark SQL之 Dataframe/Dataset

Spark SQL 之 Join 实现

Spark SQL之Join优化

Spark SQL之性能优化

Hive on Spark 与Spark SQL比较

Spark基础：（六）Spark SQL

Spark 04 Spark SQL 使用

Spark 03 Spark SQL 概述

spark基础六 spark SQL

Spark-Spark SQL and DataFrame

Spark SQL与Hive on Spark的比较

Spark学习笔记：Spark SQL

Spark -- Spark SQL初体验

【Spark】Spark Web UI - SQL

[Spark][spark_streaming]#5_spark_streaming&spark_sql

Spark学习之Spark Core

Spark学习之Spark Streaming

Spark学习之Spark Shuffle

Spark学习之Spark内核

spark之spark本地运行

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)