Superset连接Spark-SQL

移动开发 2023-08-02 06:41:50 阅读次数: 0

尝试使用superset连接spark-sql，superset官方文档只提到使用推荐使用pyhive，但是怎么连接，并没有详细说明，经过研究superset issues，结合自己的经验推测尝试，成功实现连接。

由于网上资料较少，在此记录，以做备忘，同时希望能够帮助遇到同样问题的道友。

连接方法

1、首先启动spark的thrift服务

2、superset连接spark-sql，SQLALCHEMY URI填写格式如下：

hive://<spark-master-host>:10000/iceberg

spark-master-host可以从spark web ui查看。

iceberg是spark catalog名称，如果不指定，默认为default。

问题

这种方式连接上spark-sql后，superset的sqllab可以正常通过spark查询数据，也可以正常显示数据库列表，但是无法正常显示数据表列表。

这是因为spark-sql展示数据表列表时，会显示两列，第一列是数据表所在的数据库的名称，第二列才是数据表名称，而pyhive默认选择第一列数据返回，所以在superset中，数据表列表显示不正确。

这个问题是pyhive的问题，因为pyhive不直接支持spark-sql。

如果想解决这个问题，这里提供三种思路：

1、修改pyhive，在hive方言中增加返回数据的判断，如果展示数据有两列，则返回第二列。

这里提供pyhive一个发布版的代码位置：pyhive v0.6.3 代码位置

最新版本，代码或有变动。

2、修改pyhive，增加spark方言。

3、使用hive外部表。

这里第三种思路是使用hive外部表，是因为我的使用场景是数据湖场景，架构是spark+iceberg，这时可以在hive中创建iceberg的外部表，然后superset通过hive查询iceberg的数据。

猜你喜欢

转载自blog.csdn.net/xwd127429/article/details/118995202

Superset连接Spark-SQL

spark-sql应用

Spark-SQL简介

spark-sql

spark-sql剖析

spark-sql实践

spark-SQL理论

Spark-SQL基础

Spark-SQL高级

Spark-SQL详解

spark-sql执行hivesql

spark-sql 集成 hive

spark-sql配置并优化

spark-sql的进阶案例

Spark-SQL应用解析

spark-sql性能优化

spark-sql相关实践

spark-sql 关联问题

spark-sql的olap函数

Spark(四): Spark-sql 读hbase

【Spark九十四】spark-sql工具的使用

Spark:Spark-sql 读hbase

spark-sql cli 参数及使用

Spark-SQL之DataFrame操作大全

Spark-SQL之DataFrame操作

SPARK-SQL 所有函数

spark-sql与elasticsearch整合&测试

Spark-sql结合hive使用详情

Spark-sql 1.x版

spark-sql的几种创建方式

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)