EMR上如何进行流式SQL调试 - 代码天地

EMR上如何进行流式SQL调试

编程语言 2019-09-29 14:01:38 阅读次数: 0

1.前言

从EMR-3.21.0版本开始，EMR正式发布了Spark Streaming SQL功能，支持使用Spark SQL进行流式数据处理。经过两个版本的迭代，不少用户反馈当使用SQL进行流式作业开发时，查询结果正确性的调试过程比较麻烦。当前，我们需要完成用户真实的数据流开发，才能在结果存储系统中查看结果是否正确。有些数据存储系统又不方便查看，例如Kafka。这里简单罗列几点不便于调试的问题：

无法在控制台输出中直观看到SQL的执行结果，传统的需要在输出存储系统查看。
数据是变化的：包括输入数据和输出结果都是不断变化的，无法方便看到每个批次的执行结果。
每个批次执行的metrics也不方便查看，传统的需要在日志中查找。

除此外，还有一些高级功能也可以考虑到调试工具中，例如：

脱离真实数据源的数据模拟功能。
数据采样功能。

本文将介绍EMR提

猜你喜欢

转载自yq.aliyun.com/articles/719714

EMR上如何进行流式SQL调试

如何进行调试文档

如何进行SQL排序

sql如何进行优化

Vue学习之如何进行调试

如何进行真机调试

vs下如何进行远程调试

IDEA如何进行debug调试

ASP.NET 网站部署到IIS上如何进行调试

使用Spark SQL进行流式机器学习计算（上）

解决方案：如何在 Amazon EMR Serverless 上执行纯 SQL 文件？

Editplus如何进行JAVA程序编译调试

12.Vue - 如何进行 Vue 调试

VS2010如何进行程序调试

华为手机如何进行ADB调试

Android Studio如何进行真机调试

加药装置是如何进行安装和调试呢？

如何进行远程adb真机调试？

苹果 Mac 上如何进行屏幕截图

Linux上如何进行换行符转换

mysql 密码忘记连接不上如何进行修改

深度卷积网络中如何进行上采样？

电脑上如何进行屏幕录像?--QVE屏幕录像

在苹果Mac上如何进行录音修剪？

SQL 大数据查询如何进行优化？

在SQL Server中如何进行UPDATE TOP .....ORDER BY？

postgres SQL学习笔记-如何进行权限管理

2019.06.14-学习如何进行SQL注入攻击

数据库牛人是如何进行SQL优化的？

Mysql-如何进行慢SQL查询

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)