大数据开发实战：Stream SQL实时开发 - 代码天地

大数据开发实战：Stream SQL实时开发

其他 2018-09-05 11:38:30 阅读次数: 0

　　1、流计算SQL原理和架构

　　　　流计算SQL通常是一个类SQL的声明式语言，主要用于对流式数据(Streams)的持续性查询，目的是在常见流计算平台和框架（如Storm、Spark Streaming、Flink、Beam等）的底层API上，

　　通过使用简易通用的的SQL语言构建SQL抽象层，降低实时开发的门槛。

　　　　流计算SQL的原理其实很简单，就是在SQL和底层的流计算引擎之间架起一座桥梁---流计算SQL被用户提交，被SQL引擎层翻译为底层的API并在底层的流计算引擎上执行。比如对Storm

　　来说，会自动翻译成Storm的任务拓扑并在Storm集群上运行。

　　　　流计算SQL引擎是流计算SQL的核心，主要负责对用户SQL输入进行语法分析、语义分析、逻辑计划生成、逻辑计划执行、物理执行计划生成等操作。而真正执行计算的是底层的流计算平台。

　　　　不同于离线任务，实时的数据是不断流入的，所以为了使用SQL来对流处理进行抽象，流计算SQL也引入了“表”的概念，不过这里的表是动态表。

　　　　流计算SQL的架构如下：

　　　　

　　　　SQL层：流计算SQL给用户的接口，它提供过滤、转换、关联、聚合、窗口、select、union、split等各种功能。

　　　　SQL引擎层：负责SQL解析/校验、逻辑计划生成优化和物理计划执行等。

　　　　流计算引擎层：具体执行SQL引擎层生成的执行计划。

　　2、流计算SQL：未来主要的实时开发技术

　　　　目前流计算SQL在各个计算框架的进度和支持力度不一。

　　　　Storm SQL还只是一个实验性的功能。Flink SQL是Flink大力推广的核心API。Flink是一个原生的开源流计算引擎，而且目前还没有其它开源流计算引擎能提供比Flink 更优秀的流

　　　　计算SQL框架和语法等，所以Flink SQL实际上在定义流计算SQL的标注。

　　　　阿里云Stream SQL 的底层就是Flink引擎（实际是Blink,也就是Alibaba Flink）,可以认为Blink是Flink的企业版本，

　　3、Stream SQL

　　

猜你喜欢

转载自www.cnblogs.com/shaosks/p/9591076.html

大数据开发实战：Stream SQL实时开发

大数据开发实战：Stream SQL实时开发二

离线和实时大数据开发实战

《离线和实时大数据开发实战》（一）构建大数据开发知识体系图谱

大数据开发实战总结

《离线和实时大数据开发实战》（二）大数据平台架构 & 技术概览

大数据开发实战：Hadoop数据仓库开发实战

《离线和实时大数据开发实战》（三）Hadoop原理实战

高效的大数据开发环境搭建及实战

读《离线和实时大数据开发实战》，揭开 Hive 优化实践的神秘面纱

《离线和实时大数据开发实战》（四）Hive 原理实践

大数据开发实战：Hive优化实战2

大数据开发实战：Spark Streaming流计算开发

大数据流处理与实时分析:Spark Streaming和Flink Stream SQL的对比与选择

大数据开发实战：数据平台大图

大数据开发实战笔记2：数据平台大图

大数据开发：实时数据平台和流计算

拼多多大数据开发工程师SQL实战解析

大数据项目开发进度（实时更新）

大数据开发实战：HDFS和MapReduce优缺点分析

大数据开发实战：MapReduce内部原理实践

大数据开发实战：Hive表DDL和DML

大数据开发实战：维度建模1-相关概念

《Hadoop大数据技术开发实战》新书上线

《Hadoop》大数据技术开发实战学习笔记（二）

离线大数据开发实战（读书笔记）

大数据开发实战系列之电信客服(1)

大数据开发实战系列之Spark电商平台

大数据开发实战：美团是如何应用Spark处理大数据的？

要想把大数据读懂，基于Hadoop与Spark的大数据开发实战pdf，足矣

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)