Spark Structured Streaming、Kafak整合

其他 2018-11-01 00:11:47 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_34531825/article/details/72765807

Structured Streaming

SBT 依赖包：

groupId = org.apache.spark
artifactId = spark-sql-kafka-0-10_2.11
version = 2.1.1

在Spark2.x中，Spark Streaming获得了比较全面的升级，称为Structured Streaming，和之前的很不同，功能更强大，效率更高，跟其他的组件整合性也更好。

Spark 2.X提出了continuous application（连续的应用程序）的概念，非常重大。

首先，也是最重要的，在2.x中，提出了一个叫做continuous applications连续应用程序的概念。
如下图所示，数据从Kafka中流进来，通过ETL操作进行数据清洗，清洗出来作为目标数据进行进一步处理，可能是机器学习，也可能是交互式查询，也有可能直接把数据存在数据库或者其他外部存储设备，也有可能是直接交给已有的应用程序。也就是说SparkStreaming从获得数据后，能把全部处理环节串联起来，称之为端到端(End to end)处理!!!
这里写图片描述

#
http://spark.apache.org/docs/latest/streaming-kafka-0-10-integration.html

groupId = org.apache.spark
artifactId = spark-sql-kafka-0-10_2.11
version = 2.1.1

http://blog.csdn.net/javastart/article/details/50942397

未完成待续

參考文献：
【1】http://spark.apache.org/docs/latest/structured-streaming-kafka-integration.html 官网简单介绍
【2】http://www.cnblogs.com/dt-zhw/p/5597353.html Spark定制班第29课：深入理解Spark 2.x中的Structured Streaming内幕
【3】https://www.iteblog.com/archives/1322.html 实际较详细的例子
【4】https://github.com/ansrivas/spark-structured-streaming/blob/master/src/main/scala/com/kafkaToSparkToCass/Main.scala
代码参考

猜你喜欢

转载自blog.csdn.net/qq_34531825/article/details/72765807

Spark Structured Streaming、Kafak整合

Spark Structured Streaming

Spark Structured Streaming HelloWorld

Spark Streaming & Structured Streaming分析

Apache Spark Structured Streaming and watermarks

Spark 2.3.0 Structured Streaming详解

Spark：Structured Streaming Sink总结

Spark -- Structured Streaming入门介绍

spark--Structured Streaming实战-★★★★

[Structured streaming基础]--Structured Streaming 和Spark streaming的区别

Spark Streaming vs. Structured Streaming

Structured Streaming 和 Spark streaming的区别

《Spark Structured Streaming》官方文档解读

DataFlow编程模型与Spark Structured streaming

【大数据】【Spark】 Structured Streaming基础

SSS —— Spark Structured Streaming 之理解与入门

spark--Structured Streaming-介绍-★

Spark入门( 八)——Spark流计算新玩法-Structured Streaming

sparksql和sparkcore/spark streaming/Structured streaming 的选用总结

structured streaming

Spark2.0版本神器Structured Streaming

spark知识体系06-Structured Streaming

学习Spark2.0中的Structured Streaming（一）

Spark Structured Streaming 与 Flink不同的checkpoint实现方式（上）

Structured Streaming Programming Guide（基于Spark 2.4.0官方文档）

14. spark学习之旅之structured streaming（八）

SSS —— Spark Structured Streaming 之单列拆分成多列

Spark2.2（三十三）：Spark Streaming和Spark Structured Streaming更新broadcast总结

Spark2.2(三十八)：Spark Structured Streaming2.4之前版本使用agg和dropduplication消耗内存比较多的问题（Memory issue with spark structured streaming）调研

Structured Streaming介绍、整合Kafka、整合MySQL

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)