Spark介绍（三）SparkStreaming - 代码天地

Spark介绍（三）SparkStreaming

其他 2018-11-29 09:31:12 阅读次数: 0

一、SparkStreaming简介

SparkStreaming是一个对实时数据流进行高通量、容错处理的流式处理系统，可以对多种数据源（如Kdfka、Flume、Twitter、Zero和TCP 套接字）进行类似Map、Reduce和Join等复杂操作，并将结果保存到外部文件系统、数据库或应用到实时仪表盘。

Spark Streaming处理的数据流图

Spark Streaming构架

二、DStream简介

1.Dstream离散流由一系列连续的RDD组成，每个RDD都包含了确定时间间隔内的数据。

2.对DStream中数据的各种操作也是映射到内部的RDD上来进行的

3.Dstream的输入源包括基本源（文件系统和Socket（套接字）连接）和高级源（ Kafka、Flume、Kinesis、Twitter 等，额外增加类依赖）

三、DStream操作

1.1普通的转换操作：map、flatMap、flter、union、count、join等

1.2transform(func)操作：允许DStream 上应用任意RDD-to-RDD函数

1.3updateStateByKey操作：

1.4窗口转换操作：允许你通过滑动窗口对数据进行转换，如countByWindow、 reduceByKeyAndWindow等，(批处理间隔、窗口间隔和滑动间隔)

2.输出操作:允许DStream的数据被输出到外部系统，如数据库或文件系统，有print()、foreachRDD(func)、saveAsTextFiles()、 saveAsHadoopFiles()等

3.持久化：通过persist()方法将数据流存放在内存中，有利于高效的迭代运算

猜你喜欢

转载自blog.csdn.net/kxiaozhuk/article/details/82699366

Spark介绍（三）SparkStreaming

Spark -------- SparkStreaming介绍、工作原理及性能优化

SparkStreaming 介绍

SparkStreaming的介绍

大数据之sparkStreaming（三）：Spark Streaming的状态操作

spark-05：sparkStreaming

SparkStreaming集成Spark Sql

Spark--sparkStreaming

sparkStreaming介绍与运行方式

SparkStreaming的介绍及原理

Spark（四）————SparkSQL和SparkStreaming

Spark搭建历程-《sparkStreaming》1

spark学习记录（十三、SparkStreaming）

Spark SQL 在SparkStreaming中的运用

spark sparkStreaming思维导图

spark 源码分析之三 -- LiveListenerBus介绍

Spark学习三：RDD介绍及编程

spark2.x-sparkstreaming+kafka

Spark实战（一）SparkStreaming集成Kafka

Spark Streaming（二十四）初识SparkStreaming

spark之sparkStreaming实时流处理

spark记录（16）SparkStreaming On HDFS AND TO MySQL

spark记录（15）SparkStreaming算子操作

9-spark学习笔记-sparkstreaming

Spark ---------- SparkStreaming窗口函数的使用及性能优化

Spark官网补缺之SparkStreaming

spark第七章：SparkStreaming实例

SparkStreaming（三）离散流（DStream）

37_SparkStreaming三—进阶

大数据-spark理论(3)sparkSql，sparkStreaming，spark调优

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)