Spark学习笔记：输入DStream和Receiver详解

其他 2018-12-24 09:21:06 阅读次数: 0

输入DStream和Receiver详解

输入DStream代表了来自数据源的输入数据流，除了文件数据流之外，所有的输入DStream都会绑定一个Receiver对象，Receiver用于接收数据，然后将数据存储在Spark的内存中，以供后续的操作使用。

SparkStreaming提供的数据源支持

基础数据源：StreamingContext API中直接提供了对这些数据源的支持，比如文件、Socket、Akka Actor等
高级数据源：诸如Kafka、Flume、Kinesis、Twitter等数据源，通过第三方工具类提供支持，这些数据源的使用需要引用其依赖

注意事项

如果要在实时计算应用中并行接收多条数据流，可以创建多个输入DStream，这样就会创建多个Receiver，从而并行地接收多个数据流。这里有一个问题，一个Spark Streaming应用程序的executor是一个长期运行的任务，所以它会独占分配给Spark Streaming应用程序的CPU core，所以只要Spark Streaming运行起来之后，这个节点上的CPU core数就没有办法给其他的应用所使用了，因为会被Receiver所独占
使用本地模式运行程序时，必须使用local[n]，n>=2绝对不能用local和local[1]，因为就会给执行输入DStream的executor分配一个线程，Spark Streaming底层的原理需要至少有两个线程，一个线程分配给Receiver接收数据，另一个线程用来处理接收到的数据。如果线程小于2的话，那么程序只会接收数据，不会处理数据
如果直接将Spark Streaming应用提交到集群上运行，需要保证有足够资源

猜你喜欢

转载自blog.csdn.net/lrxcmwy2/article/details/82729086

Spark学习笔记：输入DStream和Receiver详解

Spark07-SparkStreaming入门（DStream ,Receiver，基本输入源）

根本:详解receiver based Dstream

Spark学习笔记：DStream的transformation操作概览

spark笔记之DStream

大数据之Spark（六）--- Spark Streaming介绍，DStream，Receiver，Streamin集成Kafka，Windows，容错的实现

Receiver和ReceiverImpl 详解

【Spark Streaming】（三）DStream 算子详解

spark笔记之DStream相关操作

StreamingContext、DStream、Receiver深度剖析

[spark streaming] DStream 和 DStreamGraph 解析

大数据技术之_19_Spark学习_04_Spark Streaming 应用解析 + Spark Streaming 概述、运行、解析 + DStream 的输入、转换、输出 + 优化

学习笔记 --- Kafka Spark Streaming获取Kafka数据 Receiver与Direct的区别

IMF传奇行动第84课：Spark Streaming第三课：StreamingContext、DStream、Receiver深度剖析

Spark DStream相关操作

android学习笔记（三）四大组件Broadcast Receiver详解

学习(Broadcast Receiver) 个人笔记三

spark-Streaming direct和receiver方式读取的区别

DStream, DStreamGraph 详解

【Spark八十四】Spark Streaming中DStream和RDD之间的关系

spark streaming DStream算子大全

Spark DStream 输出编程进阶

Spark Streaming-Dstream转换

【Spark Streming】DStream转换操作

【Spark Streming】DStream转换操作

DStream的原理和源码

[Spark、hadoop]spark Streaming的核心DStream

Receiver, ReceiverSupervisor, BlockGenerator详解

Receiver 分发详解

android第一行代码学习笔记——Broadcast Receiver

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)