SparkStreaming -Kafka数据源

其他 2020-01-12 10:34:19 阅读次数: 0

SparkStreaming处理kafka作为数据源

所以我们要创建的是kafka的Dstream，那么就要使用到KafkaUtils下的createStream，先来看一下ctrl点进去查看，然后来写参数

在这里插入图片描述

package date_10_16_SparkStreaming

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka.KafkaUtils
object kafkaSource {

  def main(args: Array[String]): Unit = {
    //使用SparkStreaming完成wordcount

    //配置对象
    val conf = new SparkConf().setMaster("local[*]").setAppName("wordcount")

    //实时数据分析的环境对象
    //StreamingContext需要两个参数，一个conf，一个是采集周期
    val streamingContext = new StreamingContext(conf,Seconds(5))

    //从kafka采集数据
    val kafkaStream = KafkaUtils.createStream(streamingContext,"chun1:2181","chun",Map("chun"->3))

    //将采集的数据进行分解(扁平化)
    val wordToSumDstream = kafkaStream.flatMap(_._2.split(" ")).map((_,1)).reduceByKey(_+_)

    wordToSumDstream.print()

    //这里不能停止采集功能，也就是streamingContext不能结束
    //可以简单理解为启动采集器
    streamingContext.start()
    //Driver等待采集器，采集器不挺Driver不停止
    streamingContext.awaitTermination()
  }
}

开启kafka，输入数据

kafka-console-producer.sh --broker-list chun1:2181 --topic chun


a a a a
a
a
a
a
a
a a a
a a a

idea里查看结果

春_

发布了83 篇原创文章 · 获赞 61 · 访问量 9187

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43736084/article/details/102600787

SparkStreaming -Kafka数据源

【sparkStreaming】kafka作为数据源的生产和消费

sparkStreaming自定义数据源

kafka SparkStreaming

SparkStreaming（13）：高级数据源kafka Direct方式（生产）

SparkStreaming（12）：高级数据源kafka Receiver方式（生产）

SparkStreaming读取Kafka数据

SparkStreaming消费kafka数据

SparkStreaming之基本数据源输入

SparkStreaming(三)——自定义数据源

SparkStreaming读取kafka数据的方式

kafka整合sparkStreaming

sparkstreaming写入kafka的优化

12.3 kafka和Sparkstreaming

SparkStreaming 读取Kafka createDirectStreaming

SparkStreaming操作Kafka

sparkstreaming 监听 kafka 代码

kafka整合sparkStreaming问题

SparkStreaming 读写Kafka

SparkStreaming整合kafka入门

sparkStreaming kafka学习笔记

SparkStreaming整合kafka

SparkStreaming整合kafka的补充

SparkStreaming+Kafka整合

SparkStreaming与kafka入门学习

SparkStreaming与Kafka的整合（基础）

SparkStreaming 整合kafka Demo

kafka整合sparkStreaming及优化

kafka与SparkStreaming整合

Kafka+sparkStreaming+Hbase

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)