sparkStreaming与kafka集成进行数据处理 - 代码天地

sparkStreaming与kafka集成进行数据处理

其他 2018-08-27 20:27:58 阅读次数: 0

集成分为两个版本：http://spark.apache.org/docs/2.2.0/streaming-kafka-integration.html

下例是0.8版本的例子：https://github.com/apache/spark/blob/v2.2.0/examples/src/main/scala/org/apache/spark/examples/streaming/DirectKafkaWordCount.scala

import kafka.serializer.StringDecoder
import org.apache.spark.SparkConf
import org.apache.spark.streaming.kafka.KafkaUtils
import org.apache.spark.streaming.{Seconds, StreamingContext}

object streamingKafka {
  def main(args: Array[String]): Unit = {
    val sparkConf=new SparkConf()
      .setMaster("local[2]")
      .setAppName("streamingKafka")

    val ssc=new StreamingContext(sparkConf,Seconds(5))


    val topicsSet = Set("weblogs")
    val kafkaParams = Map[String, String]("metadata.broker.list" -> "zeng151.com:9092")
    val kfkStream = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](
      ssc, kafkaParams, topicsSet)

    // Get the lines, split them into words, count the words and print
    val lines = kfkStream.map(_._2)
    val words = lines.flatMap(_.split(" "))
    val wordCounts = words.map(x => (x, 1L)).reduceByKey(_ + _)
    wordCounts.print()

    ssc.start()
    ssc.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/weixin_42744795/article/details/82083569

sparkStreaming与kafka集成进行数据处理

利用数组进行数据处理

使用PyTorch进行数据处理

python进行数据处理与分析

matlab 读取txt文件以及进行数据处理

python进行数据处理——pandas的drop函数(收藏)

v-for 使用 filters 进行数据处理

python遍历文件进行数据处理

Python学习 | Numpy 利用数组进行数据处理

numpy使用数组进行数据处理

python 数据处理对txt文件进行数据处理

python 数据处理对csv文件进行数据处理

实时日志数据处理——Kafka、Storm、ElasticSearch集成

使用Kafka Streams进行准实时ETL数据处理

kafka是数据处理的未来？

Python数据分析 | (11)利用NumPy数组进行数据处理

使用机器学习和数据挖掘算法进行数据处理

Python连接Oracle数据库进行数据处理操作

利用python数据分析——Numpy基础：通用函数、利用数组进行数据处理

如何用spark对清理好的数据进行数据处理

并行数据处理与性能

PL/SQL多行数据处理

Facebook十亿级用户运用机器进行数据处理

pyspark学习系列（二）读取CSV文件为RDD或者DataFrame进行数据处理

kettle案例四使用java脚本进行数据处理

vue 父组件异步值传递给子组件子组件进行数据处理

java 调用 linux 命令行 +使用管道、awk等命令进行数据处理的方法

如何在MaxCompute中利用bitmap进行数据处理？

机器翻译--Moses脚本进行数据处理，Bleu值计算

python自学-class23(down)-使用多线程进行数据处理的练习

今日推荐

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

周排行

计算机组成与设计（七）—— 除法器

Integer Approximation(分治+枚举)

大话数据库索引

windows10系统JDK的配置及下载地址

mysql实现秒值转换中原六仔平台搭建

Codeforces Round #556 (Div. 1)

百练1064 网线主管

Codeforces 995F Cowmpany Cowmpensation

子集生成之增量构造法，位向量法，二进制法

ERROR: cmd.exe failed with args /c "/APK\gradle\rungradle.bat...

每日归档

更多

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)