SparkStreaming读取Kafka数据 - 代码天地

SparkStreaming读取Kafka数据

其他 2018-09-14 06:36:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/GUANYAQI1996/article/details/78663057

package kafka

import org.apache.spark.SparkConf
import org.apache.spark.streaming.kafka010.KafkaUtils
import org.apache.spark.streaming.{Duration, StreamingContext}
import org.apache.spark.streaming.kafka010.LocationStrategies.PreferConsistent
import org.apache.spark.streaming.kafka010.ConsumerStrategies.Subscribe
/*记得添加依赖

<dependency>
  <groupId>org.apache.spark</groupId>
  <artifactId>spark-streaming-kafka-0-10_2.11</artifactId>
  <version>2.2.0</version>
</dependency>*/

object KafkaSparkStreaming {
  val conf=new SparkConf().setMaster("local[*]").setAppName("data from kafka")
  val ssc=new StreamingContext(conf,Duration(5))

  def main(args: Array[String]): Unit = {
    //kafka的配置参数
    val kafkaParams = Map(
      "bootstrap.servers" -> "master:9092,master:9093",
      ("key.deserializer" -> "org.apache.kafka.common.serialization.StringDeserializer"),
      "value.deserializer" -> "org.apache.kafka.common.serialization.StringDeserializer",
      "group.id" -> "kafkaTest",
      "enable.auto.commit" -> "false"
    )

    val topics = Set("spark")//创建topic
    val kafkaDstream = KafkaUtils.createDirectStream[String, String](
      ssc,
      PreferConsistent,//本地策略
      Subscribe[String, String](topics, kafkaParams)//消费策略
    ).map(x=>x.value())
      .flatMap(_.split("\\s"))
      .map((_,1))
      .reduceByKey(_+_)
      .print()
    
    ssc.start()
    ssc.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/GUANYAQI1996/article/details/78663057

SparkStreaming读取Kafka数据

SparkStreaming读取kafka数据的方式

SparkStreaming与kafka通过直连方式读取数据

sparkStreaming读取kafka数据的2种方式

SparkStreaming 读取Kafka createDirectStreaming

SparkStreaming读取kafka数据的两种方式

SparkStreaming《三》读取kafka数据，增量保存在Mysql里

SparkStreaming消费kafka数据

SparkStreaming读取Socket数据

SparkStreaming -Kafka数据源

读取kafka数据通过SparkStreaming处理，数据零丢失--使用jdbc存储offset

Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十一）定制一个arvo格式文件发送到kafka的topic，通过sparkstreaming读取kafka的数据

kafka SparkStreaming

SparkStreaming读取Kafka对接Flume抽取到的数据库数据并保存到HBase中，Hive映射HBase进行查询

SparkStreaming通过Kafka获取数据（Receiver方式）

SparkStreaming 解析Kafka JSON格式数据

sparkstreaming对接kafka出现的数据积压问题

SparkStreaming消费kafka中数据的方式

Java版SparkStreaming读取Kafka实现实时的单词统计

SparkStreaming入门：通过socket读取流数据

大数据11_Kafka知识以及kafka与sparkstreaming结合

【Kafka】《Kafka权威指南》——从Kafka读取数据

flume 读取kafka 数据

大数据实时阶段----【Spark04之sparkStreaming整合flume、sparkStreaming整合kafka (★★★★★)】

【sparkStreaming】kafka作为数据源的生产和消费

sparkstreaming + kafka如何保证数据不丢失、不重复

sparkStreaming与kafka集成进行数据处理

大数据学习之路96-SparkStreaming整合Kafka

SparkStreaming消费Kafka数据kafkaRDD转DataSet的小问题

sparkStreaming程序过滤kafka json数据两种方法

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)