Spark Stream 实时读kafka写redis，rdd转换其他类型 - 代码天地

Spark Stream 实时读kafka写redis，rdd转换其他类型

其他 2018-09-22 13:52:26 阅读次数: 0

做一个实时系统，用到了kafka，redis，sparkStream，很经典的一个架构。

kafka的生产者就不写了，这边只涉及sparksteam写消费者代码，存到redis。

KafkaToRedis kafkaToRedis=new KafkaToRedis();
   SparkConf conf = new SparkConf().setAppName("kafka_to_redis");
   JavaStreamingContext jssc = new JavaStreamingContext(conf,Durations.seconds(10));
       Map<String, String> kafkaParams = new HashMap<>();
       kafkaParams.put("bootstrap.servers","wxincentos1:9092,wxincentos3:9092");
       kafkaParams.put("metadata.broker.list", "wxincentos1:9092,wxincentos3:9092");
       kafkaParams.put("group.id", "1");Set<String> topics = new HashSet<String>();
       topics.add("test3");
       JavaPairInputDStream<String,String> lines = KafkaUtils.createDirectStream(
               jssc,
               String.class, // key类型
               String.class, // value类型
               StringDecoder.class, // 解码器
               StringDecoder.class,
               kafkaParams,
               topics);

到此就看后面的需求了，网上太多的wordcount的列子，看的都快吐了，想找个能把数据内容取出来的都那么困难，大多还是停留在rdd上，没办法只好自己想办法，看了好多列子，发现其实就是个rdd转其他类型的问题，就好办多了。

把rdd collect一下就能得到一个数组，操作也简单，说干就干。

JavaDStream<String> valueDStream = lines.map(new Function<Tuple2<String, String>, String>() {
public String call(Tuple2<String, String> v1) throws Exception {
return v1._2();
}
});

List a=rdd.collect();
for(int i = 0; i<a.size();i++){

a.get(i)；

}

数据就轻轻松松地取出来啦

写redis的话就是实例化个redis客户端，操作操作即可。就不赘述啦，后面讲讲redis集群怎么用的。

猜你喜欢

转载自blog.csdn.net/wx740851326/article/details/82778028

Spark Stream 实时读kafka写redis，rdd转换其他类型

spark stream 应用-结合kafka

Spark Stream操作Kafka总结

【Spark】Spark Stream读取kafka写入kafka报错 AbstractMethodError

【Spark】Spark 2.4 Stream 读取kafka 写入kafka

Spark Stream点滴

Spark Stream之读取Kafka数据源

Spark Stream对接Kafka的两种版本选择

Spark Structured Stream的流关联（Stream-Stream Joins）

spark stream 应用-结合hdfs

Spark Stream、Kafka Stream、Storm和Flink对比，以及阿里巴巴基于Flink打造的Blink解决的问题

Java8函数式编程（二）：类比Spark RDD算子的Stream流操作

Kafka Stream

bilibili Saber 实时计算平台架构与实践【Apache Flink 替换 Spark Stream的架构与实践】

大数据流处理与实时分析:Spark Streaming和Flink Stream SQL的对比与选择

spark stream入门案例：netcat准实时处理wordCount（scala 编程）

大数据篇：flume+kafka+spark stream+hbase做日志收集

Spark Stream整合flum和kafka，数据存储在HBASE上，分析后存入数据库

优雅关闭Spark Stream任务（改进）

Spark简单的word count，计算，stream代码

【那些年我们踩过的坑】Kafka与Spark Stream 集成之作业提交报错java.lang.ClassNotFoundException

spring cloud stream kafka

kafka stream流式处理

Kafka Stream介绍

Kafka Stream 数据清洗

kafka stream编程指南

Apache Kafka Stream

Redis入门 - Redis Stream

Spark Stream之自定义数据源

Hadoop迎来Spark Stream 激发大数据应用新变革

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)