spark streaming 每10s打印出前20s的所有记录 - 代码天地

spark streaming 每10s打印出前20s的所有记录

其他 2018-11-15 23:52:42 阅读次数: 0

版权声明：本文为博主原创文章，转载请注上 http://blog.csdn.net/wzhwei1987 https://blog.csdn.net/wzhwei1987/article/details/83388053

使用spark streaming基本入门demo 代码如下：

package com.xj365.bdp

import org.apache.spark.SparkConf

import org.apache.spark.streaming._

import org.apache.spark.streaming.kafka010._

object DirectKafkaWordCount {

def main(args: Array[String]) {

if (args.length < 2) {

System.err.println(s"""

|Usage: DirectKafkaWordCount <brokers> <topics>

| <brokers> is a list of one or more Kafka brokers

| <topics> is a list of one or more kafka topics to consume from

|

""".stripMargin)

System.exit(1)

}

val Array(brokers, topics) = args

// Create context with 2 second batch interval

val sparkConf = new SparkConf().setAppName("DirectKafkaWordCount").setMaster("local[2]")

val ssc = new StreamingContext(sparkConf, Seconds(2))

// Create direct kafka stream with brokers and topics

val topicsSet = topics.split(",").toSet

val kafkaParams = Map[String, String]("bootstrap.servers" -> brokers,"key.deserializer"->"org.apache.kafka.common.serialization.StringDeserializer",

"value.deserializer"->"org.apache.kafka.common.serialization.StringDeserializer","group.id"->"wuzhanwei")

val messages = KafkaUtils.createDirectStream[String, String](

ssc,

LocationStrategies.PreferConsistent,

ConsumerStrategies.Subscribe[String, String](topicsSet, kafkaParams))

// Get the lines, split them into words, count the words and print

val lines = messages.map(_.value).window(Seconds(20),Seconds(10))

lines.foreachRDD{

rdd=>rdd.foreachPartition{

it=>it.foreach{

case msg=>

println(System.currentTimeMillis()+"msg:"+msg)

}

}

}

// Start the computation

ssc.start()

ssc.awaitTermination()

}

}

// scalastyle:on println

猜你喜欢

转载自blog.csdn.net/wzhwei1987/article/details/83388053

spark streaming 每10s打印出前20s的所有记录

10-Spark Streaming

Spark Streaming

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

【SPARK】Spark Streaming简介

使用Spark Streaming完成有状态统计

Spark Streaming & Structured Streaming分析

【Spark Streaming】3、Spark Streaming入门

[Spark][spark_streaming]#5_spark_streaming&spark_sql

spark学习笔记：Spark Streaming

Spark学习之Spark Streaming

Spark学习笔记： Spark Streaming

Spark --------Spark Streaming 集成 Kafka

【Spark】Spark Streaming的back pressure

Spark入门(五)——Spark Streaming

Spark核心之Spark Streaming

spark--Spark Streaming实战-★★★★★

spark--Spark Streaming原理-★★★

spark--Spark Streaming引入-★

Spark Streaming-02

flume 对接spark streaming

Spark Streaming简介

【Spark Streaming介绍】

Spark Streaming 读取RabbitMQ

Storm与Spark Streaming比较

spark Streaming详解

Spark Streaming Programming Guide

Spark Streaming的窗口操作

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)