spark streaming实时计数 - 代码天地

spark streaming实时计数

其他 2018-10-19 18:45:24 阅读次数: 0

● 在Linux终端窗口可以直接使用yum工具进行安装：

[root@hadoop-01 ~]# yum install -y nc

● 发送数据

[root@hadoop-01 ~]# nc -lk 8866

● 使用Streaming实时计数

package com.ws.streaming
import org.apache.spark.streaming.dstream.{DStream, ReceiverInputDStream}
import org.apache.spark.streaming.{Milliseconds, StreamingContext}
import org.apache.spark.{SparkConf, SparkContext}

/**
  *实时计数
  */
object StreamingWc {

  def main(args: Array[String]): Unit = {

    //离线任务是创建SparkContext;实现实时计算，用StreamingContext
    
    val conf = new SparkConf().setAppName("StreamingWc").setMaster("local[*]")
    val sc = new SparkContext(conf)

    //StreamingContext是对SparkContext的包装，包了一层就增加了实时的功能
    //第二个参数是小批次产生的时间间隔
    val ssc = new StreamingContext(sc, Milliseconds(5000))

    val data: ReceiverInputDStream[String] = ssc.socketTextStream("hadoop-01", 8866)

    val flatData: DStream[String] = data.flatMap(_.split(" "))

    val arr: DStream[(String, Int)] = flatData.map((_, 1))

    val result = arr.reduceByKey(_ + _)

    result.print()

    //启动sparksteaming程序
    ssc.start()
    //等待优雅的退出
    ssc.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/bb23417274/article/details/82976366

spark streaming实时计数

spark streaming准实时计算demo

Spark Streaming实时计算学习

Spark Streaming实时计算框架介绍

Spark Streaming实时计算实例

Spark Streaming实时计算海量用户UV

Spark Streaming实时计算框架学习01

Spark streaming 实时计算框架基本练习----词频统计

大数据实时计算Spark学习笔记（11）—— Spark Streaming

Kafka+Spark Streaming+Redis实时计算整合实践

潘国庆：基于 Spark Streaming 构建实时计算平台实战解析

Spark-Streaming 和 Kafka 做实时计算需要注意的点

spark笔记-实时计算

Spark Streaming（下）--实时流计算Spark Streaming实战

Spark Streaming（上）--实时流计算Spark Streaming原理介绍

Spark Streaming实时流处理项目5——Spark Streaming入门

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

【SPARK】Spark Streaming简介

实时流计算Spark Streaming原理介绍

spark streaming 实时流处理视频

spark streaming 实时流处理实战视频

Spark Streaming实时流处理项目实战

Spark Streaming实时处理应用

Spark Streaming实时流处理项目实战

Spark Streaming实时处理Kafka数据

Spark Streaming

Spark学习笔记：基于HDFS的实时计算WordCount

基于Kafka的实时计算引擎：Flink能否替代Spark？

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)