Spark Streaming 简单示例(WordCount) - 代码天地

Spark Streaming 简单示例(WordCount)

其他 2019-01-16 13:50:03 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Luomingkui1109/article/details/86291049

1.Pom.xml 加入以下依赖：

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-streaming_2.11</artifactId>
    <version>${spark.version}</version>
    <scope>provided</scope>
</dependency>

2.代码示例

package com.luomk
import org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}

/**
  * @author luomingkui
  * @date 2018/6/16 下午9:31
  * @desc 利用sparkStream计算WorldCount
  *      yun search nc
  *      运行步骤：在服务端开启 nc -lk 9999
  *      然后启动该程序
  *      在服务端输入参数，在控制台就可以看见效果了
  */

object WorldCount {
  def main(args: Array[String]): Unit = {
    //创建SparkStream对象
    val conf = new SparkConf().setAppName("Streaming").setMaster("local[*]")

    //创建StreamingContext对象
    val ssc = new StreamingContext(conf,Seconds(5))

    //创建一个接收器来接受数据 DStream[String]
    val linesDStream = ssc.socketTextStream("hadoop102",9999)

    //flapMap转换为单词
    val worldDStream = linesDStream.flatMap(_.split(" "))

    //将单词转换为kv结构
    val kvDStream = worldDStream.map((_,1))

    //将相同的单词进行合并
    val result = kvDStream.reduceByKey(_+_)

    result.print()

    ssc.start()

    ssc.awaitTermination()

  }

}

注意：如果程序运行时log日志太多，可以将的log4j(log4j.properties)文件里面的日志级别改成WARN，添加到resource目录下：

#
# Copyright (c) 2017. WuYufei All rights reserved.
#
log4j.rootLogger=error,stdout,R
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%t]  %-c(line:%L) : %m%n
log4j.appender.R=org.apache.log4j.RollingFileAppender
log4j.appender.R.File=spark.log
log4j.appender.R.MaxFileSize=1024KB
log4j.appender.R.MaxBackupIndex=1
log4j.appender.R.layout=org.apache.log4j.PatternLayout
log4j.appender.R.layout.ConversionPattern=%d{yyyy-MM-dd HH:mm:ss,SSS}  %5p --- [%t]  %-c(line:%L) : %m%n

猜你喜欢

转载自blog.csdn.net/Luomingkui1109/article/details/86291049

Spark Streaming 简单示例(WordCount)

spark streaming中WordCount

从WordCount入门Spark Streaming

Spark Streaming 实战 WordCount

Spark Streaming实现WordCount

Spark Streaming示例（九）

Spark Streaming 实战 WordCount（累加）

Spark Streaming 简单介绍

《Spark Streaming 有状态wordCount示例（updateStateByKey的使用）》

Spark Streaming消费kafka示例

Spark Streaming时间窗口示例

Spark SQL简单示例(WordCount)

Spark Streaming 快速入门系列(1) | Spark Streaming 的简单介绍！

Spark Streaming流式计算的WordCount入门

java8实现spark streaming的wordcount

使用idea编写Spark Streaming_WordCount

Spark Streaming（WordCount、Window、ForEachRDD练习）

Spark Streaming集成kafka和redis简单示例 - Java版

Spark Streaming整合Spark SQL之wordcount案例

Spark --Spark Streaming实战 WordCount他来啦！！！ updateStateByKey reduceByKeyAndWindow

【JAVA之spark streaming入门示例】

Spark Streaming

Spark Streaming介绍以及简单使用

Flume+Kakfa+Spark Streaming整合（运行WordCount小例子）

SparkStreaming（9）：实例-Streaming整合Spark SQL，进行wordcount功能

Spark Streaming 自定义数据源之 WordCount

Spark Streaming快速入门系列(2) | wordcount案例

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)