2. 运行Spark Streaming - 代码天地

2. 运行Spark Streaming

其他 2019-09-14 23:02:37 阅读次数: 0

2.1 IDEA编写程序

　　　　　　Pom.xml加入以下依赖：

<dependency>
    <groupId>org.apache.spark</groupId> 
    <artifactId>spark-streaming_2.11</artifactId>
    <version>${spark.version}</version> 
    <scope>provided</scope>
</dependency>

　　　　　　案例如下：

import org.apache.spark.SparkConf

import org.apache.spark.streaming.{Seconds, StreamingContext}

/**
  * Created by huicheng on 25/07/2019.
  * */

object WorldCount {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setMaster("local[2]").setAppName("NetworkWordCount")
    val ssc = new StreamingContext(conf, Seconds(1))

    // Create a DStream that will connect to hostname:port, like localhost:9999
    val lines = ssc.socketTextStream("master01", 9999)

    // Split each line into words
    val words = lines.flatMap(_.split(" "))

    //import org.apache.spark.streaming.StreamingContext._ // not necessary since Spark 1.3
    // Count each word in each batch
    val pairs = words.map(word => (word, 1))
    val wordCounts = pairs.reduceByKey(_ + _)

    // Print the first ten elements of each RDD generated in this DStream to the console
    wordCounts.print()

    ssc.start() // Start the computation
    ssc.awaitTermination() // Wait for the computation to terminate }
  }

}

　　　　　　按照Spark Core中的方式进行打包，并将程序上传到Spark机器。并运行：

bin/spark-submit --class com.c.streaming.WorldCount ~/wordcount-jar-with- dependencies.jar

　　　　　　通过Netcat发送数据：

# TERMINAL 1:
# Running Netcat

$ nc -lk 9999

hello world

　　　　　　如果程序运行时，log日志太多，可以将spark conf目录下的log4j文件里面的日志级别改成WARN

猜你喜欢

转载自www.cnblogs.com/zhanghuicheng/p/11227372.html

2. 运行Spark Streaming

Spark Streaming运行原理

Spark Streaming(2)Old Notes

【Spark Streaming】2、Kafka入门

[Spark][spark_streaming]#2_Stateful

【Spark二十】运行Spark Streaming的NetworkWordCount实例

Spark定制班第2课：通过案例对Spark Streaming透彻理解三板斧之二：解密Spark Streaming运行机制和架构

Spark Streaming

Flume对接Spark Streaming的2种方式

Spark Streaming源码阅读（2）DAGScheduler

Spark Streaming三种运行场景

Spark Streaming运行流程及源码解析（一）

Spark Streaming运行流程及源码解析（二）

spark streaming运行原理源代码分析

spark streaming运行kafka数据源

Spark Streaming & Structured Streaming分析

Spark Streaming实时流处理项目7——Spark Streaming实战2

Spark Streaming篇2：Spark Streaming 更新update数据到mysql

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

【SPARK】Spark Streaming简介

【Spark】Spark Streaming的程序运行原理及与Kafka的集成

【Spark Streaming】3、Spark Streaming入门

Spark Streaming--2 自定义数据源

Spark Streaming 项目实战 (2) | 从 Kafka中消费数据

Spark Streaming快速入门系列(2) | wordcount案例

第五篇|Spark-Streaming编程指南(2)

flume 对接spark streaming

Spark Streaming-02

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)