SparkStreaming 搭建《二》运行SparkStreaming在集群上提交方式 - 代码天地

SparkStreaming 搭建《二》运行SparkStreaming在集群上提交方式

其他 2018-12-31 16:23:18 阅读次数: 0

本教程主要总结SparkStreaming并打包在集群上提交的方式。

需要先开启

$ nc -lk 9999

代码：

import org.apache.spark.SparkConf
import org.apache.spark.storage.StorageLevel
import org.apache.spark.streaming.{Seconds, StreamingContext}

object SparkStreamingDemo {
  def main(args: Array[String]) {
    if (args.length < 2) {
      System.err.println("Usage: NetworkWordCount <hostname> <port>")
      System.exit(1)
    }

   // SparkStreamingDemo.setStreamingLogLevels()

    // Create the context with a 1 second batch size
    val sparkConf = new SparkConf().setAppName("NetworkWordCount")
    val ssc = new StreamingContext(sparkConf, Seconds(1))

    // Create a socket stream on target ip:port and count the
    // words in input stream of \n delimited text (eg. generated by 'nc')
    // Note that no duplication in storage level only for running locally.
    // Replication necessary in distributed scenario for fault tolerance.
    val lines = ssc.socketTextStream(args(0), args(1).toInt, StorageLevel.MEMORY_AND_DISK_SER)
    val words = lines.flatMap(_.split(" "))
    val wordCounts = words.map(x => (x, 1)).reduceByKey(_ + _)
    wordCounts.print()
    ssc.start()
    ssc.awaitTermination()
  }

后面的localhost 9999是输入参数
// spark-submit  --queue media --class test.SparkStreamingDemo  --master yarn-cluster --executor-memory 2g  --executor-cores 2 --conf spark.yarn.submit.waitAppCompletion=false  ~/home/SparkStreamingDemo-1.0-SNAPSHOT.jar  localhost 9999

猜你喜欢

转载自blog.csdn.net/sinat_32176267/article/details/81741853

SparkStreaming 搭建《二》运行SparkStreaming在集群上提交方式

SparkStreaming

sparkStreaming介绍与运行方式

SparkStreaming-----SparkStreaming教程

SparkStreaming小结

kafka SparkStreaming

初识SparkStreaming

SparkStreaming概述

SparkStreaming例题

sparkStreaming笔记

SparkStreaming的ck

SparkStreaming Guide

SparkStreaming概要

sparkStreaming的wordCount

SparkStreaming算子

SparkStreaming基础

SparkStreaming 介绍

SparkStreaming的介绍

SparkStreaming的reduceByKeyAndWindow

SparkStreaming的updateStateByKey

【SparkStreaming总结】

SparkStreaming的运行流程

SparkStreaming运行原理

SparkStreaming（二）入门案例

sparkStreaming运行yarn，提交任务报错

大数据之sparkStreaming（一）：sparkStreaming概述、SparkStreaming的组件

Storm与SparkStreaming的区别？（storm与sparkstreaming如何选择）

sparkStreaming窗口操作 SPARKSTREAMING--REDUCEBYKEYANDWINDOW

运行sparkstreaming的NetworkWordCount不能出现

SparkStreaming项目实战（二）环境搭建

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)