spark streaming 程序在linux执行 - 代码天地

spark streaming 程序在linux执行

其他 2018-10-19 18:45:09 阅读次数: 0

● 将代码打成jar包上传至linux

package com.ws.saprk
import org.apache.spark.streaming.dstream.DStream
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.{SparkConf, SparkContext}
object StreamingTextFile {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("StreamingTextFile")

    val ssc = new StreamingContext(conf,Seconds(5))
    
	//这边有个坑,不能在本地上运行(windows),而且linux下也只能往该目录下通过流的方式追加数据才会被读取
	//比如echo xxxxx >> /root/test/game.log,会被streaming识别执行
	//而且,原来在此目录存在的文件也不会被识别,只有新增的并且通过流的数据才会识别!!!!!
    val test: DStream[String] = ssc.textFileStream("/root/test/")

    val splitArr = test.flatMap(_.split(" "))

    val result = splitArr.map(x=>(x,1)).reduceByKey(_+_)
    
    result.print()
    
    ssc.start()
    
    ssc.awaitTermination()
  }
}

● spark-submit 运行jar包

#这边使用ip简写(qjw-01)也有问题
[root@qjw-01 spark-2.1.3]# ./bin/spark-submit --master spark://192.168.0.21:7077 --class com.ws.saprk.StreamingTextFile /root/ws.jar

● 写入数据

[root@qjw-01 ~]# echo 1 2 3 4 5 6 7 8 9 1 2 43 5 6 5 >> /root/test/i.log

● 结果

-------------------------------------------
Time: 1539098465000 ms
-------------------------------------------

-------------------------------------------
Time: 1539098470000 ms
-------------------------------------------
(4,1)
(8,1)
(6,2)
(2,2)
(7,1)
(5,3)
(9,1)
(3,1)
(1,2)
(43,1)

-------------------------------------------

猜你喜欢

转载自blog.csdn.net/bb23417274/article/details/82990427

spark streaming 程序在linux执行

spark streaming程序的优雅关闭

Spark Streaming

Spark Streaming执行流程源码剖析

Spark Streaming单个batch作业的执行流程

Spark Streaming小程序试验-《单词统计》

spark-streaming例子程序

Spark Streaming应用程序调优

Spark: Spark Streaming

Spark------Spark Streaming

[Spark]-Spark streaming

【SPARK】Spark Streaming简介

【Spark】Spark Streaming的程序运行原理及与Kafka的集成

Spark Streaming & Structured Streaming分析

【Spark Streaming】3、Spark Streaming入门

[spark streaming] 动态生成 Job 并提交执行

spark streaming kafka消费多个topic时不执行的问题

[Spark][spark_streaming]#5_spark_streaming&spark_sql

spark学习笔记：Spark Streaming

Spark学习之Spark Streaming

Spark学习笔记： Spark Streaming

Spark --------Spark Streaming 集成 Kafka

【Spark】Spark Streaming的back pressure

Spark入门(五)——Spark Streaming

Spark核心之Spark Streaming

spark--Spark Streaming实战-★★★★★

spark--Spark Streaming原理-★★★

spark--Spark Streaming引入-★

Spark Streaming-02

flume 对接spark streaming

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)