Spark-胡乱小记 - 代码天地

Spark-胡乱小记

其他 2020-04-04 16:13:33 阅读次数: 0

1.从hdfs文件中获取数据

    val hdfs=org.apache.hadoop.fs.FileSystem.get(new java.net.URI("hdfs://hacluster"),
        new org.apache.hadoop.conf.Configuration())
    val fSDataInputStream1=hdfs.open(new Path(hdfs://hacluster/A/B/test.txt))
    val bufferedReader1=new BufferedReader(new InputStream(fSDataInputStream1))
    val line=bufferedReader1.readLine()

2.定义创建ssc函数

     val sc = SparkContext.getOrCreate()
     def funCreateStreamingContext():StreamingContext={
          val newSsc= new StreamingContext(sc,Seconds(60))
          println("Creating new StreamingContext")
          newSsc.chekpoint(vCheckPoint)
          newSsc
     }

3.创建ssc

    val checkPointPath ="hdfs://hacluster/A/B/checkPointPath"
    val ssc=StreamingContext.getActiveOrCreate(checkPointPath ,funCreateStreamingContext)

等木鱼的猫

发布了53 篇原创文章 · 获赞 40 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/u012761191/article/details/81222247

Spark-胡乱小记

Spark-环境搭建

spark-数据分区

Spark- WordCount Demo

Spark->预热

Spark- Action实战

Spark- Transformation实战

Spark-介绍

Spark-任务调度

Spark-共享变量

Spark-资源调度

Spark- 数据清洗

Spark-概述-安装

Spark-监控

Spark-调优

Spark-在集群运行spark

spark-红酒-白酒评估

spark-使用maven打包

spark-实操笔记

spark-参数配置总结

Spark- RDD持久化

Spark-任务执行流程

Spark-学习日志-20181221

Spark-分组TOPN算法

Spark-分组TOPN算法：

Spark- WordCount 总体流程

Spark-案例实操

Spark-思维导图

spark-运行原理剖析

Spark-遇到的坑-启动spark报错

今日推荐

周排行

键盘回车事件

提升git clone的速度

JDK8系列之LongAdder解析

ajax+formData完成多图片回显上传

个税起征点上调至5000元，你能多拿多少钱？

Exploding Carbon Nanotubes Could Work as Drug-Bas power sensor ed Delivery Devices

南京邮电大学网络攻防训练平台逆向第四题WxyVM

HTTP状态码记录

报错Permission denied: user=root, access=EXECUTE, inode="/tmp/hadoop-root"解决办法

sublime编译c

每日归档

更多

2024-06-10(0)

2024-06-09(0)

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)