SparkStreaming保存数据至MySQL - 代码天地

SparkStreaming保存数据至MySQL

其他 2021-03-01 22:52:48 阅读次数: 0

import java.sql.{
    
    Connection, DriverManager, PreparedStatement}

import org.apache.spark.SparkConf
import org.apache.spark.streaming.{
    
    Seconds, StreamingContext}

/**
  * @ClassName: DStreamOutput
  * @Description:
  * @Author: kele
  * @Date: 2021/2/19 9:40
  **/
object DStreamOutput {
    
    

  def main(args: Array[String]): Unit = {
    
    

    //1、创建StreamingContext
    val ssc = new StreamingContext(new SparkConf().setAppName("output").setMaster("local[4]"),Seconds(5))
    ssc.sparkContext.setLogLevel("error")

    //2、通过socket读取数据
    val ds = ssc.socketTextStream("hadoop102",9999)

    val ds2 = ds.flatMap(_.split(" "))
      .map((_,1))
      .reduceByKey(_+_)

    //3、保存数据
    //本身API
    //ds2.saveAsTextFiles("output/streamoutput")

    ds2.print()
    //数据存储在mysql上
    ds2.foreachRDD(rdd=>{
    
    

      //对该rdd的整个批次进行处理，不是对单个元素进行处理
      rdd.foreachPartition(x=>{
    
    
 		//连接的相关配置不能在Partitions之外，
        //由于每个executor都要执行该程序，所以连接不能写在Driver层面（序列化）
        var connect:Connection = null
        var statement:PreparedStatement = null

        try{
    
    
        //配置连接
          connect = DriverManager.getConnection("jdbc:mysql://hadoop102:3306/test","root","root123")
          //使用preparestatement  1、参数可调，2、可以防止sql注入，3、编译缓存，执行快
          statement = connect.prepareStatement("insert into wordcount values(?,?)")

          //遍历rdd中的数据，将数据保存在mysql上
          x.foreach(y=>{
    
    
            statement.setString(1,y._1)
            statement.setInt(2,y._2)

            //提交数据
            statement.executeUpdate()
          })
        }catch{
    
    
          case e :Exception=>{
    
    
			//此处可以回滚数据
          }
        }finally{
    
    
        //关流
          if(connect != null)
            connect.close()
          if(statement != null)
            statement.close()
        }
      })
    })

    //停止
    ssc.start()

    //阻塞
    ssc.awaitTermination()
  }
}

猜你喜欢

转载自blog.csdn.net/qq_38705144/article/details/113860765

SparkStreaming保存数据至MySQL

Java与SparkStreaming的Socket通信，结果保存至mysql

SparkStreaming《三》读取kafka数据，增量保存在Mysql里

爬取数据保存至mysql数据库

pandas数据保存至Mysql数据库

SparkStreaming版本的wordcount(updatestateByKey)保存在mysql

Mysql打包及写入数据,读取及保存至xls文档中

Tomcat session保存至MySQL

SparkStreaming消费Kafka中的数据使用zookeeper和MySQL保存偏移量的两种方式

SparkStreaming怎么保存数据到关系型数据库

TCP服务器接收数据保存至MYSQL数据库（Ubuntu平台）

SparkStreaming foreachPartition实现输出数据到MYSQL

【数据库】利用python的pandas库读取csv文件保存至mysql

使用python的pandas库读取csv文件保存至mysql数据库

Golang保存PostgreSQL数据至结构

kafka生成avro格式数据，sparkstreaming消费avro格式，且手动维护偏移量保存到mysql中

mapreduce写数据至mysql

spark处理数据至mysql

把SparkStreaming版本的wordcount写入mysql数据库

mysql保存更新数据

mysql 保存list数据

获取某东的里的信息，并保存至csv,mysql(类)

Scrapy中将数据保存至数据库

scrapy使用Pipeline保存数据至本地遇到的问题

c#保存图片至SQL数据库

【JMeter】将结果树中的数据保存至本地

bat 命令屏幕截图并保存至sql数据库

Jmeter：如何将响应数据保存至本地

大数据之sparkStreaming（一）：sparkStreaming概述、SparkStreaming的组件

大数据-SparkStreaming

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)