Generar datos acumulativos, incluidos datos históricos

Others 2021-04-02 00:02:57 views: null

Generar datos acumulativos, incluidos los registros históricos

1. Utilice el operador updateStateByKey para acumular registros históricos
- Utilice streamingContext.chekcpoint para almacenar en caché datos históricos
2. Implementación del código

1. Utilice el operador updateStateByKey para acumular registros históricos

Utilice streamingContext.chekcpoint para almacenar en caché datos históricos

2. Implementación del código

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.dstream.DStream

object sparkStreaming02 {



    //todo  定义方法将历史结果累加
    def updateFunc(inputSum: Seq[Int], resultSum: Option[Int]): Option[Int] = {
      val finalResult = inputSum.sum + resultSum.getOrElse(0)

      Option(finalResult)
    }

    def main(args: Array[String]): Unit = {
      //创建函数，使用update
      /**
        * 两个参数
        * Seq    传入的值
        * Option  将历史数据保留下来
        * 返回值低optain
        */
      val sparkContext = new SparkContext(new SparkConf().setAppName("hdfsStreaming").setMaster("local[4]"))
      sparkContext.setLogLevel("WARN")
      val streamingContext = new StreamingContext(sparkContext, Seconds(5))

      val streaming = streamingContext.textFileStream("hdfs://node01:8020/sparkStreaming")
      //将历史数据保存在某个目录下
      streamingContext.checkpoint("./check_point")

      val finalkey: DStream[(String, Int)] = streaming.flatMap(_.split(" ")).map((_, 1)).updateStateByKey(updateFunc)
      // 将结果打印
      finalkey.print()

      streamingContext.start()

      streamingContext.awaitTermination()
    }
}

Supongo que te gusta

Origin blog.csdn.net/weixin_44429965/article/details/107416111

Generar datos acumulativos, incluidos datos históricos

Generar cuantiles históricos para una columna de datos

Limpieza de datos históricos de Elasticsearch

[QMT]09-Descargar datos de mercado históricos a local

Cómo camunda limpia o archiva datos históricos

Todo el proceso de uso de datos históricos para realizar pronósticos comerciales.

[Elasticsearch] ¿Cómo elimina Elasticsearch físicamente los datos históricos de un período determinado?

Productos secos 丨 Tutorial de reproducción de datos históricos de DolphinDB

python3 usa el cliente MT5 para descargar datos históricos

Esquema de migración de tablas de datos históricos [basado en procedimientos almacenados de Oracle]

Generar datos aleatorios: base de datos de falsificador

Cómo generar eficientemente millones de datos

Visualización de datos, parte 12: configuración de PowerDesigner para generar decenas de millones de datos y generar datos

MSSQL especifica el delimitador para generar un conjunto de datos

[Django] Use itsdangerous para cifrar datos json para generar token

Use numpy para generar datos en un rango específico

Script de base de datos para generar campos POJO

Generar una permutación de las pandas trama de datos

Visualización de datos, parte 11: PowerDesigner conecta mysql para generar decenas de millones de datos

generar el informe en dajngo con los datos extraídos de la base de datos

Use DBCHM para generar documentos de datos a partir de datos de sqlserver

Construcción del entorno Java ee (incluidos eclipse, servidor, base de datos)

HTML y JavaScript D3 para dibujar un gráfico circular ordinario (datos no incluidos)

Estructuras de datos y algoritmos: pilas secuenciales y operaciones básicas (incluidos push y pop)

La visualización de datos y análisis usando los antecedentes históricos relevantes Sub-19 COVID la caída del mercado de valores de EE.UU.

Utilice Python para obtener datos históricos de acciones para facilitar el análisis cuantitativo y las pruebas retrospectivas de estrategias.

Datos de precios de acciones de empresas que cotizan en bolsa (incluidos datos de sincronicidad y caída anual del precio de las acciones)

[Bicicleta de autoequilibrio de rueda Momentum] STM32_PID (código abierto, incluidos datos de hardware)

Tutorial detallado de C# sobre cómo conectarse a la base de datos Mysql (con Mysql y Navicat incluidos)

Script de shell para generar tablas de bases de datos o bases de datos en lotes (aplicable a sub-bases de datos y subtablas)

Recomendado

Clasificación

Diario

Más

2024-05-17(4)

2024-05-16(22)

2024-05-15(5)

2024-05-14(10)

2024-05-13(7)

2024-05-12(22)

2024-05-11(31)

2024-05-10(32)

2024-05-09(31)

2024-05-08(18)