Flink DataSet API 之 Accumulators & Counters(累加器) - 代码天地

Flink DataSet API 之 Accumulators & Counters(累加器)

编程语言 2019-01-12 22:47:48 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Jiny_li/article/details/86360484

基本介绍

1、Accumulator即累加器，与Mapreduce counter的应用场景差不多，都能很好地观察task在运行期间的数据变化。可以在Flink job任务中的算子函数中操作累加器，但是只能在任务执行结束之后才能获得累加器的最终结果。

2、Counter是一个具体的累加器(Accumulator)实现。例如：IntCounter, LongCounter 和 DoubleCounter

用法

1：创建累加器： private IntCounter numLines = new IntCounter();

2：注册累加器： getRuntimeContext().addAccumulator("num-lines", this.numLines);

3：使用累加器： this.numLines.add(1);

4：获取累加器的结果： myJobExecutionResult.getAccumulatorResult("num-lines")

使用Demo

import org.apache.flink.api.common.accumulators.IntCounter
import org.apache.flink.api.common.functions.RichMapFunction
import org.apache.flink.api.scala.ExecutionEnvironment
import org.apache.flink.configuration.Configuration

object BatchDemoCounter {
  def main(args: Array[String]): Unit = {
    val env = ExecutionEnvironment.getExecutionEnvironment

    import org.apache.flink.api.scala._

    val data = env.fromElements("a","b","c","d")

    val res = data.map(new RichMapFunction[String, String] {
      val numLines = new IntCounter()//定义
      override def open(parameters: Configuration): Unit = {
        super.open(parameters)
        getRuntimeContext.addAccumulator("num-lines", numLines)// 注册
      }

      override def map(in: String): String = {
        this.numLines.add(1)// 使用
        in
      }
    }).setParallelism(4)
    res.writeAsText("d:/sshdata/count").setParallelism(1)
    val jobResult = env.execute("BatchDemoCounter")
    val num = jobResult.getAccumulatorResult[Int]("num-lines")// 获取
    println(num)
  }
}

猜你喜欢

转载自blog.csdn.net/Jiny_li/article/details/86360484

Flink DataSet API 之 Accumulators & Counters(累加器)

Flink与SparkStreaming之Counters& Accumulators累加器

Flink与SparkStreaming之Counters& Accumulators累加器双向应用案例实战-Flink牛刀小试

Flink DataSet API 之 Broadcast(广播变量)

Flink学习笔记(4) -- Flink Broadcast & Accumulators & Counters &Distributed Cache

Flink DataSet API

Flink DataSet DataStream API

Flink DataSet API (二) Transformation

Flink DataSet API编程指南

Flink源码分析之累加器监控

Flink之DataSet迭代计算

Flink之DataSet数据输出

Flink Dataset Api（六）广播变量

Flink Dataset Api（四）迭代操作

Flink DataSet API (三)Data Sinks

Flink DataSet API (一) Data Source

Flink入门（五）——DataSet Api编程指南

Flink学习之旅----DataSet API 开发概述

Flink_DataSet API 开发（入门案例）

【Flink】批式处理--DataSet API 开发

Spark之广播变量Broadcast Variables与计数器Accumulators

Flink 编程接口（Flink SQL Table API DataStream API 和 DataSet API Stateful Stream Process API）

Flink之DataSet转换操作（二）

Flink之DataSet转换操作（一）

Flink之DataSet数据源

spark api学习之Dataset

07_Flink累加器

Flink累加器的使用(accumulator)

Flink之EvnetTimeWindow API

Flink Dataset Api（七）分布式缓存

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)