Flink入门示例——wordCount(二) - 代码天地

Flink入门示例——wordCount(二)

其他 2018-06-05 16:01:15 阅读次数: 0

说明（批处理）

读取HDFS数据
将处理结果写入HDFS

代码示例

package com.test

import org.apache.flink.api.scala._
import org.apache.flink.core.fs.FileSystem.WriteMode

/**
  * 读取hdfs数据，把处理结果结果再写入HDFS
  */
object WordCountBatch{

  /**
    * main函数传递的参数
    * hdfs://artemis-02:9000/tmp/lvxw/tmp/logs  hdfs://artemis-02:9000//tmp/lvxw/tmp/out
    * @param args
    */
  def main(args: Array[String]): Unit = {
    if(args.length!=2){
      println(s"${this.getClass.getSimpleName} must be two param:inputDir outputDir" )
      System.exit(1)
    }

    // 在window环境下，以hadoop身份远程放完HDFS
    System.setProperty("HADOOP_USER_NAME","hadoop")
    val Array(inputDir,outputDir) = args

    val env = ExecutionEnvironment.getExecutionEnvironment

    val text = env.readTextFile(inputDir)

    val result = text.flatMap ( _.split("\\s"))
      .map ((_, 1))
      .groupBy(0)
      .sum(1)

    result.setParallelism(2).writeAsCsv(outputDir,"\n",",",WriteMode.OVERWRITE)
    env.execute(this.getClass.getSimpleName)

  }
}

猜你喜欢

转载自blog.csdn.net/believe2017slwx/article/details/79976211

Flink入门示例——wordCount(二)

Flink入门示例——wordCount(一)

Flink基础（二）：WordCount入门

Flink快速入门wordcount示例（scala版）

Flink入门wordCount

【Flink】DataStream入门：WordCount

Flink——入门WordCount程序

flink的入门案例之wordcount

【Flink入门】Flink流处理WordCount

【Flink入门】Flink离线批处理WordCount

Python Hadoop的Wordcount入门示例

Flink系列（2）：从零搭建Flink环境及WordCount示例

Flink 简单入门示例

7.3 WordCount示例编写（二）

flink的wordcount

flink wordcount

Apache Flink 入门示例demo

Flink笔记(四)：Java 编写Flink实时任务(WordCount 示例)

Flink编程入门（二）

Flink（二）快速上手之wordCount(java)

【flink】flink实现wordCount(java)

26、Flink 的SQL之概览与入门示例

Flink入门（二）——Flink架构介绍

Flink详细笔记(四) Flink实时任务入门程序WordCount

第一天：什么是Flink、WordCount入门、Flink安装、并行度

第一天：什么是Flink、WordCount入门、Flink安装、并行度

Flink WordCount实例讲解

Flink之WordCount

flink batch wordcount

从WordCount看Flink（1）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)