Flink消费kafka数据案例

package com.suning.flink.bdl;

import org.apache.flink.api.common.serialization.SimpleStringSchema;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.connectors.kafka.FlinkKafkaConsumer;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import java.util.Properties;

/**
 * flink接入kafka，从kafka中消费数据
 */
public class Testkafka {
    private static final Logger LOGGER = LoggerFactory.getLogger(Testkafka.class);
    public static void main(String[] args) throws Exception {
        /**
         * 实现步骤：
         * 1）初始化flink流处理的运行环境
         * 2）创建数据源
         * 3）处理数据
         * 4）打印输出
         * 5）启动作业
         */

       //TODO 1）初始化flink流处理的运行环境
       StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
       //TODO 2）创建数据源
       Properties properties = new Properties();
       //封装kafka的连接地址
       properties.setProperty("bootstrap.servers", "kafkasitoltp01broker01.cnsuning.com:9092,kafkasitoltp01broker02.cnsuning.com:9092,kafkasitoltp01broker03.cnsuning.com:9092");
       //指定消费者id
       properties.setProperty("group.id", "lma_warehouse_appointment_control_g");
        //设置动态监测分区或者主题的变化
        properties.setProperty("flink.partition-discovery.interval-millis", "30000");
       //定义kafka的消费者实例
       FlinkKafkaConsumer<String> kafkaConsumer = new FlinkKafkaConsumer<>("lma_warehouse_appointment_control_t", new SimpleStringSchema(), properties);

       //读取kafka数据的时候需要指定消费策略，如果不指定会使用auto.offset.reset设置
       kafkaConsumer.setStartFromEarliest();// 从头开始消费
        /**
         * 可以使用以下两种方式指定消费策略：
         * 1：props.setProperty("auto.offset.reset", "earliest");
         * 2：kafkaConsumer.setStartFromEarliest();
         *
         * 如:
         *   kafkaConsumer.setStartFromEarliest();       // 从头开始消费
         *   kafkaConsumer.setStartFromTimestamp(System.currentTimeMillis()); // 从指定的时间戳开始消费
         *   kafkaConsumer.setStartFromGroupOffsets();   // 从group 中记录的offset开始消费
         *   kafkaConsumer.setStartFromLatest();         // 以及指定每个从某个topic的某个分区的某个offset开始消费
         *   Map<KafkaTopicPartition, Long> offsets = new HashMap<>();
         *   offsets.put(new KafkaTopicPartition(topic, 0), 0L);
         *   offsets.put(new KafkaTopicPartition(topic, 1), 0L);
         *   offsets.put(new KafkaTopicPartition(topic, 2), 0L);
         *   kafkaConsumer.setStartFromSpecificOffsets(offsets);
         *
         *   如上, 就指定了topic的分区0,1,2 都分别从offset 0 开始消费.
         */
       DataStreamSource<String> dataStreamSource = env.addSource(kafkaConsumer);

       //TODO 3）处理数据


       //TODO 4）打印输出
       dataStreamSource.print();

       //TODO 5）启动作业
       env.execute();
    }


    }
Flink消费kafka数据案例

猜你喜欢