Kafka数据写入流程

执行流程：

Kafka数据消费流程

在所有消费队列当中，在消费数据的流程分为两种：推模式（push）、拉模式（pull）

推模式（push）：消息队列记录所有的消费的状态，某一条消息如果被标记为已消费，则消费者是不能再对它进行消费的

拉模式（pull）：就是消费者自己记录消费状态，每个消费者互相独立地顺序拉取数据

执行流程：

在这里插入图片描述

生产者通过分区的 leader 写入数据后，所有在 ISR 中 follower 都会从 leader 中复制数据，这样，可以确保即使 leader 崩溃了，其他的follower的数据仍然是可用的。

生产者连接leader写入数据时，可以通过ACK机制来确保数据已经成功写入。ACK机制有三个可选配置。
- 配置ACK响应要求为 -1/all 时 —— 表示所有的节点都收到数据（leader和follower）都接收到数据。
- 配置ACK响应要求为 1 时 —— 表示leader收到数据（默认配置）
- 3.配置ACK影响要求为 0 时 —— 生产者只负责发送数据，不关心数据是否丢失（这种情况可能会产生数据丢失，但性能是最好的）
生产者可以采用同步和异步两种方式发送数据
- 同步：发送一批数据给kafka后，等待kafka返回结果后再执行下一个语句。
- 异步：发送一批数据给kafka，只是提供一个回调函数。

说明：如果 broker 迟迟不给 ack，而 buﬀer 又满了，开发者可以设置是否直接清空 buﬀer 中的数据

在消费者消费数据的时候，只要每个消费者记录好oﬀset值即可，就能保证数据不丢失。