Kafka学习笔记 --- Kafka是如何实现高吞吐率的？

Kafka的高吞吐率是一个使用起来很不错的性能，其中有如下几点原因：

一、Broker NIO异步消息处理，实现了IO线程与业务线程分离

Kafka的网络通信模型是基于NIO的Reactor多线程模型来设计的，这里先引入Kafka源码中注释。

An NIO socket server. The threading model is

1 Acceptor thread that handles new connections.

Acceptor has N Processor threads that each have their own selector and read requests from sockets.

M Handler threads that handle requests and produce responses back to the processor threads for writing.

看到代码中的注释信息可以知道，Kafka的网络通信模型，主要采用了1（1个Acceptor线程）+ N（N个Processor线程）+ M（M个业务处理线程）。

可以看出Kafka的Broker NIO异步并发处理消息，实现了IO线程异步并发处理消息的机制；大大提升的数据的吞吐量。

下面表格列举了一些：

线程数	线程名	线程具体说明
1	kafka-socket-acceptor_%x	Acceptor线程，负责监听Client端发起的请求
N	kafka-network-thread_%d	Processor线程，负责对Socket进行读写
M	kafka-request-handler-_%d	Worker线程，处理具体的业务逻辑并生成Response返回

Kafka的完整通信框架如下：

梳理一下上面的几个重要概念：

Acceptor: 1个接收线程，负责监听新的连接请求，同时注册OP_ACCEPT 事件，将新的连接按照“round robin”方式交给对应的Processor线程处理。
Processor: N个处理器线程，其中每个Processor都有自己的selector，它会向Acceptor分配的SocketChannel注册相应的OP_READ事件，N的大小由“num.networker.threads”决定；
KafkaRequestHandler: M个请求处理线程，包含在线程池-KafkaRequestHandlerPool内部，从RequestChannel全局请求队列RequestQueue中获取了请求数据并交给KafkaApis处理，M的大小由“num.io.threads”决定；
RequestChannel：其为Kafka服务端的请求通道，该数据结构包含了一个全局的请求队列RequestQueue和多个Processor处理器相对应的响应队列ResponseQueue，提供给Processor与请求处理线程kafkaRequestHandler和KafkaApis交换数据的地方。
NetworkClient：其底层是对Java Nio的封装，位于Kafka的网络接口层。Kafka消息生产者对象-KafkaProducer的send方法主要是调用NetWorkClient完成消息发送；
SocketServer：其实一个NIO的服务，他同时启动一个Acceptor接收线程和多个Processor处理线程。提供了一种典型的Reactor多线程模式，将接收客户端请求和处理请求相分离。
KafkaServer: 代表一个Kafka Broker的实例；其startup方法为实例启动的入口；
KafkaApis: kafka的业务逻辑处理Api，负责处理不同类型的请求；比如说“发送消息”、“获取消息偏移量-offset”和“处理心跳请求”等；