1、线程模型基本介绍
目前存在的线程模型有:
- 传统阻塞IO服务模型;
- Reactor模式;
1.1 传统阻塞IO服务模型
(黄色框表示对象,蓝色框表示线程,白色框表示方法);
- 每个连接都需要独立的线程完成数据输入、业务处理、数据返回;
- 当并发数很大,会创建大量的线程;
- 连接创建后如果当前线程没有数据可读,线程会阻塞在read操作,造成线程资源浪费;
2、Reactor线程模式
针对传统阻塞IO的两个缺点,解决方案:
- 基于IO复用模型:多个连接共用一个阻塞对象;
- 基于线程池复用线程资源:不必为每个连接创建线程,将连接完成后的业务处理任务分配给线程进行处理,一个线程可以处理多个连接的业务;
reactor模式基本思想:IO复用结合线程池
- reactor模式:一个或者多个输入同时传递给服务处理器的模式;
服务器端程序处理传入的多个请求,将他们分派到不同的处理线程。因此又叫做dispatcher模式;
使用IO复用监听事件,收到事件后,分发给某给线程,这就是网络服务器高并发处理的关键;
reactor模式核心组成
- reactor:在一个单独的线程运行,负责监听和分发事件;
- handlers:处理程序,执行IO事件要完成的实际事件,Reactor通过调用适当的handler响应IO事件;
根据Reactor的数量和处理资源池线程的数量不同,有三种典型实现:
- 单reactor单线程;
- 单reactor多线程;
- 主从reactor多线程;
2.1 单reactor单线程
流程说明
- Reactor对象通过Select监听客户端请求事件,收到事件后通过Dispatch进行分发;
- 如果是建立连接请求事件,有cceptor通过Accept处理连接请求,创建一个handler对象处理连接完成后的后续业务处理;
- 如果不是建立连接事件,Reactor会分发调用连接对应的handler来响应;
- handler会完成Read->业务处理->Send;
优缺点
- 模型简单;
- 无法完全发挥多核CPU的性能。handler在处理某个连接上的业务时,整个进程无法处理其他连接事件;
线程意外终止或者进入死循环导致整个系统通信模块不可用,造成节点故障;
使用场景
客户端的数量有限,业务处理很迅速,比如redis在业务处理时间复杂度O(1)时;
2.2 单reactor多线程
流程说明
- Reactor对象通过select监听客户端请求事件,收到事件后,使用dispatch进行分发;
- 如果是建立连接请求事件,有cceptor通过Accept处理连接请求,创建一个handler对象处理连接完成后的后续业务处理;
- 如果不是建立连接事件,Reactor会分发调用连接对应的handler来响应;
- handler只负责响应事件,不做具体的业务处理,通过read读取数据后分发给后面的worker线程池的某个线程处理业务;
- worker线程池会分配独立线程完成真正的业务,将结果返回给handler;
- handler收到响应后,通过send返回给client;
优缺点
- 可以充分的利用多核CPU的处理能力;
- 缺点:多线程数据共享和访问比较复杂,reactor需要处理所有事件的监听和响应,容易出现性能瓶颈;
2.3 主从reactor多线程
流程说明
- Reactor主线程 MainReactor对象通过select监听连接事件,收到事件后,通过Acceptor处理连接事件,之后将连接分配给SubReactor;
- subreactor将连接加入到连接队列进行监听,并创建handler处理各种事件;
- 当有新事件发生后,subreactor会调用对应的handler处理;
- handler通过read读取数据后分发给后面的worker线程池的某个线程处理业务;
- worker线程池会分配独立线程完成真正的业务,将结果返回给handler;
- handler收到响应后,通过send返回给client;
MainReactor可以对应多个Reactor子线程;
优缺点
-
父线程与子线程的数据交互简单职责明确,父线程只需要接收新连接,子线程完成后续的业务处理。
-
父线程与子线程的数据交互简单,Reactor 主线程只需要把新连接传给子线程,子线程无需返回数据。
-
编程复杂度较高
这种模型在许多项目中广泛使用,包括 Nginx 主从 Reactor 多进程模型,Memcached 主从多线程,Netty 主从多线程模型的支持
3、总结
- 单 Reactor 单线程,前台接待员和服务员是同一个人,全程为顾客服
- 单 Reactor 多线程,1 个前台接待员,多个服务员,接待员只负责接待
- 主从 Reactor 多线程,多个前台接待员,多个服务生
Reactor 模式具有如下的优点:
- 响应快,不必为单个同步时间所阻塞,虽然 Reactor 本身依然是同步的
- 可以最大程度的避免复杂的多线程及同步问题,并且避免了多线程/进程的切换开销
- 扩展性好,可以方便的通过增加 Reactor 实例个数来充分利用 CPU 资源
- 复用性好,Reactor 模型本身与具体事件处理逻辑无关,具有很高的复用性