大厂面试真题解读:Tomcat的连接器是如何设计的?

导读

为什么要学习Tomcat的设计思路,对我们这些 crud 工程师有用吗?现代背景下,我们不仅可以学到Tomcat的架构,学会从宏观上怎么去设计一个复杂系统,怎么设计顶层模块,以及模块之间关系。

Tomcat总体架构

Tomcat主要实现了2个核心功能:

  • 处理Socket连接,负责网络字节流与Request和Response对象的转化
  • 加载和管理Servlet,以及具体处理Request请求

因此Tomcat设计了两个核心组件:

  • 连接器(Connector):负责对外交流
  • 容器(Container):负责内部处理

Tomcat支持哪些I/O模型呢?

  • NIO:非阻塞I/O,采用Java NIO类库实现
  • NIO.2:异步I/O,采用JDK 7最新的NIO.2类库实现
  • APR:采用Apache可移植运行库实现,是C/C++编写的本地库

Tomcat支持哪些应用层协议呢?

  • HTTP/1.1:大部分Web应用采用的访问协议
  • AJP:用于和Web服务器集成(如Apache)
  • HTTP/2:HTTP 2.0大幅度地提升了Web性能

Service

Tomcat为支持多种I/O模型和应用层协议,一个容器可能对接多个连接器。

但单独的连接器或容器都无法对外提供服务,需组装起来才能正常工作,组装后的整体称为Service组件。

Service只是在连接器和容器外面多包了一层,把它们组装在一起。

Tomcat内可能有多个Service,通过在Tomcat中配置多个Service,可实现通过不同端口号访问同一台机器上部署的不同应用。

最顶层是Server(即一个Tomcat实例)。一个Server中有一或多个Service,一个Service中有多个连接器和一个容器。

连接器与容器之间通过标准的ServletRequest和ServletResponse通信。

连接器

连接器对Servlet容器屏蔽了协议及I/O模型的区别,处理Socket通信和应用层协议的解析,得到Servlet请求。
所以无论是HTTP、AJP,在容器中获取到的都是一个标准的ServletRequest对象。

连接器的详细功能:

  • 监听网络端口
  • 接受网络连接请求
  • 读取网络请求字节流
  • 根据具体应用层协议(HTTP/AJP)解析字节流,生成统一的Tomcat Request对象
  • 将Tomcat Request对象转成标准的ServletRequest
  • 调用Servlet容器,得到ServletResponse
  • 将ServletResponse转成Tomcat Response对象
  • 将Tomcat Response转成网络字节流
  • 将响应字节流写回给浏览器

提完了需求,就需要考虑它应该有哪些子模块呢?
优秀的模块化设计应该考虑高内聚、低耦合。通过分析连接器的功能,发现连接器需要完成如下高内聚的功能:

  • 网络通信
  • 应用层协议解析
  • Tomcat Request/Response与ServletRequest/ServletResponse的转化

因此Tomcat的设计者设计了3个组件来实现这3个功能:Endpoint、Processor和Adapter。

组件之间通过抽象接口交互。这样做还有一个好处是封装变化。这是面向对象设计的精髓,将系统中经常变化的部分和稳定的部分隔离,有助于增加复用性,并降低系统耦合度。

不管网络通信I/O模型、应用层协议、浏览器端发送的请求信息如何变化,但整体处理逻辑不变:

  • Endpoint:提供字节流给Processor
  • Processor:提供Tomcat Request对象给Adapter
  • Adapter:提供ServletRequest对象给容器

如果要支持新的I/O方案、新的应用层协议,只需要实现相关具体子类,上层通用的处理逻辑不会变。

由于I/O模型和应用层协议可自由组合,比如NIO + HTTP或者NIO.2 + AJP。Tomcat的设计者将网络通信和应用层协议解析放在一起考虑,设计ProtocolHandler接口,封装这两种变化点。各种协议和通信模型的组合有相应的具体实现类。

比如:Http11NioProtocol和AjpNioProtocol

除了这些变化点,系统也存在一些相对稳定部分,因此Tomcat设计了一系列抽象基类来封装这些稳定部分,抽象基类AbstractProtocol实现了ProtocolHandler接口。每一种应用层协议有自己的抽象基类,比如AbstractAjpProtocol和AbstractHttp11Protocol,具体协议的实现类扩展了协议层抽象基类。

这样设计是为尽量将稳定的部分放到抽象基类,同时每一种I/O模型和协议的组合都有相应的具体实现类,我们在使用时可以自由选择。

连接器模块的核心组件:

  • Endpoint
  • Processor
  • Adapter

Endpoint和Processor放在一起抽象成了ProtocolHandler组件

顶层组件

ProtocolHandler组件

连接器用ProtocolHandler处理网络连接、应用层协议,包含如下重要部件

Endpoint

通信端点,即通信监听的接口,是具体的Socket接收和发送处理器,是对传输层的抽象,因此Endpoint用来实现TCP/IP协议。

Endpoint是一个接口,对应的抽象实现类是AbstractEndpoint,而AbstractEndpoint的具体子类,比如在NioEndpoint和Nio2Endpoint中,有两个重要的子组件:Acceptor和SocketProcessor。

Acceptor

用于监听Socket连接请求。SocketProcessor用于处理接收到的Socket请求,它实现Runnable接口,在run方法里调用协议处理组件Processor进行处理。

为了提高处理能力,SocketProcessor被提交到线程池来执行。而这个线程池叫作执行器(Executor)。

Processor

Processor用来实现应用层的HTTP协议,接收来自Endpoint的Socket,读取字节流解析成Tomcat Request和Response对象,并通过Adapter将其提交到容器处理。

Processor是一个接口,定义了请求的处理等方法。它的抽象实现类AbstractProcessor对一些协议共有的属性进行封装,没有对方法进行实现。具体的实现有AjpProcessor、Http11Processor等,这些具体实现类实现了特定协议的解析方法和请求处理方式。

连接器的组件图:

Endpoint接收到Socket连接后,生成一个SocketProcessor任务提交到线程池处理,SocketProcessor的run方法会调用Processor组件去解析应用层协议,Processor通过解析生成Request对象后,会调用Adapter的Service方法。

一个连接器对应一个监听端口,比如一扇门,一个web应用是一个业务部门,进了这个门后你可以到各个业务部门去办事。

Tomcat配置的并发数是endpoint里那个线程池。

Adapter

由于协议不同,客户端发过来的请求信息也不尽相同,Tomcat定义了自己的Request类来“存放”这些请求信息。

ProtocolHandler接口负责解析请求并生成Tomcat Request类,但这个Request对象不是标准ServletRequest,不能用Tomcat Request作为参数调用容器。

于是Tomcat引入CoyoteAdapter,连接器调用CoyoteAdapter的sevice方法,传入Tomcat Request对象,CoyoteAdapter负责将Tomcat Request转成ServletRequest,再调用容器的service方法。

连接器用ProtocolHandler接口来封装通信协议和I/O模型的差异,ProtocolHandler内部又分为Endpoint和Processor模块,Endpoint负责底层Socket通信,Processor负责应用层协议解析。连接器通过适配器Adapter调用容器。

为什么要多一层adapter?

在processor直接转换为容器的servletrequest和servletresponse是否更好,为何先转化为Tomcat的request和response,再用adapter做一层转换消耗性能?

若连接器直接创建ServletRequest、ServletResponse,就和Servlet协议耦合,连接器尽量保持独立性,它不一定要跟Servlet容器工作。

对象转化的性能消耗还是比较少的,Tomcat对HTTP请求体采取了延迟解析策略,即TomcatRequest对象转化成ServletRequest时,请求体的内容都还没读取,直到容器处理这个请求的时候才读取。

Adapter一层使用的是适配器设计模式,好处是当容器版本升级只修改Adaper组件适配到新版本容器就可以了,protocal handler组件代码不需要改动。

FAQ

如何设计复杂系统?

首先要分析需求,根据高内聚低耦合的原则确定子模块,然后找出子模块中的变化点和不变点,用接口和抽象基类去封装不变点,在抽象基类中定义模板方法,让子类自行实现抽象方法,也就是具体子类去实现变化点。

tomcat和netty有什么区别呢?为什么netty常常用做底层通讯模块,而tomcat作为web容器呢?

可以把Netty理解成Tomcat中的连接器,它们都负责网络通信,都利用了NIO。但Netty素以高性能高并发著称,为什么Tomcat不把连接器替换成Netty呢?

Tomcat的连接器性能已经足够好了,同样是Java NIO编程,底层原理差不多

Tomcat作为Web容器,需要考虑到Servlet规范,Servlet规范规定了对HTTP Body的读写是阻塞的,因此即使用到了Netty,也不能充分发挥它的优势。所以Netty一般用在非HTTP协议和Servlet的场景下。

猜你喜欢

转载自blog.csdn.net/duan18888/article/details/124861453