手撕Dubbo源码,彻底理解RPC原理

在《服务治理篇-应用架构的演变》中提到在分布式服务架构中,用于提高业务复用及整合的分布式服务框架(RPC)是关键。Dubbo是其中的典型代表。

今天咱们就来手撕Dubbo源码,来达到彻底了解其本质的目的。

Dubbo怎样实现远程过程通信

手撕代码之前咱们来做一个宏观上的认知。

831d580f6493afd044cbb796feca217a.png

上面是Dubbo的部署架构。注册中心、配置中心、元数据中心这三大中心化组件的各自的职责、工作方式如下:

  • 注册中心。协调 Consumer 与 Provider 之间的地址注册与发现

  • 配置中心。

    • 存储 Dubbo 启动阶段的全局配置,保证配置的跨环境共享与全局一致性

    • 负责服务治理规则(路由规则、动态配置等)的存储与推送。

  • 元数据中心。

    • 接收 Provider 上报的服务接口元数据,为 Admin 等控制台提供运维能力(如服务测试、接口文档等)

    • 作为服务发现机制的补充,提供额外的接口/方法级别配置信息的同步能力,相当于注册中心的额外扩展

以上三个中心并不是运行 Dubbo 的必要条件,用户完全可以根据自身业务情况决定只启用其中一个或多个,以达到简化部署的目的。通常情况下,所有用户都会以独立的注册中心 开始 Dubbo 服务开发,而配置中心、元数据中心则会在微服务演进的过程中逐步地按需被引入进来。

下面是Dubbo早期的架构,这个架构核心组件只包含注册中心,基本就是运行Dubbo的最简架构。而注册中心也是异步弱依赖,唯一的强依赖是4. invoke这一步。也就是RPC调用发起请求到下游的部分。

b9c4f7541ab6ec9d49cf1a33db9d4944.png

Dubbo源码-场景设定

下面来手撕Dubbo的核心源码。为了好理解,这里讲Dubbo默认的dubbo协议使用http协议做说明。

1fd6d986893a554be71fa8ff1358b6ad.png

下面的代码想达到的效果如上图,先来说说思路:

  1. 先要有服务提供者,注册到注册中心。注册中心本质上就是服务提供者的访问地址存储的地方。只是这个url不一定是http协议的地址,本质都是应用层协议地址,并没有什么不同。

  2. 服务提供者要指明一个服务的实现类。

  3. 服务提供者开启网络通信服务,将服务暴露出去。

  4. 服务消费者找到对应的服务

  5. 服务消费者发起调用

先来设计一个场景,要暴露的服务端如下:

服务的接口

9ced9afd203afa37ccc1b6f82d50b978.png

实现类

4d884be2d7e68aa4c5d1b752a0d890d5.png

以上咱们用服务提供者端核心5行代码、服务消费者端核心5行代码来实现。

Dubbo源码-服务提供者

五行代码

简单来说就是注册并暴露服务。按照这个思路咱们不难得到下面的提供端代码框架。这里面共5行有效代码,咱们一行一行来解释。

455753ce73a7fb7cd5229e1ed15e41f6.png

第一行

回到主线代码第一行有效代码,封装了一个url对象,这个是自己写的:

05d0b1b6b0b30a32f4b95c5bafbffadb.png

就是一个主机名端口的存储简单对象。

第二行

第二行有效代码作用是将url注册到远程注册中心上,咱们脑补一下注册中心的存储大概如下所示:

ac6a28c916eed4d1dd86aa1724938c7b.png

这里咱用一个map来模拟注册中心,不难得到下面的代码。

517750c008ae2f357afdf3ea772dcef9.png

save是写文件来模拟的,这块不是重点,为了完整性简单提一下。

3ca0075ec44781d1a6df26c6d3565c20.png

第三行

第三行有效代码作用是指明接口对应的实现类,这个实现时也使用map数据结构。本质上就是一个存取。

050086a5967e292a0bf33e50977246f4.png

第四行

第四行有效代码是获取协议。作为一个框架来说需要具有多协议的支持,这里做了一个简单的实现。

19fdb0363549debfec99afce1a6325a1.png

协议的接口规定了两个动作,一个是启动时做的事情,一个是发送时做的事情。

06afbccd15542d61b3f89bfdada31300.png

第五行

先不着急看实现,先回到主线代码第五行。第五行就是把url传入后调用协议的start。这时候咱们来看启动方法的实现:

ed94b53b7079b665d519040625bd1e88.png

就是启动了一个httpServer。咱们来看httpServer.start的具体实现。这里面就是启动了一个tomcat。关键点是加了一个DispatcherServlet,并对所有的请求进行拦截处理。重点我用红框标出来了

c8d081a3d5b7ce0cd88f5d2538a3f1a9.png

这里本质上说明了web容器和servlet的核心作用。web容器主要是负责网络通信,servlet是java应用内部路由分发。咱们来看看路由分发是怎么做的:

4e848e70f87c65bdfc37f16af66dc37c.png

咱们来分析一下HttpServerHandler.handler方法是怎么实现。分三步:

9eea45a37144de1a989528143037205e.png

第一步,解析请求输入流。

第二步,解析出要调用的接口,从本地注册缓存中获取实现类。

第三步,利用java反射机制将解释出的请求参数传入实现类发起真正调用。

以上就完成了服务暴露的整个过程。

Dubbo源码-服务消费者

五行代码

客户端调用的整个过程比较简单,分成两步:

  1.  通过代理找到实现类

  2. 发起调用

929ab7415d251d001e3e18ed8755f3a4.png

关键逻辑就是代理如何实现:

43129375b84c5adc220efa3f7916ea7c.png

第一行

第一行有效代码:封装Invacation对象,将接口名、方法名、方法参数传入。

1853bc22c85186a1e50dc14076ec713f.png

第二行

第二行有效代码:从注册中心获取url列表

第三行

第三行代码,因为获取到的是url列表,怎么选择发往哪个呢?这里采用的是随机算法决定发往的地址,这也是dubbo默认的地址选择策略。

4e6016931d09ee384a5304631671a645.png

第四行

第四行是获取协议,在服务提供端介绍过了,直接往下。

第五行

第五行是通过协议将invacation对象发送到url上。

e187417b9e922b44bef779158efbb393.png

看看httpProtocal内部是怎么实现的。

3f10204d1adcb2936ca2deda1b2cbafb.png

内部很简单,就是调用httpClient把请求发出去。虽然这个httpClient是自己写的,但是实际上功能和开源的那个差不多。咱们简单看一下就好:

004aa7ac1cab66d322a95feeaffc2324.png

总结

在《mybatis的本质和原理》中,我手撕了一个简易却包含mybatis核心的代码,来探究mybatis的本质原理。这一篇呢,我手撕了一个Dubbo的源码,是不是也没有那么难。

再来回顾一下今天讲述的代码完整链路:

e8356b6f4e38e17c4f931016a885d018.png

服务提供者端将将接口注册到注册中心,并指明对应的实现类。通过tomcat、netty等实现网络通信,将服务暴露出去。内部使用servlet等实现路由在收到消费端请求时找到对应的实现类。

服务消费者使用从注册中心获取url列表,使用随机数等算法找到一个url,将参数、方法名当做http等协议的请求请求参数发起调用。

现在大家闭上眼睛想一想,Dubbo框架的核心原理是不是了然于胸了~

编程一生

因为公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。

PDCA方法论,检查自己是否错过更新:每周三晚上8点左右,我都会更新文章,如果你没有收到,记得点开【编程一生】公众号找一下(*^▽^*)

猜你喜欢

转载自blog.csdn.net/xiexiaojing/article/details/123469545