（三）从0开始写框架—可靠消息事务最终一致性

回顾

上一篇文章我们说到，各种分布式事务解决方案的特点，其中最后提到了可靠消息事务最终一致性这种解决方案，而我们这篇文章的标题也是它，没错，我们接下来要详细的分析该解决方案的实现细节了，上一篇文章在介绍该解决方案时，已经说了那个执行流程分析图，仅仅只是一个粗略图而已，实际上，可靠消息事务最终一致性的设计是非常复杂的。那么为什么要花那么多时间来详细分析它的实现细节呢？原因是接下来我们开发的这个分布式事务框架，就是使用可靠消息事务最终一致性的方案，选择它的理由很简单，就是因为它比较复杂，所以实现的过程中，能学到的技术和得到的锻炼比较多。

总体设计

先来看看以下这张设计图：

总体设计流程图

这张设计图是在上一章的执行流程基础上，再补充了一些细节，实际上，要完成可靠消息最终一致性，并不是仅仅依靠消息队列就行了，还需要很多其他组件共同协作，这些组件在以不修改业务方法的前提下，通过组件或者扩展的方式整合到项目中，具有可插拔性，这样的话，才能做到对业务项目的侵入性低的目的。
那么通过上述的总体设计流程图，我们可以提取出以下几个组件：1、拦截器组件（Interceptor），2、事务协调组件（Coordinator），3、事务日志存储组件（Repository），4、可靠消息组件（MQ），5、补偿调用组件（Invoker），6、定时器组件（Scheduler），7、初始化组件（Initiator）。接下来，我们详细的看看，每一个组件是什么，做什么，并且它们之间如何协调工作的。
注意：以下所涉及的代码不是真正的实现，而是伪代码

1、拦截器组件（Interceptor）

通过设计图的分析，我们可以知道，有两个地方需要拦截的，一个是在发起RPC请求时，需要对请求进行拦截，一个是RPC请求到达了远程目的方法后，执行方法前的拦截。

发起RPC请求的拦截
在发起RPC请求的拦截器中，我们需要告诉事务协调者，自己的角色是事务发起者的角色，这一步是至关重要的，因为一个事务发起者需要保存这多个事务参与者的信息，举个例子：转账（transfer）业务方法开启了分布式事务，并且transfer方法中有两个远程方法，分别是扣钱（decrease）和加钱（augment）。那transfer就是事务发起者，decrease和augment就是事务参与者。
transfer在分别调用decrease和augment者两个远程方法时，先进入了拦截器，把decrease和augment这两个事务参与者的信息添加到transfer这个事务发起者中，也就是我们常说的一对多关系。
在执行完了transfer方法后，整个transfer这个事务发起者下有多少个事务参与者都添加完毕了，接下来就把自己的这个事务发起者角色告诉事务协调者，到这里，发起RPC请求的拦截器做的事情就结束，接下来就是事务协调者做的事情了，我们后面在来讲事务协调者。结合以下分析图理解：

发起请求拦截分析图
执行业务方法前的拦截
跟发起RPC请求的拦截类似，在RPC请求到达了目的方法后，开始执行方法，但在执行方法前，我们还需要做一些事情，就是把自己作为事务参与者的角色告知事务协调者，还是以拦截器的形式做这些事情，但是拦截器又如何知道自己将要执行的业务方法就是事务参与者呢？这就要回到RPC请求上了：transfer远程RPC调用decrease和augment时，需要给这两个地址追加一个参数，该参数具体是什么东西没有关系，只要能知道事务发起者是谁就行了（暂且我们叫该参数为transactionId），那么decrease和augment所在的过滤器获取RPC参数名为transactionId的值，发现有值，那就把自己确定问事务参与者，并且通过transactionId的值知道，自己所属的事务发起者是谁。结合以下分析图理解：

执行方法拦截分析图

2、事务协调组件（Coordinator）

事务协调者是所有分布式事务解决方案都会有的一个核心处理器，它作为各个分布在不同JVM中的本地事务间接通讯的桥梁。在可靠消息事务最终一致性的解决方案中，它主要负责事务的发起、事务的参与、事务的提交、事务出错处理、发送事务MQ消息等，凡是涉及到事务的生命周期操作，都经过它做统筹处理。它直接操作下一个要讲解的组件—事务日志存储组件（Repository）。

3、事务日志存储组件（Repository）

事务日志存储组件主要负责储存事务日志的操作，事务日志的核心信息为：事务id、事务类和方法，事务状态、事务角色、事务参与者集合。所以针对事务的操作非常多，会涉及到多线程和大并发的问题，所以这里到时候需要考虑线程安全和支持大并发的设计。结合以下分析图理解：

事务协调和事务日志存储分析图

4、可靠消息组件（MQ）

可靠消息组件顾名思义，就是发送MQ消息的，而消息体就是：事务发起者中的各个事务参与者详细信息，还是以我们上面的例子说明：transfer在分别调用decrease和augment者两个远程方法，transfer是事务发起者，decrease和augment是transfer的事务参与者，在transfer方法执行完后，得到一个事务信息，该信息传给了事务协调者，事务协调者会遍历该事务中的参与者列表，每遍历到一个事务参与者，就往该参与者所监听的MQ消息地点发送消息，消息体的核心信息为：“参与者的业务方法”。这样的话参与者如果在执行业务的过程中报错了，还可以到MQ中获取消息，重新执行业务方法。结合以下分析图理解（为了分析图更直观，删减了一些流程）：

发送消息和监听消息

5、补偿调用组件（Invoker）

消息补偿组件起到的作用就是：各个事务参与者在各种异常情况下，没法正常执行业务方法，比如：事务发起者transfer调用了decrease和augment，但是augment所在的服务器宕机，导致不能接受RPC请求，这样事务就有问题了，decrease扣钱成功，augment加钱失败。这时MQ就起作用了，我们刚刚已经知道，在transfer方法执行完后，会给MQ的decrease和augment地点发送消息，消息体有个核心信息：“执行的业务方法”。那这样，augment所在的服务器重启后，马上监听到MQ的augment地点消息，然后把消息交给事务补偿调用组件（Invoker），Invoker重新调用消息体中的业务方法，完成事务补偿。同理，如果augment所在的服务器没有宕机，但却在执行业务方法的过程中报错，则MQ会新增一条消息，等着augment获取，并重新执行业务方法。那为什么报错了会自动往MQ发消息呢？这个涉及到定时器组件（Scheduler），我们下面再详细分析定时器的作用。
但这里需要特别注意的是，Invoker需要做好幂等性的操作，因为transfer方法执行完了，事务协调者就会往decrease和augment两个事务参与者监听的消息地点发送消息，所以，不管decrease和augment是否正常执行，消息都会发送出去，那问题就来了，通过RPC已经正常调用了一次，然后监听到MQ消息又调用了一次，就调用了两次了，所以事务补偿调用组件需要做好幂等性，防止业务方法执行多次。

6、定时器组件（Scheduler）

定时器组件（Scheduler）就是我们刚刚提到的一种情况的问题：服务器正常运行，能接收RPC远程调用请求，但是执行过程中报错，那这时，定时器就起作用了，定时器在项目初始化时就需要设置好。
业务方法执行报错，进入捕捉异常流程，通知事务协调者，把对应的事务日志状态修改为“错误”状态，然后定时器每隔一段时间扫描状态为“错误”的事务日志，扫描到之后，即往MQ发送消息，那接下来的流程，又回到了事务补偿的流程了。事务补偿成功后，需要把对应的事务日志状态修改为“提交”状态。结合以下分析图理解（为了分析图更直观，删减了一些流程）：

定时器执行分析

7、初始化组件（Initiator）

这一个组件就不用多说了，我们设置定时器，监听MQ的Destination，还有做一些初始化参数设置等，都是需要在这里执行。

总结

分布式事务本身就是一件非常复杂的事情，所以在设计阶段就要考虑的比较完善，这样在具体实现的时候才不会有太多问题。而通过这篇文章的讲解，已经从宏观上了解了这种“可靠消息事务最终一致性”解决方案的来龙去脉，相当于设计稿就有了。那接下来，我们就要根据这个设计稿来做具体功能的实现。在写代码实现的过程中，由于会接触到更细节的问题，这些细节又不可能在设计阶段面面俱到，所以很可能会出现具体实现与设计不一样的情况，这是正常的，只要在合理的调整范围内，大体流程上并没有改变就行了。