基于SEDA的异步框架设计与实现
四、异步框架总体设计与实现
1、框架中的stage理想结构
前文提到,基于SEDA的异步框架,一个stage的理想结构描述如下:
在这个框架的设想中,一个stage一般需要有如下几个组件:
1、D-MQ:分布式消息中间件。用做事件队列,以进行消息的传递。
2、Local-Queue:本地队列。一般是blockingQueue,用以辅助实现stage内的动态线程池。采用Local-Queue的目的在于避免数据在mq中的堆积导致mq性能下降。
3、Thread Pool:动态线程池。进行事件的并发处理。
4、Worker:事件的具体处理器
5、Stage Controller:stage的性能控制器。用以对stage的队列、资源、调度策略进行控制。
引此为框架的设计理念,于是有了如下基于SEDA的异步框架的架构设计。
2、SEDA异步框架的使用场景
该异步框架可以用来处理如下几个场景的问题:
1、系统资源监控(CPU、内存、线程池、队列)
2、外围服务交互情况(API被调用、上游服务交互、请求方等)监控
3、系统报警(服务异常、接口压力过大等)
4、基于日志和事件的数据挖掘(规则挖掘等)
5、重要业务数据切片转储(里程碑消息、核心服务交互数据等)
6、异步触发的操作(表A写完后异步写表B等)
其使用场景大致可如下图所示:
3、SEDA异步框架系统总体架构
当然,以上结构并非绝对的,如有需要,你完全可以通过自己定制bundle和bundle之间的拓扑关系,来实现各种复杂的事件处理过程。你只需要简单通 过声明bundle相关配置,即可实现任何按照你所希望的有向图去关联的bundle。框架提供给了你一个经过轻量级封装后的平台,后面的业务逻辑,就靠 开发者自己了。
4、异步框架原生态架构(Virtual Bundle)
基于上述的设计理念,最终实现的异步框架的原生态架构如下所示:
异步框架在无任何扩展的时候,其主要组件如下:
1、bundle:消息中心的核心组件。由读、处理、写三部分功能组成。同时整合开关、定时器、动态线程池等元素来支持多样化的输入和需求。bundle可以从多种数据源获取数据,并进行数据的处理。
1)开关:用以决定该bundle是否被激活。如未被激活,则该bundle将停止读取数据,同时不会在其他服务上产生该bundle对应的数据(比如在mq上生成该bundle的队列、连接、交换机等。)
2)定时器:用以指定该bundle是否定时运行。如未指定,则实时运行。
3)动态线程池:用以支持bundle以同步/异步方式调用。如未指定,则同步运行。
2、bundle decider:用以对bundle的关键指标进行决策(是否激活、时效性、同步类型等)。并同时提供健康检查。
3、Work carrier:处理数据的最小单元。
5、异步框架的AMQP实现(AMQP Bundle)
异步框架扩展的AMQP实现,其架构图如下所示:
其主要组件说明如下:
1、amqp bundle:消息中心的核心组件。由读、处理、写三部分功能组成。在整合开关、定时器、动态线程池之余,提供了配置化的订阅订阅管理以及关键行为的声明。
要声明一个bundle仅需声明对应的bean,示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> </bean>1)开关:用以决定该bundle是否被激活。如未被激活,则该bundle将停止读取数据,同时不会在其他服务上产生该bundle对应的数据(比如在 mq上生成该bundle的队列、连接、交换机等)。加上开关之后,最大的优势在于其可以更方便的支持分布式部署。对不同的部署实例设置不一样的 active设置可以完成不同stage在不同机器的启停。默认激活。我们为bundle加上开关,示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="active" value="true" /> </bean>
2)定时器:用以指定该bundle是否定时运行。默认实时运行。我们为bundle加上定时器,示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="timer" value="0/30 * * * * ?"/> </bean>
3)动态线程池:用以支持bundle内部的实际数据流处理过程以同步/异步方式调用。默认同步运行。我们为bundle加上动态线程池,示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="taskExecutor" ref="alarmCollectBundleExecutor"/> </bean> <!-- 报警信息收集器对应的动态线程池 --> <bean id="alarmCollectBundleExecutor" class="org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor"> <property name="corePoolSize" value="2" /> <property name="maxPoolSize" value="30" /> <property name="queueCapacity" value="200" /> </bean>
4)订阅发布:用以声明收集和推送信息时所需的交换机和密钥。通过支持逗号分隔的多key组合来支持多对多的上下游bundle关系。每个key的配置语 法符合rabbitmq中topic类型的exchange使用规范即可。默认采用“deimos-common”交换机。以下给出几种声明的配置:
其一:最简易配置。配置要订阅和发布的消息key即可。交换机采用默认配置。
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> </bean>
其二:声明特殊的来源和目的地的交换机:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> <property name="pubDest" value="spec1" /> <property name="subDest" value="spec2" /> </bean>5)事件队列:每个bundle默认实现一个固定格式的独立队列。可通过配置另外指定。可支持bundle监听多队列的需求。如需要特别指定一个或多个事件队列,则示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> <property name="subQueues"> <list> <ref bean="queueForLogError" /> </list> </property> </bean> <!-- error日志消息的订阅 --> <!-- 如队列的声明不采用默认配置,完整声明如下: <property name="exchangeName" value="deimos-common" /> <property name="queue" value="logQueue" /> <property name="bindingKey" value="collect.log.*" /> --> <bean id="queueForLogError" class="com.cc.deimos.satellite.bo.AmqpQueueConfig"> <property name="bindingKey" value="collect.log.error" /> </bean>
6)监听容器:按照默认配置实现,并发数可通过配置指定。bundle如需额外设定channel数量,则示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> <property name="concurrency" value="20" /> </bean>
7)关键行为。用以给发布的消息打上bundle的标签。以辅助其他bundle进行数据筛选和处理。默认以发布的key为关键行为。如需额外声明,则示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> <property name="keyAction" value="ALARM_KEY_INFO" /> </bean>
2、bundle decider:用以对bundle的关键指标进行决策(是否激活、时效性、同步类型等)。并同时提供健康检查。默认采用fix strategy decider(定参策略决策器)。可进行配置来指定所需决策器类型,示例如下:
<!-- 报警消息收集器 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> <property name="strategyDecider" value="FIXED_STRATEGY"/> </bean>
3、work carrier:处理数据的最小单元。Bundle依据决策器指示的状态同步/异步、实时/定时调用work carrier进行处理。完全对开发者透明。用户者无需关心该组件。bundle将结合decider进行调度。同时work carrier处理后的数据推送过程也对开发者透明。开发者所需要做的就是实现bundle的doWork方法,并将处理之后的数据直接return即 可。doWork方法如下所示:
@Override public Object doWork(List<DeimosSatelliteRequest> message) throws Exception{ // do somethoing with message then retrun the result; }4、exchange:rabbitmq交换机。默认所有bundle都请求“deimos-common”。可集群化。配置见上。
5、amq:采用支持amqp协议的rabbitmq。默认单机内存节点。可采用镜像队列或其他方案来进行broker、queue的集群化。
6、channel:amq信道。可启动多信道并发监听amq队列消息。支持配置化设定。配置见上。 在web/servlet容器启动之后,框架中的各个组件将被依次加载,以下给出了bundle的大致启动流程,也正是因为这个启动流程,将上述的各个组件进行串联,并开始执行各自负责的工作:
以上详细介绍了SEDA框架的AMQP实现中主要组件的作用、声明方式以及实现原理。总结一下,异步框架的AMQP实现中,bundle与bundle之间通过分布式 队列rabbitmq进行数据传递,bundle内部提供包含阻塞队列的动态线程池taskExecutor来进行数据处理,同时提供了定时器timer 来控制bundle的定时/实时调用。workcarrier作为消息处理的最小单元,其调用机制完全对用户透明。消息在bundle中的接收、处理和推 送由bundle decider组件进行管理。用户只需要简单实现doWork方法和声明bundle配置即可实现消息的处理和传递。
6、一个简单的bundle安装示例
你完全可以只按照如下几步,就可以轻松实现你每个stage: 1、继承AmqpBundle类,实现doWork方法,完成你的业务逻辑。示例如下(通用收集器demo):public class CommonAmqpCollectBundle extends SatAmqpBundle { /** * 采用并发队列。性能比阻塞队列高 */ public final ConcurrentLinkedQueue<DeimosSatelliteRequest> cacheQueue = new ConcurrentLinkedQueue<DeimosSatelliteRequest>(); @Override public Object doWork(List<DeimosSatelliteRequest> message) throws Exception { logger.info("i am now in LogWorker:" + Thread.currentThread().getName() + "message is : " + message + ". now begin to collect!"); // 此处不采用锁,因为其带来的影响很有限 cacheQueue.addAll(message); if (cacheQueue.size() < SatConstant.LOG_BATCH_SIZE) { return null; } // 进行遍历导数据 List<DeimosSatelliteRequest> list = new ArrayList<DeimosSatelliteRequest>(); for (int i = 0; i < SatConstant.LOG_BATCH_SIZE && !cacheQueue.isEmpty(); i++) { DeimosSatelliteRequest meta = cacheQueue.poll(); // 此时队列也已经为空了 if(meta == null){ break; } // 校验 if(meta.getTimestamp() == null || meta.getRealData() == null || meta.getData() == null){ logger.error("[deimos-satellite]meta param is error! meta request: " + meta); continue; } // 记录关键行为 if(meta.getData().get(SatApiConstant.KEY_ACTION) == null){ meta.getData().put(SatApiConstant.KEY_ACTION, keyAction); } list.add(meta); } // 排序 ,以时间戳为key。考虑到可能出现时间戳一致的情况,所以不能用map。考虑到如果log要push到其他平台或者服务上, // 该切片应该先保证自身有序而不能完全依赖于下一个bundle来处理 Collections.sort(list, new Comparator<DeimosSatelliteRequest>() { @Override public int compare(DeimosSatelliteRequest o1, DeimosSatelliteRequest o2) { if (o1.getTimestamp().longValue() >= o2.getTimestamp()) { return -1; } else { return 1; } } }); logger.info("[deimos-satellite]common amqp collctor prepare to push to next bundle............ key action: " + keyAction); return list; } }2、对新写的bundle类加上配置声明。以下为最轻便的写法。如果需要额外定制其他bundle参数,参照上面的相关说明,进行定制即可。
<!-- 报警消息收集器,最简易参数声明。在切分成不同stage之后没有什么需要特别关注的潜在性能瓶颈时使用 --> <bean id="alarmCollector" class="com.cc.deimos.satellite.core.collector.CommonAmqpCollectBundle"> <property name="pubKeys" value="process.alarm.*" /> <property name="subKeys" value="collect.alarm.*, collect.log.error" /> </bean>