规范分别从上线前,上线中,上线后三个阶段:
上线前:
1、 确保测试环境及预发布环境测试通过,才允许上线;
2、 提前知晓关联系统负责人关注各自系统(以咚咚或邮件的方式);
3、 提前梳理好本次上线需要修改的配置文件等信息,提醒开发进行配置备份;
4、 提前准备好本次上线验证所需的测试数据,线上测试商品必须打测试标识,且在测试分类下(必须使用白名单下单);
上线中:
1、 测试和开发必须结对上线;
2、 监督开发需先下线机器,再进行任务发布;
3、 单台机器验证通过后,才允许开发对该分组下的其他机器进行任务发布;
4、 以分组为单位,依次进行上线操作;
5、 上线功能着重测试,关联的核心系统和业务场景必须回归测试;
6、 线上功能验证的同时,提醒并监督开发实时关注后台日志及系统情况;
7、 配置文件修改上线,必须监督至少两名开发人员一起检查修改配置信息;
8、 实时关注后台日志,若出现报错、异常等情况,立即通知相关开发人员迅速定位问题;
9、 实时监控risk数据信息,若出现业务量下降等情况,立即通知相关开发人员迅速定位问题;
10、 重点关注UMP关键监控点的调用次数、可用率、性能、端口存活等情况;
11、 重点关注JSF接口是否正常;
12、 若涉及JMQ,则重点关注消息是否有积压、重试等情况;
13、 若上线导致重大影响,需要求开发立即进行回滚;
上线后:
1、 进行整体系统流程验证;
2、 持续关注UMP、Risk、JSF、JMQ、后台日志等相关监控系统信息(至少15分钟),各系统监控信息均保持平稳,则代表上线成功;
3、 邮件回复或通报本次成功上线的内容;
4、 评估上线过程中测试所用的数据是否需要还原或清除;