异常情况监控系统的设计随想

           最近这段时间由于机房调整,硬件更新,网络改造等工作不断实施,引起很多问题,比如服务器不稳定,网络经常故障等等。

结果导致系统问题频出。如系统服务器宕机,数据库服务器宕机,网络超级卡等等。用户的意见很大,我们也疲于应付这些问题。

          前几天在处理完一次异常事故后,我们进行了探讨建立公司的系统异常故障的预警信息发布平台的可能性。考虑到公司的

应用系统比较多,而且分布在多台不同的服务器上,而且服务器也在不同的地方,为了有效及时的管理,建议建立一个比较规范

的异常信息预警发布平台。如果服务器和硬件设备故障,则预警发布系统将收集到的异常信息通过短信及时发给系统开发和配置

及维护的人员,这样保证第一时间收到问题,解决问题。防止问题出现了很久,最终反应到了用户那里就不好了。比如晚上10点

服务器宕机,如果我们得知了这个消息,马上处理,第二天就不会引来用户投诉。或者提前通知了用户,也会减轻负面的影响。

          在发送短信及时通知的同时,也通过邮件将异常的详细信息发送给相关的负责人员。便于跟踪定位问题。同时将收集到的

异常问题记录下来,并制作成报表,供大家参考,以让大家提前做好应急准备,尽可能的减少风险的影响甚至避免风险。

转载于:https://www.cnblogs.com/kevinGao/archive/2013/06/10/3138580.html

扫描二维码关注公众号,回复: 6616538 查看本文章

猜你喜欢

转载自blog.csdn.net/weixin_34319999/article/details/93052197