服务器运行维护流程

 1.日常服务器运维部自我巡检:
(1)每日早8:00通过cacti监控软件查看所有服务器总流量、单兵流量、CPU和内存使用情况、硬盘使用情况等运行是否正常。
 (2)对异常单兵服务器进行查看CPU、内存占用率等进行详细分析和排查。
(3)对异常单兵进行所有服务进程检查,看是否正常,并进行排查。
(4)查看使用用户,是否有异常用户登录。如有异常用户登录,查看该用户下的文件,是否有木马、病毒或有威胁的文件,进行删除和维护。
(5)查看服务器系统是否需要打新的补丁,如需升级,进行升级。
(6)在服务器和本机上同时对网页的打开速度进行测试,登陆到系统上查看系统页面中程序运行是否正常。 是否正常。
(7)对公司五大系统接口进行打开测试查看是否正常。
测试内容:
集采平台打开测试;
便利店系统打开测试;
云仓储接口打开测试;
云管理接口打开测试;
云支付买买金接口打开测试。
2.周和月服务器运维部自我巡检:
通过查看监控周流量和月流量、服务器各项硬件使用情况查看等分析
(1)在管理工具中查看事件查看器中的应用、安全、系统、日志中的工作状态,是否有异常情况,如有进行清除和修复,每星期进行一次清除工作。
(2)每两个星期检查一次操作系统日志。
 (3)每星期定时对服务器的网站程序文件进行备份。备份原则上采用数据库完全备份加日志备份策略、web前端增量备份;
1、备份数据存储策略:本机、异机、2个级别。
2、重要更新时间点前后必须做数据库备份或日志备份,特别是在做数据库表更新、应用程序更新。 
3、每天检查所有数据库备份操作是否正确完成、异地传输是否正常完成,并填写检查表。
4、在异地备份数据准确存储后,可以将超过2周 以上的异机备份数据通过自动删除脚本进行删除,以便腾出存储空间。 
(4)为保证服务器系统正常运行,每星期对系统盘C盘进行垃圾清理和维护。
(5)在数据库服务器、关键应用服务器上,只能有数据库DBA人员的帐号,开发人员需要介入时,填写开发人员使用数据库申请单向上级申请。
 3.运维部自我巡检周和月工作总结:
对一个月内服务器系统的运行情况进行汇总,把解决的问题及不能解决的问题归纳总结并向上级领导提交,通过会议形式决定解决办法和执行方式来解决所面临的问题。
4.机房协助巡检:
机房每周会对机柜使用情况、流量峰值情况、机柜温度、湿度等进行巡检,每周发送到公司运维部,进行评估和查看
 5、服务器硬件定期更换和清理:
针对所有服务器硬件清洁期限和更换如下:
1、每年进行服务器灰尘开盖清理,通过机房人员协助;
2、对于存储硬盘,期限为两年更换一次,保证硬盘的正常使用;
3、电源模块测试,若有欠压和损坏的进行彻底更换。

猜你喜欢

转载自www.cnblogs.com/wlyp/p/9991612.html