有关服务器运行维护的阐述

在互联网高速发展的现在,服务器托管、服务器租用作为服务器两大使用方式,即使是拥有高性能和冗余功能的现代服务器,增加的工作负载整合与可靠性期待,也能让服务器忙得不可开交。究竟如何维护服务器?如何提高服务器的稳定性呢?答案是,需要为服务器列出维护清单,包括物理配件以及系统关键配置。具体的数据中心服务器维护做以下五大清单。东方网域为大家详细道来:

软件维护

一、数据库服务

数据库经过长期的运行,需要调整数据库性能,使之进入最优化状态。数据库中的数据是最重要的,这些数据库如果丢失,损失是巨大的,因此需要定期来备份数据库,以防万一。

二、操作系统的维护

操作系统是服务器运行的软件基础,其重要性不言自明。多数服务器操作系统使用Windows 2003或Windows 2008 Server作为操作系统,维护起来还是比较容易的。

在Windows NT或Windows 2003 Server打开事件查看器,在系统日志、安全日志和应用程序日志中查看有没有特别异常的记录。现在网上的黑客越来越多了,因此需要到微软的网站上下载最新的Service Pack(升级服务包)安装上,将安全漏洞及时补上。

三、用户数据

经过频繁使用,服务器可能存放了大量的数据。这些数据是非常宝贵的资源,所以需要加以整理,并刻成光盘永久保存起来,即使服务器有故障,也能恢复数据。

四、网络服务的维护

网络服务有很多,如WWW服务、DNS服务、DHCP服务、SMTP服务、FTP服务等,随着服务器提供的服务越来越多,系统也容易混乱,此时可能需要重新设定各个服务的参数,使之正常运行。

检查事件日志输出

服务器事件日志中记录着丰富的信息,尤其是细节问题。如果没有仔细审查系统日志,恶意软件日志和其他日志,服务器维护是不完整的。当然,关键的系统问题应该引起IT管理员和技术人员注意,但也有无数的非关键问题,可能是慢性或严重问题的信号。

查看当前端口开放情况

使用activeport,查看当前的端口连接情况,尤其是注意与外部连接着的端口情况,看是否有未经允许的端口与外界在通信。如有,立即关闭该端口并记录下该端口对应的程序并记录,将该程序转移到其他目录下存放以便后来分析。打开计算机管理==》软件环境==》正在运行任务[在此处可以查看进程管理器中看不到的隐藏进程],查看当前运行的程序,如果有不明程序,记录下该程序的位置,打开任务管理器结束该进程,对于采用了守护进程的后门等程序可尝试结

入侵检测工作

作为服务器的日常管理,入侵检测是一项非常重要的工作,在平常的检测过程中,主要包含日常的服务器安全例行检查和遭到入侵时的入侵检查,也就是分为在入侵进行时的安全检查和在入侵前后的安全检查。系统的安全性遵循木桶原理,木桶原理指的是:一个木桶由许多块木板组成,如果组成木桶的这些木板长短不一,那么这个木桶的最大容量不取决于长的木板,而取决于最短的那块木板。应用到安全方面也就是说系统的安全性取决于系统中最脆弱的地方,这些地方是日常的安全检测的重点所在。

硬件维护

许多服务器依赖内部硬盘,用于承载工作量和存储,保存用户数据以及其他功能。硬盘介质出现问题会严重影响负载性能和稳定性,最终会导致硬盘故障。

磁盘介质是不完美的,常见问题包括坏道和碎片化。RAID可以比较稳定地确保出现磁盘故障时数据稳定与一致性,但更小型的服务器,如1U的机架式服务器可能无法提供足够的空间来实施RAID。使用如CHKDSK(Check Disk)这样的工具来检查硬盘完整性,还可以尝试修复其中损坏的扇区。Windows Server 2012最新版的CHKDSK可以快速分析并修复文件系统结构的磁盘问题。

磁盘碎片不会消失,只要使用NFS并且文件分配表或FAT,文件系统会使用首个可用集群的磁盘空间。碎片可能会降低服务器磁盘速度并引发故障。诸如Windows Server 2012自带的卷组优化工具,可以安排每个文件集群,并确保数据连续。

一、除尘

尘土是服务器最大的杀手,因此需要定期给服务器除尘。对于服务器来说,灰尘甚至是致命的。除尘方法与普通PC除尘方法相同,尤其要注意的是电源的除尘。

二、储存设备的扩充

当资源不断扩展的时候,服务器就需要更多的内存和硬盘容量来储存这些资源。所以,内存和硬盘的扩充是很常见的。增加内存前需要认定与服务器原有的内存的兼容性,最好是同一品牌同一规格的内存。如果是服务器专用的ECC内存,则必须选用相同的内存,普通的SDRAM内存与ECC内存在同一台服务器上使用很可能会引起统严重出错。在增加硬盘以前,需要认定服务器是否有空余的硬盘支架、硬盘接口和电源接口,还有主板是否支持这种容量的硬盘。尤其需要注意,防止买来了设备却无法使用。

三、设备的卸载和更换

卸载和更换设备时的问题不大,需要注意的是有许多品牌服务器机箱的设计比较特殊,需要特殊的工具或机关才能打开,在卸机箱盖的时候,需要仔细看说明书,不要强行拆卸。另外,必须在完全断电、服务器接地良好的情况下进行,即使是支持热插拔的设备也是如此,以防止静电对设备造成损坏。

定期安装补丁与更新

服务器软件栈——BIOS、操作系统、虚拟机管理程序、驱动程序、应用程序、支持工具——必须确保所有互动与协作。不幸的是,软件代码很少完美或没有任何问题,所以此类软件问题需要经常通过修补或更新来修复错误、提高安全性、简化操作性、提高性能等。

不是所有软件都可以自动更新,管理员需要确认哪些补丁或升级包是必要的,然后评估和测试更新效果。如果更新包修复的是服务器不存在的问题,那么无须多此一举冒这个险。

软件开发者无法测试到每个软硬件兼容性以及补丁、更新的潜在问题,因此可能会导致更多的问题,这种情况可能在特定的服务器或软件集中发生。例如监控软件的代理补丁可能导致某个重要应用程序的性能问题,因为新代理需要比预期更高的带宽。

转换到DevOps后,更小、更频繁的更新过程加剧了潜在的问题。在部署之前仍然要在实验室环境内测试任何补丁或更新。始终要确保可以撤销原来的更改,并可以恢复修改前的软件配置。

猜你喜欢

转载自www.cnblogs.com/aynu/p/9997809.html