信息系统可靠性

系统系统的可靠性

排错:避免故障

容错:发生故障后能正常运行 即使使用了排错技术计算机系统仍然会出现故障,因此必须考虑一旦发生故障能自动检测故障并使用系统自动恢复业务正常运行 。

容错设计的系统可以有某些规定数量的故障或异常但不能导致失效。对于无容错的系统而言,故障即是失效,造成各种损失。

容错技术主要组成部分:

故障检测:判断系统是否存在故障

故障诊断:检测故障后要进行故障定位,找出故障所在

故障屏蔽:防止系统故障在该系统的信息结构中产生差错的的措施总称。

冗余技术:硬件冗余、软件冗余、时间冗余、信息冗余

计算机系统容错:

计算机通信术语来说意思就是指当系统在运行时有错误被激活的情况下仍能保证不间断提供服务的方法和技术。

系统采用特别的硬件、软件和电源部件,能够支持系统的备份和避免系统故障以维持系统的运行。系统装有特殊的存储芯片、处理器磁盘存储设备,利用诸如扩充的程序流监控机制等特殊的软件程序或自我检查逻辑来检测故障以及自动转换到备份上继续工作。该机制使得计算机既能容忍故意逻辑故障又能容忍随机物理故障。这些计算机系统上的零部件可以移动和修理而不破坏计算机系统

举例:

器件冗余:一个CP故障另一个CPU正常运行这个过程对用户是透明的,系统没有收到影响,业务也能正常运行。

设备冗余:

1、双机双工热备份 主机各自作业不同 彼此独立 并相互备援 A故障B自动接管A运行,A修复后业务恢复A运行。

2、主从热备份:M/S M运行S后备,M故障 S接管业务并升级为M,原M修复后作为S。

存储备份:

RAID

磁盘阵列(Redundant Arrays of Independent Drives,RAID),有“独立磁盘构成的具有冗余能力的阵列”之意。

磁盘阵列是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统性能

猜你喜欢

转载自blog.csdn.net/wikowin/article/details/88023170