系统的可靠性分析与设计---系统故障模型

1 故障的来源以及表现

下面先介绍几个概念。

    (1)失效:硬件的物理改变。

    (2)故障:由于部件的失效、环境的物理干扰、操作错误或不正确的设计引起的硬件或软件中的错误状态。

    (3)错误(差错):故障在程序或数据结构中的具体位置。错误与故障位置之间可能出现一定距离。故障或错误有如下几种表现形式。

       永久性:描述连续稳定的失效、故障或错误。在硬件中,永久性失效反映了不可恢复的物理改变。

       间歇性:描述那些由于不稳定的硬件或变化着的硬件或软件状态所引起的、仅仅是偶然出现的故障或错误。

       瞬时性:描述那些由于暂时的环境条件而引起的故障或错误。

    一个故障可能由物理失效、不适当的系统设计、环境影响或系统的操作员所引起。永久性失效会导致永久性故障。间歇性故障可能由不稳定、临界稳定或不正确的设计所引起。环境条件会造成瞬时性故障。所有这些故障都可能引起错误。不正确的设计和操作员失误会直接引起错误。由硬件的物理条件,不正确的硬件或软件设计,或不稳定但重复出现的环境条件所引起的故障可能是可检测的,并且可以通过替换或重新设计来修复;然而,由于暂时的环境条件所引起的故障是不能修复的,因为其硬件本身实际上并没有损坏。瞬时和间歇故障已经成为系统中的一个主要错误源。

2 几种常用的故障模型

    故障的表现形式千差万别,可以利用故障模型对千差万别的故障表现进行抽象。故障模型可以在系统的各个级别上建立。一般说来,故障模型建立的级别越低,进行故障处理的代价也越低,但故障模型覆盖的故障也越少。如果在某一级别的故障模型不能包含故障的某些表现,则可以用更高一级别的模型来概括。下面介绍几种常用的故障模型。

    1.逻辑级的故障模型

    固定型故障指电路中元器件的输入或输出等线的逻辑固定为 0 或固定为 1,如某线接地、电源短路或元件失效等都可能造成固定型故障。短路故障是指一个元件的输出线的逻辑值恒等于输入线的逻辑值;元件的开路故障是元件的输出线悬空,逻辑值可根据具体电路来决定。桥接故障指两条不应相连的线连接在一起而发生的故障。

    2.数据结构级的故障

    故障在数据结构上的表现称为差错。常见的差错如下。

    独立差错:一个故障的影响表现为使一个二进制位发生改变。

    算术差错:一个故障的影响表现为使一个数据的值增加或减少 2i(i=0,1,2,…)。

    单向差错:一个故障的影响表现为使一个二进制向量中的某些位朝一个方向(0 或1)改变。

    3.软件故障和软件差错

    软件故障是指软件设计过程造成的与设计说明的不一致的情况,软件故障在数据结构或程序输出中的表现称为软件差错。与硬件不同,软件不会因为环境压力而疲劳,也不会因为时间的推移而衰老。因此,软件故障只与设计有关。常见的软件差错有以下几种。

    非法转移:程序执行了说明中不存在的转移。

    误转移:程序执行了尽管说明中存在,但依据当前控制数据不应进行的转移。

    死循环:程序执行时间超过了规定界限。

    空间溢出:程序使用的空间超过了规定的界限。

    数据执行:指令计数器指向数据单元。

    无理数据:程序输出的数据不合理。

    4.系统级的故障模型故障在系统级上的表现为功能错误,即系统输出与系统设计说明的不一致。

    如果系统输出无故障保护机构,则故障在系统级上的表现就会造成系统失效。

猜你喜欢

转载自blog.csdn.net/hu19930613/article/details/85207496