UBER、RBER和MTBF的概念

转载自 http://www.ssdfans.com

SSD有几个关键指标来衡量其可靠性:UBER、RBER和MTBF。

UBER: Uncorrectable Bit Error Rate,不可修复的错误比特率;

RBER: Raw Bit Error Rate, 原始比特错误率;

MTBF: Mean Time Between Failure, 平均故障间隔时间。

1. 数据可靠性

我们接着看一下上面的S3710 SSD手册中Reliability(可靠性)项的截图:

image

UBER:Uncorrectable Bit Error Rate,不可修复的错误比特率,一种数据损坏率衡量标准,等于在应用了任意特定的错误纠正机制后依然产生的每比特读取的数据错误数量占总读取数量比(概率)。

为什么SSD要定义UBER?任何一项存储设备产品包括HDD,用户最关心的是数据保存后的读取正确性。试想数据丢失和损坏对客户产生的后果是怎么样的?尤其是企业级用户数据。那如何让用户相信存储设备系统是可靠的呢?UBER指标,描述的是出现数据错误的概率,给用户以直观的概率数据描述错误数据的可能性,当然越低越好。

为什么会产生错误数据,SSD的存储介质是闪存,闪存有天然的数据比特翻转率。主要有以下几种原因导致:

l 擦写磨损(P/E Cycle)

l 读取干扰(Read Disturb)

l 编程干扰(Program Disturb)

l 数据保持发生错误(Data Retention)

虽然SSD主控和固件设计会用纠错码(ECC)的方式(可能还包括其它方式,如RAID),但闪存在某种条件下依然有纠不回来的可能,所以需要有UBER让用户知道数据误码纠不回来的概率参考数据。

闪存原始的比特翻转加上BCH码(一种ECC纠错算法)ECC 校验保护后,可以计算转换到UBER。影响到UBER最核心的是闪存原始的比特错误率,也叫RBER(Raw Bit Error Rate)。图1-23从RBER、ECC编码长度(Code Length)和保护强度(Strength)换算到UBER,从中得出结论:

相同的ECC编码长度,随着保护强度的增长,UBER在降低,呈大幅倍数降低。

image

图1-1 UBER和纠错强度的关系

相同的ECC编码长度和保护强度,RBER越低,UBER也在降低,呈指数降低。

image

图1-2 UBER和RBER的关系

RBER反映的是闪存的质量。所有闪存出厂时都有一个RBER指标,企业级闪存和消费级闪存的RBER显然是不同的,价格当然也有所不同。RBER指标也不是固定不变,如图1-25闪存的错误率会随着使用寿命(PE cycle)增加而增加。为了挑战极限,必须准备好处理每100个bit就有1个坏的情况。

image

图1-3 RBER 和PE的关系

RBER还跟闪存内部结构也有关系。两个相邻闪存块的RBER有可能完全不同,图1-26是单个闪存块里面不同闪存页的RBER分布图。看得出来,Upper Page的RBER比Lower Page要高两个数量级。

image

图1-4 Lower&Upper page RBER

最后回到UBER指标作为结尾,数据的UBER指标的要求对于企业级和消费级SSD各有不同,通常商用企业级和消费级SSD的UBER指标又是多少呢?如表1-9:

表1-9 企业级和消费级SSD UBER值

UBER

企业级(Enterprise)

10-17甚至10-18

消费级(Client)

10-15


2. MTBF

MTBF,即平均故障间隔时间,英文全称是“Mean Time Between Failure”。是衡量一个产品(尤其是电器产品)的可靠性指标。单位为“小时”。它反映了产品的时间质量,是体现产品在规定时间内保持功能的一种能力。具体来说,是指相邻两次故障之间的平均工作时间,也称为平均故障间隔 [1] 。概括地说,产品故障少的就是可靠性高,产品的故障总数与寿命单位总数之比叫“故障率”(Failure rate)。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。磁盘阵列产品一般MTBF不能低于50000小时。

原创文章 22 获赞 29 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_34254642/article/details/105452627