運用・保守の信頼性は、多くの場合、最終的には5カ月9,4 9,3ナインは、どのような地獄であることを言いましたか?

運用・保守の信頼性は、多くの場合、最終的には5カ月9,4 9,3ナインは、どのような地獄であることを言いましたか?

システムの高い信頼性(英語HA、利用可能な高に記載されているように、また、可用性とも呼ばれる)、9 -X-の信頼性の標準尺度があり、Xが3から5の数です。X 9は、システムの使用中に1年の期間を表し、合計時間に、システムの稼働時間(1年)比は、我々は、以下の計算により異なるレベルの信頼性X-9の違いを感じます。

  • 3 9:(99.9%)* 365 * 24 = 8.76時間、システムは、連続動作時間にサービス中断の一年間の期間までは8.76時間であってもよいことを示しています。

  • 4 9:(1から99.99パーセント)= 52.6分* 365 * 24 = 0.876時間、システムは、連続動作時間にサービス中断の1年までの期間は52.6分であってもよいことを示しています。

  • 5 9:(1から99.999パーセント)* 365 * 24 * 60 = 5.26分、システムは、サービス中断の持続時間は5.26分であり得る最大1年間の連続運転時間であることを示します。

その後、Xは数字3~5を表す9-X、なぜ1-2、及びせいぜい6それ?私たちは、計算に下って行きました。

  • 9:1(1から90パーセント)* 365 = 36.5日

  • 2:9(99%)* 365 = 3.65日

  • 6 9:(1から99.9999パーセント)* 365 * 24 * 60 * 60 = 31秒

そして、あなたはサービスの年以内にそれぞれ9、2 9は、中断した時期かもしれ見ることができます36.5日、3.65日、単語の「信頼性」を用いた信頼性のおそらくないこのレベルであり、6 9それはより後者よりも支払う必要があり、その後、「5ナイン」の信頼性から「6〜9」へのアップグレードを行うには、その後の信頼性のレベルを達成することは不可能ではないが、ほとんどの31秒で一年でサービス中断時間を言ったが、数回、元のコスト。

可用性A

ナンバー9

ダウンタイム(分)

適用製品

リマーク

150

二つ9

【異なる測定基準、頻度]

88日/年 - 障害が発生した4.2日の平均

0.1秒[1日は日が失敗と見なすことができるという問題が生じ]

 

[現在の生産環境の80%以上が
、システム全体<+ OS +ハードウェア+ソフトウェアプラットフォームプログラムは、>
まだ、この要件に達していません]

注:以下のようにのみ、サーバーのダウンタイムなどの特定の側面は、あります

0.999

スリー9

500
(8.8日)

コンピュータやサーバ

テスト環境は非常に不安定で
、本番環境✘で使用されていない

0.9999

四9

50

エンタープライズクラスのデバイス

生産環境の最小要件標準

0.99999

ファイブ9

5

一般的なキャリアクラスの設備

このような良いような大きなモールレベルのアプリケーション

0.999999

シックス・9

0.5

キャリアクラスの機器のための高い要件

金融サーバ
(ダウンタイムのない以上32秒)ベスト

                                                   

                                                                          

 

 

 

 

 

[1は、MTBF]でMTBF、故障間の平均時間は、英語名は「故障間の平均時間」です。信頼性(特に電気製品)製品の尺度です。単位は「時間」です。具体的には、作業もMTBFとして知られる2つの隣接する故障間の平均時間を指します。一言で言えば、以下の製品不良が総数と「故障率」(故障率)と呼ばれる製品寿命の単位当たりの故障の総数よりも、高い信頼性です。それが唯一のメンテナンス製品に適用されます。しかし、また、総作業時間およびMTBFのための障害の累積数の割合で製品使用段階を提供します。ディスクアレイ、一般的に以下50,000時間以上のMTBF。

[2]故障率故障率は、その時間の後、失敗の確率は、単位時間当たりに発生し、満了していない特定の時間の成果物を指します。[ラムダ]は、一般関数と呼ばれ、それはまた、時々、ハザード関数または故障率の関数と呼ばれ、故障率関数と呼ばλ(t)は、と呼ばれ、また、時間tです。

故障率λ= 1 / MTBF、ユニット1FITs = 10-9(1 /時間)

[3、MTTR] MTTRは、平均時間に修復、修理にすなわち平均時間を表します。この期間の中央を修復する障害から、ある修理修理品への平均時間です。短いMTTRは、より良い回収可能性を表しています。

MTTRはまた、部品を得るための時間、メンテナンスチームの応答時間は、すべてのタスクの記録時間だけでなく、時間の使用に機器の背面を含める必要があります。平均時間は、作業の順序で不良部品やシステムの背面に代わって、修理に時間を回復するか、平均する平均時間の頭文字をとったものです。これは、システム障害がシステムの作業状況を作るために必要な平均時間保守性とシステムの予測可能な指標の下で再び発生しています。MTTRは、無停電電源装置(UPS)や複雑な機構から数時間または数日内のアプリケーションの場合には数ミリ秒とすることができます。

修復基本パラメータの製品修復率の[4]修復率修復率(μ)1種類。修理時間は、時間後に単位時間内に完了し、修理の可能性をある時点で到達したが、まだ製品を修理していないされています。

 

 

 

多くの場合、99.99%及び99.999%である、4または5 9 9いわゆる用います。次に、間隙4又は5 9 9ギャップ0.009%、0.01%以下であった方法。しかし、システムのために、それはシステムが完全にオンになっていないグレードに決定され、このギャップは0.01%未満で正確です。

いわゆる5 9のシステムは、時間が5分未満と15秒から1年以内に動作しません。システム9から4相当以上52分36秒ではありません。これらは、実際にははるかに5分以上のダウンタイムによって引き起こされるいくつかの障害があっても、メインフレームで、ダウンタイムの4時間にわたる痛い教訓があり、理論的なデータです。問題はどこにありますか?

システムの信頼性は、それがソフトウェアの問題であれば、最善の解決策は、アップグレード、ハードウェア、ソフトウェアの問題を解決する方法はありませんどのように良い関係なくパッチを適用することで、ハードウェアに完全に依存しない、と共同で、ソフトウェアとハ​​ードウェアによって決まります。システムの信頼性を向上させるために、ソフトウェアが唯一の問題を解決するために、サービスのベンダーに依存し、良い方法ではありません。ユーザーは、ネットワーク、サーバおよびストレージ・デバイスを含む、ハードウェアのみを、選択することができます。その中でも、ネットワークはスナップショットは、バックアップを介してデータのセキュリティを向上させるための技術を対処、解決店舗のRAIDへのマルチキャリアアクセスを利用することができます。ただし、サーバーのために、ユーザーの選択は、より多くのデュアルクラスタ方式です。

溶液のデュアルユースのクラスタは、請求項9に5未満です。サーバ障害がバックアップホストに切り替えされたシンプルで、デュアルクラスタは、ソフトウェアプログラムをクラスタリングすることにより構築された理由は、仕事、ビジネスの継続に進みます。また、故障決意装置間のハートビート接続に依存することができます。クラスタの場合、フェイルオーバーは、厳格な要件であるホストは、スタンバイ・マシン環境が同じであることが必要です。実際には、アプリケーション、要件管理は、このような同期のアップグレード、アップグレード、パッチとして、所定の位置にする必要があります。経営者が所定の位置にない場合は、スイッチに障害が発生した可能性があります。システムが正常にデモ環境を切り替えることができます理由はここにありますが、本当の理由は、多くの場合不可能です。

 

 

 

おすすめ

転載: www.cnblogs.com/05-hust/p/12340920.html