AWSケーブル(a)に掘られた後の建築デザインの小さな概要

いいえ公共:大サブ速歩プログラマません

昨日の科学技術サークル最もホットなニュースがあるべき「AWSケーブルはサムスンにつながる、中国に掘られた、キビやその他のビジネスサービスは利用できません。」
光ファイバケーブルはねえ、掘られています!なぜ他、ご一緒に戻ってみましょう:

  • 2019年6月2日:アマゾンWaduanケーブル、ネットワークは、国の異常な部分であります
  • 2019年3月23日:影響を受けた様々なゲームによって引き起こされる光ファイバ建設チームWaduanテンセント、Tencentの100は、大きな失われました
  • 2015年5月27日:蕭山エリアファイバWaduanに起因して、現在のユーザーの小さな数をもたらすことAlipayのを使用することはできません

私が記載されている、と百度に自分自身興味がされていないだけで、光ファイバケーブルに関わるいくつかの大企業を一覧表示するここにいる掘ら事故、残りはまた掘っ何であったかケーブルラジオやテレビが含まれた、IESSケーブルを掘りました。

さて、私たちは「会社は大きいですが、また、建設チームの恐れ、」ことが判明し、この事故は、建設チームのせいだろうか?個人的に建設チームのためにすべての責任を置くことができないと感じ、もちろん、我々は大規模な企業として、ここでそれらを議論していない、我々は後にどのようにこの現象を防止するには?
私たちは、彼がそのような悲惨な状況を経験し、結局、それは2015年に高齢者で、このAlipayのソリューションを見ることができます。

2018年9月20日には、杭州Yunqi総会ATECメインフォーラムサイトでは、特殊な技術のショーを上演しました。蟻ゴールドドレス副CTO胡HI-サイトのアナログケーブルは、サーバーの半分近くを宝物を支払うWaduan。わずか26秒の結果は、アリペイシミュレーション環境は完全に正常に戻っています。

この溶液を室温アーキテクチャ、3つの都市で5つの部屋のつまり展開である「3つの5センター」、ある1つまたは2つの部屋に失敗したら、市内の障害へのすべてのトラフィックを切り替えるための技術に依存することができますエンジンルームの正常な動作。
だから、「3つの5のセンター」の前に他の多くのアーキテクチャは、その特性に1人の表情は、私たちにあります。

進化災害

サーバーがダウンしたときに最初に、私たちは、その後、1台のマシンにのみマシンを(関係なく、データ記憶装置のようなディスプレイのHello WorldのWebページのような非常に単純な読み取り専用のアプリケーションを、)適用され、私たちのアプリケーションは使用されません。
マシンダウンだけで1台のマシンが私たちのアプリケーションには影響を与えません。そのため、我々は複数のマシン上で我々のアプリケーションを検討し、同社は、これらのマシンを配置する別の部屋をオープンしました。
しかし、あなたの会社は、1日の消費電力は、それを切る場合は?私たちは部屋を配置するために市内の別の場所に考える今回は、このアプリケーションが二つの部屋で展開している(これはと呼ばれている同じ都市の都市-アクティブ
しかし、あなたが街を1日津波行けば、台風、地震などの自然災害、二つの部屋を使用することができない、と私たちは私たちのアプリケーションを展開するために別の都市での部屋なので、私たちのアプリケーションの可用性を再構築を検討します。この時間はさらに高い(これが呼び出されたオフサイトライブ) 。
さて、これまでに関係なく発生する状況の種類、我々のアプリケーションは、(...地球を破壊しない限り)基本的には利用できません

だから我々は、上記のアプリケーションがデータストレージに来るのであれば、同時にサービスを提供することができるアプリケーションのすべての部分は、その後、私たちのアプリケーションは、アプリケーションのこの時期はどこにでもあることと同時に、外部提供できない、非常に単純な読み取り専用のアプリケーションです考えるの書き込みをデータでのサービス、データの競合が発生する可能性があるので、我々は時間のために会社の内部規程である都市別の部屋と別のオフサイトながら、サーバーが(後で私たちはコンピュータルームと呼ばれる)、サービスを提供するために、データを書き込むことができる唯一の部屋部屋のこれら二つの部分の関数が呼び出されるように部屋は、メインコンピュータルームからのデータを同期させることができ、ディザスタリカバリデータが同期されるので、でもメインコンピュータルームの停電ならば、他の二つの部屋はまだ一時的な外部のサービスプロバイダになる可能性があるため。だから今アーキテクチャ次のように:

image.png

メインコンピュータルームの停電は、ユーザーが部屋をバックアップするために北京を要求しますときに、北京はまた、部屋停電を担保する際、ユーザーの要求は、部屋をバックアップするために上海に行きます。
さて、このアーキテクチャのために、私たちはホストだけが部屋の外にサービスを提供することができると言う、他の二つの部屋は同じようにバックアップ、ディザスタリカバリされ、そのバックアップエンジンルームの利用率は、ホストの部屋からの通常の要求の下で、理由は結局、古い決して高くはないです停電なので、バックアップエンジンルームは、その利用率を向上させることはできませんか?確かに、我々はバックアップ部屋北京を作ることができ、ビジネスの一部を受け取るために要求したが、これらの要求は、上海のバックアップエンジンルームながら、そのようないくつかの読み取り要求として、それほど重要であろうかのため、要求を受信し、または単に災害復旧機などはありません他の予測できない問題があるだろうと、バックアップエンジンルームサービス要求が受信される保証することができ、それは今3つの部屋の役割である誰もが、実際には多少異なる持っていません。

image.png

これは呼ばれる二つに3つのセンターを。
状態は銀行の災害復旧能力の要件は、どのくらいのより多くの資産を確実にするために2〜3のセンターにアーキテクチャを行わなければなりませんでしたので、だから、このアーキテクチャの2における3つのセンターは、多くの銀行や大企業が使用しているアーキテクチャは、あります銀行システムの安定性。

だから、その欠点のないこのアーキテクチャはありますか?のは、その可用性が高い考えてみましょうか?可用性は十分に速く、インフラストラクチャは、ユーザーの要求を処理する際にあることを意味しますか?
私たちは、このアーキテクチャの間で、センターは、データのバックアップの必要性、唯一の二つの方法のため、バックアップデータ、非同期または同期のいずれかであることがわかりました。

  • 最大パフォーマンス・モード:それは非同期である場合に限り、非同期データをバックアップする間、あなたは時に非同期データのバックアップの生産行く準備ができているならば、それは、しかし、ユーザーに本番データセンターのストレージに直接、完全なデータを結果を返すように、ライト・ユーザーデータのリクエストを表し、データセンターの停電は〜、この時間は、ユーザにサービスを提供するために、災害復旧サーバーにさらされるだろうか?データの災害復旧センターは、古いデータである可能性が高いので、することはできません。
  • 最大保護モード:それは同期されている場合は、データのみを保存するために本番データ・センターを待つために、ライト・ユーザーデータのリクエストを表し、だけでなく、問題がある場合にのみ、完全なデータのバックアップおよび災害復旧センターを返すために、他の災害後の復旧センターを待つ必要がある、なぜならバックアップデータを完了することはできませんので、全体のインフラストラクチャは、可用性が非常に低いサービスを、提供することはできません。
  • 最大利用可能モード:これは一般的に使用されるスキームである、それは問題がある発見された場合、生産データセンターの災害復旧データセンターを監視しながら、通常の条件下では、災害復旧センターを最大保護モードを使用して、それはそう、最大パフォーマンス・モードに変更されます生産は、他のデータセンターの災害復旧センターに影響されないことを確実にします。
  • 三つには、2個の同期書き込み:これは、アリのアーキテクチャモデルの前にある3つの都市センター、データのバックアップは、データベースレベルで発生しなかった意味が、アプリケーション層、アプリケーションがデータベースにデータを書き込む際に、また3つのセンターに書き込みますデータ、限り、2つのセンターがあるように成功を返すことができ、3つのセンターが中心停電があっても、その後、全体の構造は、このアイデアの可用性に影響を与えません、我々は最初の3と同じではありませんように、パフォーマンスは確かにはるかに高くなります。

さて、私たちはその欠点をまとめるために、2〜3のセンターを紹介しました:

  1. 災害復旧センターの利用率は高くありません
  2. 後に本番データ・センターを停止し、データの災害復旧センターは、必ずしも厳密に同じ100%ではありません
  3. 高コストが、実際に所望の高可用性機能を実現することはできません

したがって、この問題を解決するために、ありました3つの5のセンター類似した名前と2つの3つのセンターが、しかし、完全に異なる機能を提供します。
三つの5センターは3つの都市、5つのセンターを指し、3つの5つのセンターのコンセプトを単位に基づいており、それを継続するために次の、多くのスペースが懸念している費やす必要がありました。

私たちは経験を読んで、コードの塊を参照してくださいまた、小さな携帯電話の画面には好きではないので、私はスタイルが少し通常のテキストの上になります書いていると信じています。あなたはそれのような何かを得るために少し考えを与える場合。

おすすめ

転載: juejin.im/post/5cf4e4086fb9a07ee1691369