一般的な実践丨実際のビジネスと ECS 仕様の選択および容量検証を組み合わせる方法

著者: 趙家佳

クラウド ネイティブ テクノロジーの活発な開発とクラウド製品の低価格化により、OSS オブジェクト ストレージ、ECS クラウド サーバー、その他の基本製品を選択して独自の Web サイト、ネットワーク ディスク、その他のアプリケーションを構築する Geek 開発者やテクノロジー愛好家がますます増えています。しかし、企業にとっては、さまざまな種類や仕様の ECS クラウド サーバーを前に、インスタンス仕様の主な特徴をどのように理解し、在庫不足、製品のオフライン、プリエンプティブル インスタンスの使用などのシナリオでビジネスの安定した運用を確保するかが重要になります。鍵。

次に、ECS クラウド サーバーを選択し、PTS を通じてキャパシティ プランニングを実行する方法を学びましょう。次に、3 つの異なる ECS 選択方法を紹介します。

01 インスタンス仕様パラメータに基づいてモデルを選択します

ECS インスタンスを開始する前に、パフォーマンス、価格、ワークロードなどの要素に基づいて構成を選択します。さまざまな設定パラメータに従って、ECS はさまざまなインスタンス タイプを含むインスタンス タイプ ファミリを提供します。実際の使用では、次の 2 つの方法で、最適なパラメータを持つインスタンスの仕様を見つけることができます。

  • インスタンス タイプ ファミリ[ 1] : インスタンス タイプ ファミリの製品の詳細については、ドキュメントを参照してください。
  • DescribeInstanceTypes [ 2] : ECS API インターフェイスを呼び出して、最新のパフォーマンス仕様パラメータを取得します。

この方法では、必要なインスタンス タイプをすぐに理解して見つけることができるように、インスタンス タイプの命名方法を理解する必要があります。インスタンス タイプ ファミリ名の形式はecs.<type family>、インスタンス タイプ名はecs.<type family>.largeです。具体的な命名規則は次のとおりです。

  • ecs : クラウドサーバーのECSプロダクトコード。
  • <仕様ファミリ> : 仕様ファミリ本体 + 仕様ファミリ接尾辞で構成されます。
  • x86 コンピューティング ファミリと ARM コンピューティング ファミリ

画像.png

  • 異種コンピューティング タイプ ファミリ、エラスティック ベア メタル サーバー、およびスーパーコンピューティング クラスター (SCC) インスタンス タイプ ファミリ ヘテロジニアス コンピューティング タイプ ファミリ、エラスティック ベア メタル サーバー、およびスーパーコンピューティング クラスター (SCC) インスタンス タイプ ファミリは、通常、小文字とデジタルで構成される独自の名前を使用します。ミックス組成物。

画像

  • large : large は vCPU コアの数を示し、 の n が大きいほど、より多くの vCPU コアを示します。このうち、xlarge は 4 コア、2xlarge は 8 コア、3xlarge は 12 コアなどを表します。

02 自社構築サービスやアプリケーションに応じた選択

企業がクラウドに移行するサービスを選択する場合、さまざまなクラウド製品を購入すると同時に、実際のビジネス ニーズを満たすさまざまなサービスやアプリケーションを自社で構築することになります。選択を容易にするために、一般的な自社構築サービスおよびアプリケーションに対応する ECS インスタンス仕様を要約してリスト化しました。企業が使用するアプリケーションに応じて、対応するインスタンス仕様ファミリーを選択し、選択原則を参照してください。

画像

画像.png

03 利用シーンに合わせて選ぶ

直接パラメーターに基づく 2 つの方法と、独自に構築されたアプリケーションとサービスに加えて。実際の制作プロセスでは、単一のサービスやアプリケーションでは多くのビジネス シナリオを満たせないことがわかります。同時に、関連するビジネス シナリオの追加要件は比較的複雑になります。

一般アプリケーション、ゲームサービス、ライブ映像シーン

汎用シナリオでは、パフォーマンス要件は CPU に集中しており、プロセッサとメモリのリソースの比較的バランスのとれた比率が必要です。通常、CPU とメモリの比率は 1:2 です。システム ディスクには高効率のクラウド ディスクが使用され、SSD にはクラウド ディスクはデータ ディスク、または ESSD クラウド ディスクに使用されます。ビジネスでビデオの集中攻撃など、より強力なネットワーク パフォーマンスが必要な場合は、同じシリーズのより高い仕様のインスタンス仕様を選択して、ネットワーク パケット送受信機能 (PPS) を向上させることができます。

画像.png

Hadoop、Spark、Kafka ビッグ データ シナリオ

Hadoop、Spark、Kafka ビッグ データなどのシナリオでは、さまざまなノードが関与するため、パフォーマンス要件はより複雑になり、コンピューティング、ストレージ スループット、ネットワーク パフォーマンスなど、各ノードのパフォーマンスのバランスを取る必要があります。このうち、管理ノードと計算ノードは一般的なシナリオとして扱うことができます。クラスターのサイズに応じて、異なるインスタンス タイプを選択する必要があります。たとえば、ecs.g6e.4xlage は 100 未満のノードに使用でき、ecs.g6e.8xlage は 100 ノードを超えるノードに使用できます。同時に、データ ノードは、ビッグ データ タイプの d シリーズ仕様ファミリーを使用できるように、高いストレージ スループット、高いネットワーク スループット、バランスの取れたプロセッサとメモリの比率を必要とします。たとえば、MapReduce/Hive の場合は ecs.d2s.5xlarge を選択でき、Spark/Mlib の場合は ecs.d2s.10xlarge を選択できます。

画像

データベース、キャッシュ、検索シナリオ

このタイプのシナリオでは、通常、インスタンス タイプのプロセッサとメモリの比率は 1:4 よりも高くする必要があり、一部のソフトウェアはストレージ I/O の読み取りおよび書き込み機能とレイテンシー パフォーマンスに敏感であるため、選択できます。メモリ単位あたりのコストパフォーマンスが高いタイプファミリーです。

画像

データベースを例に挙げると、従来の方法では、ビジネス システムは OLTP データベースに直接接続されており、データの冗長性は主に RAID ディスク アレイを通じて実現されています。クラウド サーバー ECS を選択すると、負荷の軽いデータベースから負荷の高いデータベースまで柔軟に導入できます。

画像.png

  • 軽負荷データベース: エンタープライズ レベルのインスタンス仕様はクラウド ディスクとともに使用され、コスト効率が高くなります。
  • ヘビーデューティ データベース: 高いストレージ IOPS と低い読み取り/書き込みレイテンシが必要です。要件を満たすには、ローカル SSD タイプの i シリーズ インスタンス タイプ ファミリ (高 I/O ローカル NVMeSSD ローカル ディスクを使用) を使用することをお勧めします。大規模で耐久性の高いデータベース。

ディープラーニング、画像処理シナリオ

ディープ ラーニングや画像処理などのシナリオでは、アプリケーションには高性能の GPU アクセラレータが必要であり、GPU と CPU の比率については次の推奨事項が行われます。

  • ディープ ラーニング トレーニング: GPU と CPU の比率は 1:8 ~ 1:12 にすることをお勧めします。
  • 一般的なディープ ラーニング: GPU と CPU の比率は 1:4 ~ 1:48 にすることが推奨されます。
  • 画像認識の推論: GPU と CPU の比率は 1:4 ~ 1:12 にすることが推奨されます。
  • 音声認識と合成推論: GPU と CPU の比率は 1:16 ~ 1:48 にすることをお勧めします。

画像.png

上記のシナリオに加えて、ヘテロジニアス コンピューティングおよび一般的なコンピューティングの一般的なシナリオとそれに対応する仕様例をまとめ、選択できるようにしました。

画像.png

画像.png

04 仕様の検証とキャパシティプランニング

選択が完了し、ECS クラウド サーバー インスタンスの使用を開始したら、これは実際のビジネスの始まりにすぎません。実際のビジネスでは、リソースがボトルネックになっていない場合、同時実行数、TPS、CPU の傾向は直線的ですが、ビジネス同時実行数の増加に伴いリソース使用率が飽和すると、TPS の傾向は安定し、CPU は急上昇し始めます。 。リソース使用率が飽和し、同時実行数が制限容量ポイントを超えると、TPS トレンドと CPU が変動し、さらに容量が雪崩を起こし始め、この時点でサービスが利用できなくなり始めます。

画像.png

したがって、適切な仕様を選択した後は、サービスの安定性、リソースの使用率、およびビジネスのスループットが新たな考慮事項と焦点になります。チームの役割が異なれば、重点を置く内容も異なります。

  • ビジネス チームは、重要なビジネス活動中にその容量がビジネス量を安定してサポートできるかどうかに注意を払う必要があります。
  • 研究開発チームは次の点に注意する必要があります。手動拡張、自動拡張、リリース/ロールバックはリソースによって制限されません。
  • 運用保守チームは、リソース利用率、部門別リソース水位、リソース使用量およびコストに注意を払う必要があります。

しかし、従来の手作業の経験に基づくリソース仕様の設定方法には限界があり、オンラインビジネスの安定性を確保するために、負荷変動に対応するために相当量のリソースとボリュームが確保されることが多く、リソースの無駄が大きくなります。

したがって、圧力テストツールのパフォーマンステストPTS [ 3]を使用して、ECSクラウドサーバーの仕様選択が正しいかどうかを検証し、容量分析とフル稼働を通じてクラウドシステムの最適な安全容量ポイントと限界を検出する必要があります実際のビジネス ニーズに応じたリンク追跡キャパシティ ポイントとダメージ キャパシティ ポイントは、クラウド上のシステム キャパシティとリソース コストの最適なバランスを実現するために、電流制限とダウングレードによって保護されます。

画像

一般的なビジネス シナリオ向けのストレス テスト戦略

ビジネス圧力と、生産環境または排水生産環境のアプリケーション シナリオの組み合わせをシミュレーションするプロセスでは、突然変異、同時実行性、負荷、安定性、制限などのさまざまな圧力測定戦略を選択して、システムのさまざまな指標が適切かどうかを評価します。ビジネス量、可用性、安定性、その他の要件を満たしていること。ここでは、一般的なビジネス シナリオ、対応するストレス テスト戦略、およびその利点をまとめます。

画像

ベスト プラクティス: パフォーマンス テスト PTS に基づいて圧力テスト タスクを作成する

ベストプラクティスをデモンストレーションしながら、読みながら体験したAlibaba Cloudの無料トライアルECS + PTSをベースにしたシナリオ体験を提供しました。

URL:https://developer.aliyun.com/adc/scenario/f37fb4d355684e189b7d87c9b6c8d10b

(1) 実験前の準備

  • Alibaba Cloud マスター アカウントが無料トライアルの対象となる場合は、パフォーマンス テスト PTS および ECS クラウド サーバーの無料トライアルを開くことをお勧めします。パフォーマンス テスト PTS では、最初の 1 か月間 5,000 VUM の無料ストレス テスト リソースが提供され、超過分は後払いエキスパート バージョンとして請求されます。具体的な請求の詳細については、パフォーマンス テスト PTS 請求ルール[ 4]を参照してください。
  • Alibaba Cloud アカウントが一部の無料トライアル製品しか受け取れない場合は、無料トライアルの資格を満たす製品を受け取ってから、実験に参加してください。無料トライアルの資格を満たさない製品は、個人アカウントのリソースを使用して作成され、一定の料金が発生する場合は、時間内に口座引き落としにご注意ください。リソースの無駄やアカウント控除の原因を避けるために、この記事で提供されているパラメータに従って厳密にパラメータを設定してください。実験が完了したら、時間内に圧力テストタスクを削除または無効にしてください。
  1. 実験を開始する前に、無料トライアルを開くことを選択してください。

画像.png

  1. パフォーマンス テスト PTS の無料トライアルを開きます。ラボ ページの下部でパフォーマンス テスト PTSを選択し、[今すぐ試す]をクリックします。[パフォーマンス テスト PTS] パネルサービス契約を確認し、 [今すぐ試す] をクリックしますこの時点で、トライアル申請が成功したことを示す送信成功ページにジャンプし、パフォーマンス テスト PTS サービスを無料で試すことができます。

注: パフォーマンス テスト PTS エキスパート バージョンの開始プロセスには料金は発生しません。実際のプロセスでは、パフォーマンス テスト (従量課金制) で 5000VUM + 無料の圧力テスト割り当てが提供され、超過分は次のように請求されます。後払いエキスパート バージョン具体的な請求の詳細については、パフォーマンス テストの PTS 課金ルールを参照してください。

  1. クラウド サーバー ECS の無料トライアルを開きます。ラボ ページの下部で、クラウド サーバー ECSを選択し、[今すぐ試す]をクリックします。クラウド サーバーのECSパネルで、次の手順に従ってパラメータ設定を完了し、プロトコルを選択して、[今すぐ試す]をクリックします。新しいページがポップアップ表示された場合は、最初は無視してかまいません。本トライアルチュートリアルでは以下の構成情報を例としていますが、実際の運用においては、実際の業務量やニーズに合わせて選択することをお勧めします。

画像.png

  1. ECS コンソール[ 5]に移動し、左側のナビゲーション バーで[インスタンスとイメージ] > [インスタンス]を選択します。上部のメニュー バーの左上隅で、トライアル インスタンスと同じリージョン (このチュートリアルの例では中国東部 1 (杭州)) を選択します。インスタンスのログインパスワードを設定します。作成したトライアルインスタンスを見つけて、操作列の画像.png右側にある> [インスタンスのプロパティ] > [インスタンスパスワードのリセット]をクリックし 、インターフェイスのプロンプトに従って ECS インスタンスのログインパスワードを設定します。トライアル インスタンスの ID をクリックし、[セキュリティ グループ]タブを選択し、 [セキュリティ グループ操作] 列の[ルールの構成]をクリックして、受信方向で許可する必要があるポートを追加します。このチュートリアルでは、ポート 80、443、22、3389、および 8080 がセキュリティ グループの受信方向で許可されます。

注: インスタンスの作成後、3 ~ 5 分程度でインスタンスのパスワードがリセットされることがありますが、リセットできない場合は、しばらく待ってからもう一度お試しください。

(2) ECS アプリケーションのワンクリック設定とデプロイメント

リソースを準備した後、ワンクリック構成を通じてリソースの構成やアプリケーションの構築を迅速に完了できます。ワンクリック構成は、Alibaba Cloud のリソース オーケストレーション サービス ROS に基づいて実装されており、開発者が IaC を通じてリソースの自動構成を体験できるようにすることを目的としています。テンプレートの完成したコンテンツには次のものが含まれます。

  • ECS インスタンスのセキュリティ グループを作成します。
  • LAMP環境を導入します。
  • LAMP 環境に基づいて、PbootCMS ソース コードを使用して Web サイトを構築します。
  1. ワンクリック構成テンプレートのリンク[ 6]を開いて ROS コンソールに移動すると、システムは新しいリソースを使用してリソース スタックを作成するためのパネルを自動的に開き、テンプレート コンテンツ領域に YAML ファイルの詳細情報を表示します。

  2. テンプレート選択ページでは、ROS コンソールは、前回コンソールにアクセスしたリージョンにデフォルト設定されます。この実験では、リージョンは中国北部 2 (北京) である必要があります。ページ上のすべてのオプションを変更せず、「次へ」をクリックして入力します。構成テンプレートパラメータページ

画像

  1. 構成テンプレートのパラメーターページで、リソース スタック名を変更し、無料トライアルの申し込み時に作成した ECS インスタンスを選択し、MySQL データベース パスワードを設定してデータベース root ユーザーのデフォルトのパスワードを変更します。必要な情報をすべて入力して確認したら、「作成」をクリックしてワンクリック構成を開始します。

例証します:

  • Apache、MySQL、および PHP をインストールするには、インターネット経由でアプリケーションをダウンロードする必要があり、構成時間はネットワークの安定性などの理由により異なる場合があります。待機期間中に、リソース スタック情報ページを更新して構成が完了したかどうかを確認したり、イベント タブをクリックして構成の詳細な進行状況を表示したりできます。
  • このチュートリアルのワンクリック構成テンプレートを同じ ECS インスタンスで繰り返し実行する場合は、MySQL データベースのパスワードが、テンプレートを初めて実行したときに設定したパスワードと正確に同じであることを確認してください。それ以外の場合、ワンキー構成の結果は利用できません。

画像.png

  1. リソース スタック情報ページで、8 ~ 10 分程度お待ちください。ステータスが「作成に成功しました」と表示されれば、ワンキー設定は完了です。

画像.png

  1. [リソース スタック情報]ページで[エクスポート]をクリックします。

画像.png

  1. 「出力」タブで、WebUrl ( http:///admin.php )の値をクリックします。

画像.png

  1. PbootCMS ログイン ページが表示され、ワンキー構成が成功したことが示されます。PbootCMSでは、グローバル構成、基本コンテンツ、記事コンテンツ、拡張コンテンツ、メンバーセンターなど、企業のニーズに合わせてWebサイトのコンテンツをカスタマイズできます。このステップの後続のコンソール操作はオプションであり、スキップできます。

画像.png

(3) パフォーマンス テスト PTS を開き、ストレス テストのシナリオを作成し、レポートを表示します。

  1. パフォーマンス テスト PTS コンソール[ 7]に移動します。

  2. 左側のナビゲーション バーで、[パフォーマンス テスト] > [シナリオの作成]を選択します。

画像.png

  1. [シナリオの作成]ページで[PTS 圧力テスト]をクリックします。

画像

  1. [Create PTS Scenario]ページシナリオ名を設定し、[Scenario Configuration]タブで圧力テスト API 名(demo など) を入力し、画像右側のアイコンをクリックします。圧力テストの URLフィールドにhttp://:80と入力します。

注: ECS のパブリック IP アドレスは、クラウド サーバー管理コンソールのインスタンス ページで確認できます[ 8] 。

画像

  1. [圧力設定]タブで、関連する応力測定パラメータを設定し、増分モードで自動増分を選択し最大同時実行数に50 を入力し、増分パーセントに 10 を入力し、単一レベル期間に1 を入力し、合計期間に5 を入力します。ストレステストのパラメータを確認したら、「保存」をクリックして圧力テストを開始します

注: 無料トライアルの割り当てを超過したことによる予期せぬ料金が発生しないように、ガイドラインに厳密に従ってパラメータを設定してください。

画像

  1. プロンプト ダイアログ ボックス、タスクの推定消費量が無料クォータを超えていないことを確認します。確認後「OK」をクリックして圧力テストを開始します

画像.png

  1. 3 分ほどお待ちいただくと、現在のアプリケーションのリアルタイムのストレス測定データがストレス測定ページに表示されます。ストレステストのページでは、成功率、RT、TPSなどの概要データを確認できます。

画像.png

画像.png

  1. 圧力テストが完了すると、自動的にシーン編集ページにジャンプし圧力テストレポートをクリックします。

画像.png

  1. [圧力テスト レポート]タブで圧力テスト レポートを見つけ、右側の[操作]列の下にある[表示]をクリックします。ストレス テスト レポートの内容について詳しくは、ストレス テスト レポートをご覧ください。

画像

画像

キャパシティプランニングとパフォーマンスのボトルネック分析

テスト結果データを取得した後、チューニングの準備としてシステム内のボトルネック ポイントを分析する必要があります。システムのパフォーマンス ボトルネック ポイントは主に、セキュリティ保護、負荷分散、バックエンド アプリケーション、ミドルウェア、データベース、オペレーティング システムに分散されています。システム、ハードウェア 仕様、特定のボトルネック、チューニングの詳細については、「キャパシティ プランニングとチューニング」シリーズの記事をご覧ください。

画像

36.png

関連リンク:

[1] インスタンスタイプファミリー

https://help.aliyun.com/document_detail/25378.htm#concept-sx4-lxv-tdb

[2]インスタンスタイプの説明

https://help.aliyun.com/document_detail/25620.htm#doc-api-Ecs-DescribeInstanceTypes

[3] 性能試験PTS

https://www.aliyun.com/product/pts

[4] パフォーマンステスト PTS の課金ルール

https://help.aliyun.com/document_detail/433167.html?spm=a2c4g.29269.0.0.67fa7f32p02i2O

[5] ECSコンソール

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2F

[6] ワンクリック構成テンプレートのリンク

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fros.console.aliyun.com%2Fregion%2Fstacks%2Fcreate%3Fspm%3Da2c4g.611918.0.0.3aec628amGQK9n%26templateUrl%3Dhttps %3A%2F%2Fstatic-aliyun-doc.oss-cn-hangzhou.aliyuncs.com%2Ffile-manage-files%2Fzh-CN%2F20230320%2Fonyv%2F%25E5%25BF%25AB%25E9%2580%259F%25E6 %2590%25AD%25E5%25BB%25BA%25E7%25BD%2591%25E7%25AB%2599.yml&lang=zh

[7] パフォーマンステスト PTS コンソール

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fpts.console.aliyun.com%2F&lang=zh

[8] クラウドサーバー管理コンソール

https://account.aliyun.com/login/login.htm?oauth_callback=https%3A%2F%2Fecs.console.aliyun.com%2Fserver%2Fregion%2Fcn-beijing

ここをクリックすると、ECS 仕様の選択と容量検証をすぐに実行できます

人民大学の卒業生らが全学生の情報を盗んで美人採点サイトを構築、刑事拘束された NTアーキテクチャをベースにしたWindows版QQが正式リリース 米国は中国の利用を制限トレーニング AI モデルを提供する Amazon、Microsoft などのクラウド サービスの オープンソース プロジェクトが機能開発を停止すると発表 2023 年に最も高給の技術職であるLeaferJS がリリース: オープンソースの強力な 2D グラフィックス ライブラリである Visual Studio Code 1.80 が サポート端末画像機能 . スレッド登録数3,000万突破 「変化」 deepin、7月のApple M1データベースランキングに合わせてAsahi Linux採用 :Oracle急上昇、再びスコア拡大
{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/3874284/blog/10086857