SmartX ストレージ パフォーマンス テスト ツール OWL を使用してパフォーマンス管理を最適化する方法は?

著者: 業界に深く関与する SmartX Financial チーム、Zhang Ruisong 氏

運用保守担当者が日常的にクラスターを管理していると、次のような混乱が避けられない場合があります。

  • 新しいサービスをオンラインにする準備ができました。複数のストレージ セットがある場合、サービスを実行するストレージ環境を選択するにはどうすればよいですか?

  • ビジネス仮想マシンは、最初に起動したときは非常に高速に実行されますが、一定期間実行すると、ソフトウェアやハードウェアに直感的な問題がないにもかかわらず、動作が遅くなるのはなぜですか?

  • 企業は、仮想マシンのパフォーマンスが上がったり下がったりしていると報告しています。何が起こっているのでしょうか?

  • 新しく発売されたストレージは当初の構成とは異なりますが、両者の性能差やどのようなビジネスに適しているのかをどのように判断すればよいのでしょうか?

これらのシナリオにはすべてストレージ パフォーマンスの監視が含まれており、運用および保守担当者が監視データを使用してビジネスの配置を合理的に調整し、パフォーマンスを最適化する能力もテストされます。

ユーザーがクラスター ストレージのパフォーマンスをより適切に管理できるようにするために、SmartX は自動ストレージ パフォーマンス テスト ツール OWL を独自に開発しました。この記事では、OWLの機能と使用法を紹介し、OWLテスト結果を使用してパフォーマンス管理を最適化し、実際のアプリケーションを通じてパフォーマンスのボトルネックを回避する方法を示します。

OWLツールの紹介

OWL は、SmartX が開発した自動ストレージ パフォーマンス テスト Web プラットフォームで、パフォーマンス取得ツールとして fio を使用してクラスター パフォーマンス ストレス テストを実行します。fio はマルチキュー、マルチ帯域幅、マルチ I/O モデルのテスト シナリオに合わせて調整できるため、ほとんどのビジネス I/O をシミュレートできます (たとえば、fio は MySQL のパフォーマンス テストやチューニングによく使用されます)。 OWLをサポートする最も人気のあるソフトウェアとなっています。良い選択です。さらに、OWLはSmartXハイパーコンバージド・クラスタにバインドされていないため、ユーザーはパフォーマンス・テストのために他の環境でOWLを使用することもできます

OWLは次の3つの方法でユーザーを支援できます。

さまざまなハードウェア構成に適応し、ストレージの各セットに独自のストレージ パフォーマンス「ベースライン」を提供します。

ITインフラ新荘変革のニーズを満たすために、ユーザーはこれまで接触したことのない国内のアクセサリを購入する可能性があります。エンジニアは、さまざまなアクセサリを組み合わせて、これらの新しいストレージ構成がどの程度のパフォーマンスを達成できるか、またどのようなアプリケーションやデータベースをサポートしているかを理解する必要があります。従来の検証方法は、新しいアーキテクチャを直接使用してビジネス仮想マシンをテスト実行することですが、OWLを使用すると、同様のI/Oモデルをシミュレートすることでクラスタのパフォーマンスを検証でき、それによってこのクラスタ ストレージのパフォーマンス ベースラインをテストできます。

ストレージ パフォーマンス ベースラインを参照して、サービス仮想マシンを分類して起動する

ユーザーは、OWLが提供するストレージ・パフォーマンス・ベースラインに基づいて、オンラインにする必要があるビジネス仮想マシンに適切なストレージ・クラスタを選択できます。たとえば、IOPS が大きいデータベース サービスの場合はオールフラッシュ クラスターを使用でき、IOPS が比較的軽くデータ インタラクションが少ないビジネスの場合は、コスト パフォーマンスの高いハイブリッド フラッシュ クラスターを使用できます。

さらに、OWLは、ユーザーが各ホストが実行できる最大I/Oを事前に知ることができることに加えて、ユーザーがビジネスをオンライン化する前に必要となる可能性のあるI/Oサイズを理解するのに役立つシミュレーション環境を構築することもできます。回避するために仮想マシンの配置を割り当てる1 台のホスト上に大きな帯域幅を占有する複数の仮想マシンを配置すると、ビジネスが正式に開始された後に帯域幅が「ビジネスに追われる」ことになります。

アラーム機能と組み合わせることで、パフォーマンスのボトルネックリスクを事前に警告します

OWLを使用してパフォーマンス・テストのベースラインを取得した後、ユーザーは各クラスタのアラーム・ルールでストレージ・パフォーマンスに対応する読み取りおよび書き込み帯域幅のしきい値を設定できます。仮想マシンの帯域幅がメイン帯域幅の 70% と 80% に達すると、運用エンジニアとメンテナンス エンジニアはそれぞれアラーム プロンプトを受け取り、仮想マシンと他のホストの帯域幅使用状況を適時に監視します。このようにして、ユーザーは、新しいビジネスが開始される前に、この仮想マシンを比較的アイドル状態のホストまたはクラスターに移行できます。

OWLの利用方法とテストの流れ

試験前の準備

OWLツールは仮想マシンの形式で動作するため、ユーザーはovfをインポートし、OWLのIPアドレスを構成し、OWLとテストVM間のSSH通信を確保する必要があります。テスト VM の構成要件は次のとおりです。

  • Linux 2c 4G 40G+50G

  • IPアドレスを設定し、OWLツールsshで通信する

  • FIO ソフトウェアをインストールする

テストプロセス

  1. OWL Webインターフェースにログインします。

  2. テストモデルを作成します。

  3. テストオブジェクトを追加します。

  4. テストタスクを作成します。

  5. テストタスクを開始します。

  6. OWLはアラーム機能を組み合わせて、パフォーマンスのボトルネックのリスクを事前に警告します。

詳細なテスト プロセスについては、次のデモを参照してください:クラスター ストレージ パフォーマンスの監視、管理、および自動テスト ツールの紹介

テスト結果を使用してストレージ パフォーマンス管理を最適化する

共通テストモデル

以下は、デモンストレーションでよく使用される I/O テスト モデルです。

写真

警報閾値の計算と設定方法

上記のテストを通じてパフォーマンスのベースラインを取得した後、ユーザーは対応する書き込み帯域幅のしきい値と読み取り帯域幅のしきい値を計算し、クラスターにアラーム ルールを追加できます。次の図を例に、閾値の計算方法を紹介します。

2部

写真

上記の 2 つのデータ セットは、8 ノード クラスター内の 1 台の仮想マシンを実行する 1 台のホスト、および 1 台の仮想マシンを実行する 8 台のホストでそれぞれテストされました。

私たちが主に焦点を当てているのは帯域幅です。書き込み帯域幅を例にとると、8P8V 256K シーケンシャル書き込みシナリオでは、書き込み帯域幅は 7278 です。7278 を 8 で割って各ノードの平均帯域幅を取得し、MBPS を BPS に変換します。この値の 70% が、注意レベルとして設定する必要があるアラームしきい値になります。

書き込み帯域幅重大アラームしきい値については、8P1V 256K シナリオの値を見ていきます。ここでの書き込み帯域幅は 1656.86 MBPS で、単位変換後、この値の 80% が重大度アラームのしきい値として直接使用されますこれから、次の図に示すように、2 つの書き込み帯域幅のしきい値が得られます。

写真

リード帯域警報閾値の計算方法はライト帯域と同様で、上記の例では、リード帯域閾値の設定は下図のようになります。

写真

ユーザーの実践

ケース 1: 運用および保守エンジニアは、ビジネスへの影響を回避するためにパフォーマンス アラームをタイムリーに受信します。

ユーザーがOWLツールを使用して帯域幅ストレステストを実施したところ、クラスター内の特定のノードの帯域幅が1.7 GB/秒を超え、重大な警告レベルのしきい値を超えていることがわかりました。SmartX は、バックグラウンドでアラームを自動的に送信し、運用およびメンテナンスのエンジニアにストレージのパフォーマンスが限界に近づいていることを知らせ、ビジネスへの直接的な影響を回避します。

写真

ケース 2: 国有銀行は、OWL でカスタマイズされた I/O モデルを使用してクラスターのパフォーマンスをテストします

規制要件を満たすために、ある国有銀行はOWLを使用して、カスタマイズされたI/Oモデル(48K、randrw=1:9)に従って連続12時間クラスタのパフォーマンスをテストしました。テスト結果は (下の図に示すように)、クラスターの平均 IOPS の標準偏差が 54338 に達し、遅延が約 1 ミリ秒であることを示しています。

写真

ケース 3: 国営銀行は OWL を使用して、クラスターのパフォーマンスが 99 パーセンタイルの要件を満たしているかどうかを評価します。

ある国営銀行は、99 パーセンタイル要件に注目し、OWL を使用して対応するブロック サイズでストレージ パフォーマンスをテストし、このシナリオでのクラスターのパフォーマンスを直感的に理解しました。試験結果を図に示します。

写真

SmartX ハイパーコンバージド インテリジェントな運用および保守機能の詳細については、「SmartX ハイパーコンバージド ハードディスクの健全性検出メカニズムと運用および保守の実践を理解するための記事」を参照するか、以下の QR コードをスキャンして「SmartX ハイパーコンバージド テクノロジーの原則と機能分析コレクション (VMware 比較の詳細を含む)」電子ブック。

おすすめ

転載: blog.csdn.net/weixin_43696211/article/details/132599142