スイッチ・アラートのトリガー条件

IBM Storage Insights Pro を設定して、スイッチの属性とパフォーマンスを調査し、変更または違反が検出されると通知するようにできます。

アラートによって、以下のリソースについて、一般的な変化やパフォーマンスの問題を通知することができます。
重要: アラートを通知できるすべての属性がここにリストされているわけではありません。 アラートの基準となる属性の完全なリストを表示するには、アラート・ポリシーが割り当てられていないスイッチのアラート定義を編集するか、新たにカスタム・アラート・ポリシーを作成してそのポリシーに新規アラートを定義します。 カスタム・アラート・ポリシーを作成するには、 「構成」 > 「アラート・ポリシー」 に移動し、 「ポリシーの作成」をクリックします。

デフォルト・アラート・ポリシー内のアラートに対して自動的に構成される属性、またはデフォルト・アラートの状況は「アクティブ」です。 以下の情報では、デフォルト・アラートにアスタリスク (*) のマークが付けられています。

スイッチ (一般的な変化)

表 1. スイッチの事前定義アラート
一般属性 属性の定義条件

正常に実行された最後のプローブ

正常に実行された最後のモニター

プローブまたはパフォーマンス・モニターがスイッチに関するデータを正常に収集してから、指定された時間が経過しました。 このアラートを使用して、スイッチに関する最新の構成データ、状況データ、またはパフォーマンス・データが収集されていない場合、およびその既存データが失効している可能性がある場合に通知されるようにします。 この状態は、リソース、ネットワーク、またはサーバーが使用できない場合に発生する可能性があります。

プローブ状況*

プローブで以下のいずれかの状況が検出された場合に、アラートを生成します。
失敗
データ収集中にエラーまたは警告が発生しました。 この状況は、プローブでリソースに関するいずれのデータも収集されなかったか、一部のデータ・セットしか収集されなかったことを示します。
警告
プローブは完了しましたが、完全なデータ・セットが収集されなかった可能性があります。 この状況は、リソースの 1 つ以上の内部リソースについてデータを収集できない場合に発生する可能性があります。
エラー
リソースに関する資産データの収集時にプローブが完了しませんでした。 この状況は、データ収集時にリソースに到達できない場合に発生する可能性があります。

パフォーマンス・モニター状況*

パフォーマンス・モニターで以下のいずれかの状況が検出されました。
失敗
データ収集中にエラーまたは警告が発生しました。 この状況は、パフォーマンス・モニターでリソースに関するいずれのデータも収集されなかったか、一部のデータ・セットしか収集されなかったことを示します。
警告
パフォーマンス・モニターは完了しましたが、完全なパフォーマンス・データのセットが収集されませんでした。 この状況は、データ収集中にリソースがリブートされた場合、リソースによって有効なパフォーマンス・データが提供されなかった場合、あるいはリソースまたはその関連エージェントとの通信エラーが発生した場合に発生する可能性があります。
エラー
リソースに関するパフォーマンス・データの収集の収集時にパフォーマンスが完了しませんでした。 この状況は、データ収集時にリソースに到達できない場合、あるいはリソースの構成データが使用できない場合に発生する可能性があります。
状況*
スイッチで以下のいずれかの状態が検出されました。
異常
スイッチまたはその内部リソースでエラー状況または警告状況が検出されました。
警告
スイッチまたはその内部リソースで警告状況が検出されました。
エラー (デフォルト)
スイッチまたはその内部リソースでエラー状況が検出されました。 例えば、スイッチがオフラインになったときにエラー状況が発生する可能性があります。
到達不能
スイッチに関する 1 つ以上のモニター対象リソースが応答していません。 この状況は、ネットワークに問題があるために発生した可能性があります。

スイッチ (パフォーマンス)

スイッチのパフォーマンスが指定されたしきい値の範囲外になった場合に通知するアラートを定義します。 アラートでは、スイッチ・ポートのパフォーマンスを測定するメトリック (I/O 速度、データ速度、エラー率、フレーム転送サイズなど) に基づいて、条件を指定できます。 パフォーマンス条件を指定してアラートを作成することで、ネットワーク・インフラストラクチャーにおける潜在的なボトルネックに関する通知を受けることができます。

例えば、ポートのポート輻輳インデックスが指定されたしきい値以上になると通知されるようにするアラートを定義できます。 ポート輻輳は、バッファー・クレジットの不足のために遅延したフレーム伝送の推定される程度を表します。 このアラートを使用すると、これらのポートの接続先であるリソースのパフォーマンスを低下させている可能性があるポート条件を特定することができます。

使用率が低くなっている可能性があるポートを特定する場合など、メトリックが指定されたしきい値を下回った場合に通知されるようにすることもできます。

アラートを出すことができるスイッチ・メトリックの完全なリストについては、 スイッチのパフォーマンス・メトリックを参照してください。
パフォーマンス条件のヒント:
  • IBM Storage Insights Pro がしきい値に違反しているかどうかを判断し、パフォーマンス条件に対してアラートが生成される前に、Data Collection をリソースに対して一定期間実行する必要があります。
  • トランクのパフォーマンス・アラートを定義すると、トランク内のすべてのスイッチ間リンク (ISL) のパフォーマンスが集約され、しきい値と比較されます。 パフォーマンスを測定してアラートを出すには、接続に関係する両方のスイッチの ISL に関するパフォーマンス・メタデータを収集する必要があります。 単一の ISL がしきい値を超えているかどうかを判別するには、ポート・パフォーマンスのアラートを定義します。

    アラートを出すことができるのは、 ISL 接続タイプのパフォーマンスのみです。 その他のタイプのスイッチ間接続 ( ISL トランクなど) の場合、パフォーマンス・メタデータは収集されません。

ベスト・プラクティス: パフォーマンス条件のしきい値を設定する場合は、誤ったアラートを多く生成することなく最大限のメリットを得られるように、最適な値を決定してください。 適切なしきい値は、実行するワークロードのタイプ、ハードウェア構成、物理ディスクの数、正確なモデル番号などの要因によって大きく異なるので、簡単あるいは標準的なデフォルト規則はありません。

何週間にもわたってリソースのパフォーマンスをモニターし、その履歴データを使用して、各パフォーマンス条件の妥当なしきい値を決定する方法をお勧めします。 値の決定後は、条件設定を微調整して、誤ったアラートの数を最小限にすることができます。

「アラート定義の編集」をクリックし、各パフォーマンス・アラート定義に対して「ヒストリーの表示」をクリックして、スイッチ、ポート、またはトランクのパフォーマンスの履歴を確認し、そのデータを基準にして必要なしきい値を設定します。

スイッチ間接続 (パフォーマンス)

ISL のパフォーマンスが指定されたしきい値を超えた場合に通知するアラートを定義します。 アラートでは、入出力、データ、エラー率、フレーム転送サイズなど、ISL のパフォーマンスを測定するメトリックに基づいて条件を指定できます。 パフォーマンス条件を指定してアラートを作成することで、ネットワーク・インフラストラクチャーにおける潜在的なボトルネックに関する通知を受けることができます。

例えば、ISL 内のポートの集合ポート輻輳インデックスが、指定されたしきい値以上になったときに通知されるアラートを定義できます。 ポート輻輳は、バッファー・クレジットの不足のために遅延したフレーム伝送の推定される程度を表します。 このアラートを使用すると、これらのポートの接続先であるリソースのパフォーマンスを低下させている可能性があるポート条件を特定することができます。 また、使用率が低い可能性がある ISL を識別したい場合など、メトリックが指定されたしきい値よりも小さい場合に通知を受け取ることもできます。

ヒント: アラートを出すことができるのは、ISL 接続のパフォーマンスのみです。 その他のタイプのスイッチ間接続の場合、パフォーマンス・メタデータは収集されません。

アラートの対象となるスイッチ間接続メトリックの完全なリストについては、 スイッチのパフォーマンス・メトリック を参照してください。

ポート (一般的な変化)

表 2. ポートの事前定義アラート
一般属性 属性の定義条件

除去済みポート

以前にモニターされていたポートを検出できなくなりました。 ポートに関する履歴データは保存されていますが、現在のデータは収集されていません。 このアラートを使用して、ポートが除去された場合や使用不可になった場合に通知されるようにします。

状態

ポートは、オンライン、有効 (オフライン)、または無効のいずれかです。

状況*

ポートで以下のいずれかの状況が検出されました。
異常
ポートでエラー状況または警告状況が検出されました。
警告
ポートで警告状況が検出されました。 この状況は、スイッチが停止された場合、開始中の場合、またはサービス中 (保守中、クリーンアップ中、または管理中) の場合に起こることがあります。
エラー
ポートでエラー状況が検出されました。

ポート (パフォーマンス)

ポートのパフォーマンスが指定されたしきい値の範囲外になった場合に通知するアラートを定義します。 アラートでは、スイッチ・ポートのパフォーマンスを測定するメトリック (I/O 速度、データ速度、エラー率、フレーム転送サイズなど) に基づいて、条件を指定できます。 パフォーマンス条件を指定してアラートを作成することで、ネットワーク・インフラストラクチャーにおける潜在的なボトルネックに関する通知を受けることができます。

例えば、ポートのポート輻輳インデックスが指定されたしきい値以上になると通知されるようにするアラートを定義できます。 ポート輻輳は、バッファー・クレジットの不足のために遅延したフレーム伝送の推定される程度を表します。 このアラートを使用すると、これらのポートの接続先であるリソースのパフォーマンスを低下させている可能性があるポート条件を特定することができます。

使用率が低くなっている可能性があるポートを特定する場合など、メトリックが指定されたしきい値を下回った場合に通知されるようにすることもできます。

アラートを出すことができるポート・メトリックの完全なリストについては、 スイッチのパフォーマンス・メトリック を参照してください。