IBM Support

[Db2] 11.5.7: Pacemaker による HA クラスターが正常動作しないことがある

Troubleshooting


Problem

Db2 11.5.7 で Pacemaker による HADR のクラスターを構成したとき、インスタンス・リソースの制御が正しく行われず、以下のような問題が起きることがあります。
  • Primary の異常終了で TAKEOVER が発生せず、Primary ホストで Primary が再起動される
  • Primary の異常終了で TAKEOVER が行われるが、新 Primary も再起動される
  • Standby 異常終了後に Primary も再起動される

Cause

Db2 11.5.7 に含まれる db2inst リソース・エージェントの不具合により、障害イベント発生時にリソース・エージェントがハング (ループ) することがあります。この結果クラスターで予期しない動作が発生する可能性があります。
この問題は IT39589 として報告され、Db2 11.5.8 で修正されています。
この問題は Db2 に同梱の Pacemaker にも影響する以下の障害によるものですが、IT39589 の修正によって Pacemaker の障害を回避しています。
RHBA-2022:7833 - Bug Fix Advisory
Db2 が提供している Pacemaker のリソース・エージェントについては以下のページを参照してください。

Resolving The Problem

Db2 11.5.7 で Pacemaker をご利用の場合は special build (zLinux, Linux PPCLE, Linux x86-64) の適用をご検討ください。
special build は Universal フィックスパック形式で提供されています。マニュアルを参照して通常のフィックスパックと同様に適用してください。
注:special build の適用にあたり、事前に 11.5.7 を適用する必要はありません。
 
お問合せ先
技術的な内容に関して、パスポート・アドバンテージの契約のもと Db2 テクニカル・サポートへお問い合わせください。
Db2 テクニカル・サポート

Document Location

Worldwide

[{"Type":"MASTER","Line of Business":{"code":"LOB10","label":"Data and AI"},"Business Unit":{"code":"BU058","label":"IBM Infrastructure w\/TPS"},"Product":{"code":"SSEPGG","label":"Db2 for Linux, UNIX and Windows"},"ARM Category":[{"code":"a8m3p0000006xc1AAA","label":"High Availability-\u003EPacemaker"}],"ARM Case Number":"","Platform":[{"code":"PF002","label":"AIX"},{"code":"PF016","label":"Linux"}],"Version":"11.5.7"}]

Document Information

Modified date:
15 August 2023

UID

ibm16571523