IBM Support

WebSphere Application Serverのサーバー起動/停止時に発生する問題に必要な取得資料について

Question & Answer


Question

start,stop.faile to start server

Answer

この文書は、WebSphere Application Server(以下、WAS)のサーバー起動/停止時に発生する問題について、調査に必要な取得資料を説明しています。
ここでのサーバーには、デプロイメント・マネージャー、ノード・エージェント、アプリケーション・サーバーを含みます。
IBMサポートに連絡する前にこの文章に記載されている情報を集めることにより、問題を正しく理解し、資料の解析時間を短縮することができます。
 


目次
■ 手動設定による資料収集手順
当文書は、下記technoteを参考に作成しています。

"MustGather: Application Server, dmgr, and nodeagent start and stop problems"
https://www.ibm.com/support/pages/node/338581
■ 手動設定による資料収集手順
■ 手動設定による資料収集手順

【事前準備】

お客様状況にあわせて、いずれかの方法を選択します。
1.サーバーが起動できない場合 / 管理コンソールにログインできない場合
2.管理コンソールにアクセス可能な場合


●1.サーバーが起動できない場合 / 管理コンソールにログインできない場合:
サーバーが起動できない場合は、下記の手順にてserver.xmlへ直接トレース設定を行います。

1. 次のディレクトリー配下のファイルを削除または退避させてください。
  • WAS_PROFILE/logs/server_name
    WAS_PROFILE/logs/ffdc
  • 2. 下記のファイルをエディター等で開きます。
    • WAS_PROFILE/config/cells/cell_name/nodes/node_name/servers/server_name/server.xml

    3. server.xml内にある下記の2箇所のエントリーを変更します。
    ※トレース取得後は、"修正前"の状態に戻します。
    • ・startupTraceSpecification設定変更
      修正前:
      ----
      startupTraceSpecification="*=info"
      ----
    • 修正後:
      ----
      startupTraceSpecification="*=info:com.ibm.ws.*=all" 
      ----
    • ・maxNumberOfBackupFiles設定変更 
      修正前:
      ----
      maxNumberOfBackupFiles="10"
      ----
    • 修正後:
      ----
      maxNumberOfBackupFiles="20"
      ----
    • ・rolloverSize設定変更 
      修正前:
      ----
      rolloverSize="10"
      ---- 
    • 修正後:
      ----
      rolloverSize="100"
      ----

    4. 変更を保存します。

2.管理コンソールにアクセス可能な場合

2.管理コンソールにアクセス可能な場合


サーバー停止時の問題等、管理コンソールにアクセス可能な場合には、下記の手順にてトレースの設定を行います。

以下のリンク内の手順に沿って、「ランタイム・モード」でトレース出力の設定を行います。    
『IBM WebSphere トレースを設定する手順』
https://www.ibm.com/support/pages/node/215539

指定いただきたい「トレース仕様」は以下の通りです。
  • ----
    *=info:com.ibm.ws.*=all
    ----
  • 【事象再現・発生】
    1.サーバー起動時の問題:
    下記のコマンドを実行し、サーバーを起動します。

     startServer.bat(sh) <server_name> -trace

    - startManager.bat(sh) / startNode.bat(sh)を実施いただいても構いません。
    - トレースはprofile_root/logs/server_name/startServer.logへ出力されます。
    - startServer.log以外へ別途トレースを出力させたい場合には、下記のコマンド(-logfileオプション)にて出力ファイルを指定します。
     "-logfile"オプションをつけなかった場合には、profile_root/bin配下へ出力されます。
      startServer.bat(sh) server_name -trace -logfile path_to/servertrace.out

    2.サーバー停止時の問題:
    下記のコマンドを実行し、サーバーを停止します。

     stopServer.bat(sh) <server_name> -trace

    - stopManager.bat(sh) / stopNode.bat(sh)を実施いただいても構いません。
    - トレースはprofile_root/logs/server_name/stopServer.logへ出力されます。
    - startServer.log以外へ別途トレースを出力させたい場合には、下記のコマンド(-logfileオプション)にて出力ファイルを指定します。
     "-logfile"オプションをつけなかった場合には、profile_root/bin配下へ出力されます。
      stopServer.bat(sh) server_name -trace -logfile path_to/servertrace.out
  補足:
    WASの停止処理自体が止まっている状況で、何もログに出力されない場合には、
    何の処理で止まっているかを調査するために、javacoreなどハングアップ時の
    Mustgather資料(AIX, Linux, Windows[ツールで取得する場合/個別に取得する場合])を
    追加でお願いする事があります。
    上記リンクのMustgatherで必要な資料を取得できますが、例えば kill -3 で、
    プロセスにSIGQUITを送信することで、個別にjavacoreを取得することもできます。
    例: # kill -3 <PID>
      * [PID]は、稼動中のWASプロセスのプロセスIDです。
    時間をおいて、複数回実行していただけると、より具体的にハングアップの状況を判断できますが、
    javacoreをどれくらいの間隔で何回実行すべきかは、個々の事象によって変わります。
    基本的に、ハングしている間に短い間隔(20-30秒)で数回以上は取得できることが望ましいです。
    また、問題の内容によっては、core dumpを依頼する場合もあります。

【事象発生後】
コレクター・ツールを実行します。
コレクター・ツールの実行により、WASのログおよび構成ファイルをまとめて取得することが可能です。
 収集方法は以下のリンクを参照してください。
 参照:『ログの収集(コレクターもしくは個別ファイル)』
 https://www.ibm.com/support/pages/node/709277

【送付資料】
- コレクター・ツールの実行結果(WASのログおよび構成ファイル)
- 問題発生時に実施したコマンド
- 問題を再現させた日時

[{"Line of Business":{"code":"LOB45","label":"Automation"},"Business Unit":{"code":"BU059","label":"IBM Software w\/o TPS"},"Product":{"code":"SSEQTP","label":"WebSphere Application Server"},"ARM Category":[{"code":"a8m50000000CdWJAA0","label":"System Management-\u003ETraditional WAS-\u003EStart\/Stop"}],"ARM Case Number":"","Platform":[{"code":"PF002","label":"AIX"},{"code":"PF010","label":"HP-UX"},{"code":"PF016","label":"Linux"},{"code":"PF027","label":"Solaris"},{"code":"PF033","label":"Windows"}],"Version":"7.0.0;8.0.0;8.5.0;8.5.5;9.0.0;9.0.5"}]

Document Information

Modified date:
04 November 2021

UID

swg21673397