ブレサイズ

実行中のサイズ変更可能ジョブに割り振られているタスクを削減 または増加 するか、保留中のジョブのサイズ変更割り振り要求を取り消します。

概要

bresize サブコマンド
bresize [-h | -V]

サブコマンド・リスト

release [-c] [-rnc resize_notification_cmd | -rncn] リリース済みホスト仕様 job_ID
request [-c] [-rnc resize_notification_cmd | -rncn] [min_task,] タスク job_ID
cancel ジョブ ID

説明

bresize release コマンドを使用して、実行中のジョブからタスクを明示的に解放します。 割り振りからタスクを解放する場合、最初の実行ホスト上で少なくとも 1 つのタスクを保持する必要があります。 bresize release コマンドを使用して解放できるのは、ホストのみです (ホスト・グループや計算単位は解放できません)。 複合リソース要件からタスクを解放する場合、複合リソース要件の最後の用語で表されるタスクのみを解放できます。 以前の用語でタスクをリリースするには、 bresize release を繰り返し実行して、後続の最後の用語でタスクをリリースします。

bresize request コマンドを使用して、追加の割り振りタスクの手動要求をトリガーします。 LSF は、キューが最小タスク要求を満たすことができない場合、または要求がキューまたはアプリケーション・プロファイルの TASKLIMIT 値を超えている場合に、要求を保留します。 TASKLIMIT 値を変更しても、既に受け入れられている要求には影響しません。 複合リソース要件の場合、要求は最後の用語にのみ適用されます。 代替リソース要件の場合、要求は、初期タスク割り振りに使用された用語にのみ適用されます。 自動化可能ジョブでは、保留中の需要がある場合、まず brequest request -c コマンドまたは bresize cancel コマンドを実行して、前の保留中の需要を取り消す必要があります。 この手動要求をトリガーした後は、ジョブを再キューイングまたは再実行しない限り、ジョブは自動化できなくなります。

指定されたジョブ ID に対する保留中の割り振り要求を取り消すには、 bresize cancel を使用します。 アクティブな保留中の割り振り要求は、自動化可能なジョブに対して LSF によって自動的に生成されます。 ジョブにアクティブな保留中の要求がない場合、コマンドは失敗し、エラー・メッセージが表示されます。

デフォルトでは、ジョブ割り振りを変更するために bresize を実行できるのは、クラスター管理者、キュー管理者、root、およびジョブ所有者のみです。

ユーザー・グループ管理者は、 bresize を実行して、ユーザー・グループ内のジョブの割り振りを変更することができます。

オプション

-c
オプションです。 既存の割り振りからタスクを解放する場合 ( release サブコマンドの場合)、または新規の拡張要求を受け入れる前 ( request サブコマンドの場合)に、アクティブな保留中のリソース要求を取り消します。 デフォルトでは、このコマンドは、保留中の要求がないジョブのタスクのみを解放します。
-rnc リサイズ通知コマンド
オプションです。 ジョブ割り振りが変更されたときに最初の実行ホストで開始される実行可能ファイルの名前を指定します。 この設定は、この要求にのみ適用されます。この要求は、 bsub コマンドまたはアプリケーション・プロファイルで指定されたすべての通知コマンドをオーバーライドします。 サイズ変更通知コマンドは、ジョブ所有者のユーザー・アカウントの下で実行されます。
-rncn
ジョブ・レベルとアプリケーション・レベルの両方でサイズ変更通知コマンドを取り消します。 この設定は、この要求にのみ適用されます。
リリース・ホストの仕様
release サブコマンドでは必須です。 解放するホストのリストを定義します。 以下の構文は、リリースされたホスト仕様の EBNF 定義です。
<released_host_spec> ::= all | all <exclude_host_list_spec>
 | <host_list_spec><host_list_spec> ::= <host_spec>
 | <host_list_spec><host_spec><exclude_host_list_spec>
 ::= <exclude_host_spec> | <exclude_host_list_spec> <exclude_host_spec> <exclude_host_spec>
 ::= ~<host_spec> <host_spec>
 ::= [<positive_integer>*]<host_name>
すべて
ジョブによって現在使用されているすべてのタスクを指定します。 all オプションを単独で使用すると、1 つのタスクを除くすべてのタスクが最初の実行ノードから解放されます。 all オプションは、波形記号 (not) 演算子 (~) を使用して除外するホストのリストと一緒に使用することもできます。
ホスト仕様
host_nameで指定されたホスト上の positive_integer で指定されたタスク数を解放します。 タスクの数が指定されていない場合、指定されたホスト上のすべてのタスクが解放されます。
~
タスクを解放するときに除外するホストを指定します。 指定されたホスト上のタスクは解放されません。 波形記号 (NOT) 演算子 (~) は、 all キーワードと一緒に使用する必要があります。
最小タスク
オプションです。 ジョブに追加されるタスクの最小数です。 LSF は、キューが最小タスク要求を満たすことができない場合に、手動ジョブ・サイズ変更要求を保留します。
タスク
request サブコマンドに必要です。 ジョブに追加されるタスクの最大数です。
job_id
必須。 サイズ変更されるジョブのジョブ ID です。 ジョブ配列の場合、これには配列指標も含まれます。
-h
コマンドの使用法を stderr に出力して終了します。
-V
リリース・バージョンを stderr に出力して終了します。

以下の例はすべて、ID が 100 のジョブのサイズを変更します。

4ノード(2ノードは hostB,、 hostC2ノードは hostAhostD2ノードは)にまたがる8つのタスクを使用する hostAジョブの場合、以下のコマンドはノード上のタスクを除くすべてのタスクを解放します。 hostAでは、タスクが解放されると、ジョブ割り振りは 2 になります。
bresize release "all ~hostA" 100
以下のコマンドは、1 つのタスクを除くすべてのタスクを hostAから解放します。 タスクが解放されると、 hostA上のジョブ割り振りは 1 になります。
bresize release all 100 or bresize release "all ~1*hostA" 100
以下のコマンドは、4 つのホストのそれぞれから 1 つのタスクを解放します。 タスクが解放されると、ジョブ割り振りは hostAでは 1、 hostBでは 1、 hostCでは 1、 hostDでは 1 になります。
bresize release "1*hostA 1*hostB 1*hostC 1*hostD"  100
次のコマンドは、合計 10 個のタスクをジョブに追加することを要求します。 要求は、 LSF が 10 個の要求されたタスクすべてをジョブに追加できない場合に追加されます。
bresize request 10 100
次のコマンドは, ジョブに追加される最小 4 個および合計 10 個のタスクを要求します。 LSF がジョブに 4 つ以上のタスクを追加できない場合、要求は保留になります。
bresize request 4,10 100

関連資料

bsub, lsb.applications