コンテンツにスキップ

短時間ジョブの優先実行について(バッチジョブを早く実行開始させる方法について)

実行中のジョブやキューに実行待ち状態のジョブが多数ある場合は、ジョブを投入しても実行が開始されるまで長い時間がかかります。
ジョブの状態は pjstat コマンドまたは pjstat2 コマンド、リソースグループの使用状況は show_rsc コマンドで確認が可能です。

show_rsc コマンドでは固定利用に割り当てられたノードは表示されませんが、固定利用のユーザがノードを利用していない際は他のユーザの短時間ジョブが実行可能です。
この空きノードの状況は show_rsc で表示されません。

予約ジョブを実行する余裕を残す都合により、一部の計算ノードは予約ジョブが実行されていない際には短時間ジョブのみが実行可能です。
この空きノードの状況は show_rsc で表示されます。
(a-batch/a-inter や b-batch/b-inter の simplex モードに含まれています)

実行可能な短時間ジョブの条件

以下の条件を全て満たす必要があります:

  • 共有リソースグループ(a-batch, a-inter, b-batch, b-inter のいずれか)を指定している
  • ノード占有ジョブである(vnode-core や gpu を指定していない)
  • 要求経過時間(elapse)が 1時間以下(固定利用ノード)または 30分以下(予約ジョブ用ノード)

計算ノード群が混んでいる場合は短時間ジョブの利用をご検討ください。
(同時実行数の制限により待たされている場合は実行できない点にも注意してください)