リソースグループ¶
最終更新日:2025年4月25日
玄界の計算ノードはノードグループごとに複数のリソースグループが設定されており、計算ノードを利用する際にはリソースグループを意識してジョブを実行する必要があります。
プログラムを翻訳・編集結合・実行する方法は、大きく対話型処理とバッチ処理に分かれます。
対話型処理とは、利用者がコマンドを入力することによってソースプログラムの翻訳処理や実行可能プログラムの実行などをインタラクティブに行なう利用方法のことです。対話型処理は、翻訳や小規模なプログラムの実行に適しています。
バッチ処理とは、利用者が一連のプログラム実行を記述した「ジョブスクリプトファイル」を作成し、そのジョブを計算機に一括で実行させる方法です。バッチ処理は、多くの記憶領域を必要とするプログラムや長い実行時間を要するプログラム、並列度の高いプログラムの実行に適しています。
また、リソースグループの制限値とは別に、同時使用コア数に制限値が設定されています。制限値を超えるジョブが投入された場合には、リソースグループの混雑状況によらずに待ち状態になります。
ノードグループA¶
|
リソースグループ |
CPUコア数 |
ノード数 |
使用可能メモリ量 |
最長実行時間 |
|---|---|---|---|---|
|
a-batch |
1~120 |
- |
3.7GiB*コア数 |
168時間 |
|
a-batch |
1~128 |
- |
453GiB*ノード数 |
1ノード以下:168時間 |
|
a-inter |
1~120 |
- |
3.7GiB*コア数 |
6時間 |
|
a-inter |
1 |
- |
453GiB |
6時間 |
- 使用可能メモリ量、最長実行時間は指定したCPUコア数もしくはノード数によって決まります。
- 120コア未満を指定した場合、同じノードで実行される別のジョブの影響により実行性能が低下する可能性があります。
ノードグループB¶
|
リソースグループ |
GPU数 |
ノード数 |
割り当てられるCPUコア数 |
使用可能メモリ量 |
最長実行時間 |
|---|---|---|---|---|---|
|
b-batch |
1~4 |
- |
30コア*GPU数 |
226.7GiB*GPU数 |
168時間 |
|
b-batch |
- |
1~4 |
120コア*ノード数 |
907GiB*ノード数 |
1ノード以下:168時間 |
|
b-inter |
1~4 |
- |
30コア*GPU数 |
226.7GiB*GPU数 |
6時間 |
|
b-inter |
- |
1 |
120コア |
907GiB |
6時間 |
|
b-batch-mig |
1~28(仮想) |
- |
- |
32.3GiB*仮想GPU数 |
168時間 |
|
b-inter-mig |
1~28(仮想) |
- |
- |
32.3GiB*仮想GPU数 |
6時間 |
- CPUコア数、使用可能メモリ量、最長実行時間は指定したGPU数によって決まります。
- b-batch-migとb-inter-migでは、1基の物理GPUを7基の仮想GPUに分けるNVIDIA社のMIG機能を利用します。
- b-batchと b-interで4GPU未満を指定した場合、およびb-batch-mig、b-inter-migで28GPU未満を指定した場合は、同じノードで実行される別のジョブの影響により実行性能が低下する可能性があります。b-batch-mig/b-inter-migで複数のGPUを指定した場合は複数の物理GPUにまたがってGPUが確保されることがあります。(同一物理GPU上での確保を強制する手段はありません。)
ノードグループC¶
|
リソースグループ |
GPU数 |
ノード数 |
割り当てられるCPUコア数 |
使用可能メモリ量 |
最長実行時間 |
|---|---|---|---|---|---|
|
c-batch |
1~8 |
- |
14コア*GPU数 |
930.6GiB*GPU数 |
24時間 |
|
c-batch |
- |
1 |
120コア |
7.1TiB |
24時間 |
|
c-inter |
1~8 |
- |
14コア*GPU数 |
930.6GiB*GPU数 |
6時間 |
|
c-inter |
- |
1 |
120コア |
7.1TiB |
6時間 |
- CPUコア数、使用可能メモリ量、最長実行時間は指定したGPU数によって決まります。
- 8GPU未満を指定した場合、同じノードで実行される別のジョブの影響により実行性能が低下する可能性があります。
同時使用コア数の制限¶
リソースグループa-batchとb-batchに対し、ユーザーあたり・グループあたりにそれぞれ同時使用コア数の制限値が設定されています。制限値を超えてジョブを投入された場合、同時使用コア数が制限値より低くなるまで実行されません。
a-batch¶
|
リソースグループ |
コア数の制限値 |
|---|---|
|
ユーザあたり |
15,600 (=130x120) |
|
グループあたり |
31,200 (=260x120) |
b-batch¶
|
リソースグループ |
コア数の制限値 |
|---|---|
|
ユーザあたり |
1,000 |
|
グループあたり |
2,000 |