Skip to content

Commit

Permalink
Merge pull request #504 from m-yamanashi/add-v3-document
Browse files Browse the repository at this point in the history
Service charge coefficient is updated
  • Loading branch information
s-yama authored Nov 25, 2024
2 parents b332ce6 + 350acfa commit 292d135
Show file tree
Hide file tree
Showing 4 changed files with 26 additions and 16 deletions.
17 changes: 10 additions & 7 deletions v3/en/docs/job-execution.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,9 +6,9 @@ The following job services are available in the ABCI System.

| Service name | Description | Service charge coefficient | Job style |
|:--|:--|:--|:--|
| On-demand | Job service of interactive execution | 7.5 | Interactive |
| Spot | Job service of batch execution | 7.5 | Batch |
| Reserved | Job service of reservation | 11.25 | Batch/Interactive |
| On-demand | Job service of interactive execution | 1.0 | Interactive |
| Spot | Job service of batch execution | 1.0 | Batch |
| Reserved | Job service of reservation | 1.5 | Batch/Interactive |

For the job execution resources available for each job service and the restrictions, see [Job Execution Resources](#job-execution-resource). Also, for accounting, see [Accounting](#accounting).

Expand Down Expand Up @@ -113,19 +113,21 @@ The major options of the `qsub` command are follows.
| -l select=*num*[*:ncpus=num_cpus:mpiprocs=num_mpi:ompthreads=num_omp*] | Specify the number of nodes with *num* and the number of CPUs corresponding to each resource type with *num_cpus*, the number of MPI processes with *num_mpi*, and the number of threads with *num_omp*. (mandatory) |
| -l walltime=[*HH:MM:*]*SS* | Specify elapsed time by [*HH:MM:*]*SS*. When execution time of job exceed specified time, job is rejected. |
| -N name | Specify the job name with *name*. The default is the job script name. |
| -o *stdout_name* | Specify standard output stream of job |
| -j oe | Specify standard error stream is merged into standard output stream |

## Interactive Jobs

To run an interactive job, add the `-I` option to the `qsub` command.

```
$ qsub -I -P group -q resource_type -l select=num:ncpus=num_cpus [options]
$ qsub -I -P group -q resource_type -l select=num [options]
```

Example) Executing an interactive job (On-demand service)

```
[username@int1 ~]$ qsub -I -P grpname -q rt_HF -l select=1:ncpus=192
[username@int1 ~]$ qsub -I -P grpname -q rt_HF -l select=1
[username@hnode001 ~]$
```

Expand All @@ -140,7 +142,7 @@ The job script is described job execute option, such as resource type, elapsed t
```bash
#!/bin/sh
#PBS -q rt_HF
#PBS -l select=1:ncpus=192
#PBS -l select=1
#PBS -l walltime=1:23:45
#PBS -P grpname

Expand All @@ -156,7 +158,7 @@ Example) Sample job script executing program with CUDA
```bash
#!/bin/sh
#PBS -q rt_HF
#PBS -l select=1:ncpus=192
#PBS -l select=1
#PBS -l walltime=1:23:45
#PBS -P grpname

Expand Down Expand Up @@ -203,6 +205,7 @@ The major options of the `qstat` command are follows.
| Option | Description |
|:--|:--|
| -f | Display additional information about job |
| -a | Display queued and running jobs along with additional information |

Example)

Expand Down
4 changes: 3 additions & 1 deletion v3/en/docs/system-overview.md
Original file line number Diff line number Diff line change
Expand Up @@ -58,7 +58,7 @@ To execute the program for the compute node, submit the program to the job manag
#### Compute Node

The compute node of ABCI system consists of HPE Cray XD670.
The compute node is equipped with two Intel Xeon Platinum 8558 Processors and eight NVIDIA H200 GPU accelerators. In the entire system, the total number of CPU cores is 36,768 cores, and the total number of GPUs is 6,128.
The compute node is equipped with two Intel Xeon Platinum 8558 Processors and eight NVIDIA H200 GPU accelerators. In the entire system, the total number of CPU cores is 73,536 cores, and the total number of GPUs is 6,128.

The specifications of the compute node are shown below:

Expand Down Expand Up @@ -89,6 +89,8 @@ Below is a list of shared file systems provided by the ABCI system using the abo
|:--|:--|:--|:--|:--|
| Home area | /home | 10 PB | Lustre | |
| Group area | /groups | 63 PB | Lustre | |
| Archive | /home-2.0 | 0.5 PB | Lustre | Read-only. Home area used in ABCI 2.0 |
| Archive | /groups-2.0 | 10.8 PB | Lustre | Read-only. Group area used in ABCI 2.0 |
| ABCI Object area | /groups_s3 | 1 PB | Lustre | |


Expand Down
17 changes: 10 additions & 7 deletions v3/ja/docs/job-execution.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,9 +6,9 @@ ABCIシステムでは、以下のジョブサービスが利用可能です。

| サービス名 | 説明 | サービス課金係数 | 利用形態 |
|:--|:--|:--|:--|
| On-demand | インタラクティブジョブの実行サービス | 7.5 | インタラクティブジョブ |
| Spot | バッチジョブの実行サービス | 7.5 | バッチジョブ |
| Reserved | 事前予約型ジョブサービス | 11.25 | 事前予約 |
| On-demand | インタラクティブジョブの実行サービス | 1.0 | インタラクティブジョブ |
| Spot | バッチジョブの実行サービス | 1.0 | バッチジョブ |
| Reserved | 事前予約型ジョブサービス | 1.5 | 事前予約 |

各ジョブサービスで利用可能なジョブ実行リソース、制限事項等については、[ジョブ実行リソース](#job-execution-resource)を参照してください。また、課金については、[課金](#accounting)を参照してください。

Expand Down Expand Up @@ -114,19 +114,21 @@ Reservedサービスで予約ノードに投入されたジョブはカウント
| -l select=*num*[*:ncpus=num_cpus:mpiprocs=num_mpi:ompthreads=num_omp*] | ノード数を*num*で、資源タイプに対応したCPU数を*num_cpus*で、MPIプロセス数を*num_mpi*で、スレッド数を*num_omp*で指定します。本オプションは指定必須です。 |
| -l walltime=[*HH:MM:*]*SS* | 経過時間制限値を指定します。[*HH:MM:*]*SS*で指定することができます。ジョブの実行時間が指定した時間を超過した場合、ジョブは強制終了されます。 |
| -N name | ジョブ名を*name*で指定します。デフォルトは、ジョブスクリプト名です。 |
| -o *stdout_name* | 標準出力名を*stdout_name*で指定します。 |
| -j oe | 標準エラー出力を標準出力にマージします。 |

## インタラクティブジョブ {#interactive-jobs}

インタラクティブジョブを実行するには、`qsub`コマンドに`-I`オプションを付け加えます。

```
$ qsub -I -P group -q resource_type -l select=num:ncpus=num_cpus [options]
$ qsub -I -P group -q resource_type -l select=num [options]
```

例) インタラクティブジョブを実行 (On-demandサービス)

```
[username@int1 ~]$ qsub -I -P grpname -q rt_HF -l select=1:ncpus=192
[username@int1 ~]$ qsub -I -P grpname -q rt_HF -l select=1
[username@hnode001 ~]$
```

Expand All @@ -142,7 +144,7 @@ ABCIシステムでバッチジョブを実行する場合、実行するプロ
```bash
#!/bin/sh
#PBS -q rt_HF
#PBS -l select=1:ncpus=192
#PBS -l select=1
#PBS -l walltime=1:23:45
#PBS -P grpname

Expand All @@ -158,7 +160,7 @@ cd ${PBS_O_WORKDIR}
```bash
#!/bin/sh
#PBS -q rt_HF
#PBS -l select=1:ncpus=192
#PBS -l select=1
#PBS -l walltime=1:23:45
#PBS -P grpname

Expand Down Expand Up @@ -205,6 +207,7 @@ $ qstat [options]
| オプション | 説明 |
|:--|:--|
| -f | ジョブに関する追加情報を表示します。 |
| -a | 待機中および実行中のジョブを、追加情報を含めて表示します。 |

例)

Expand Down
4 changes: 3 additions & 1 deletion v3/ja/docs/system-overview.md
Original file line number Diff line number Diff line change
Expand Up @@ -56,7 +56,7 @@ ABCIシステムのフロントエンドであるインタラクティブノー
#### 計算ノード {#compute-node}

計算ノードは、HPE Cray XD670で構成されています。
計算ノードは、Intel Xeon Platinum 8558プロセッサーを2基、NVIDIA H200 GPUアクセラレーターを8基搭載しています。システム全体では、総CPUコア数は36,768コア、総GPU数は6,128基となります。
計算ノードは、Intel Xeon Platinum 8558プロセッサーを2基、NVIDIA H200 GPUアクセラレーターを8基搭載しています。システム全体では、総CPUコア数は73,536コア、総GPU数は6,128基となります。

計算ノードの構成を以下に示します。

Expand Down Expand Up @@ -87,6 +87,8 @@ ABCIシステムは、人工知能やビッグデータ応用に用いる大容
|:--|:--|:--|:--|:--|
| ホーム領域 | /home | 10 PB | Lustre | |
| グループ領域 | /groups | 63 PB | Lustre | |
| アーカイブ | /home-2.0 | 0.5 PB | Lustre | 読み取り専用。ABCI 2.0で利用されていたホーム領域 |
| アーカイブ | /groups-2.0 | 10.8 PB | Lustre | 読み取り専用。ABCI 2.0で利用されていたグループ領域 |
| ABCIオブジェクト領域 | /groups_s3 | 1 PB | Lustre | |


Expand Down

0 comments on commit 292d135

Please sign in to comment.