From 9d48e5e5efb19d6a62bbfdbe2f0f922bbfe87b92 Mon Sep 17 00:00:00 2001 From: axc01050oa Date: Tue, 19 Nov 2024 10:22:10 +0900 Subject: [PATCH 1/2] mod about services --- en/docs/apps/index.md | 3 +++ en/docs/gpu.md | 3 +++ en/docs/job-execution.md | 3 +++ en/docs/mpi.md | 3 +++ en/docs/storage.md | 7 +++---- en/docs/system-overview.md | 3 +++ ja/docs/apps/index.md | 3 +++ ja/docs/gpu.md | 3 +++ ja/docs/job-execution.md | 3 +++ ja/docs/mpi.md | 3 +++ ja/docs/storage.md | 7 +++---- ja/docs/system-overview.md | 3 +++ 12 files changed, 36 insertions(+), 8 deletions(-) diff --git a/en/docs/apps/index.md b/en/docs/apps/index.md index 7e996b148..5f872f13b 100644 --- a/en/docs/apps/index.md +++ b/en/docs/apps/index.md @@ -2,6 +2,9 @@ This section will explain how users can set up and execute applications, such as TensorFlow, PyTorch, MXNet, on ABCI. +!!! note + Due to the Compute Node service outage on October 31, 2024, applications are no longer available. + - [TensorFlow](tensorflow.md) - [PyTorch](pytorch.md) - [MXNet](mxnet.md) diff --git a/en/docs/gpu.md b/en/docs/gpu.md index 5e90ac63a..ea4278249 100644 --- a/en/docs/gpu.md +++ b/en/docs/gpu.md @@ -1,5 +1,8 @@ # 7. GPU +!!! note + Due to the Compute Node service outage on October 31, 2024, GPUs are no longer available. + The following libraries provided by NVIDIA are available on the ABCI System: * [CUDA Toolkit](https://developer.nvidia.com/cuda-toolkit) diff --git a/en/docs/job-execution.md b/en/docs/job-execution.md index 44b6977be..edd327a2a 100644 --- a/en/docs/job-execution.md +++ b/en/docs/job-execution.md @@ -2,6 +2,9 @@ ## Job Services +!!! note + Job Services ended on October 31, 2024. + The following job services are available in the ABCI System. | Service name | Description | Service charge coefficient | Job style | diff --git a/en/docs/mpi.md b/en/docs/mpi.md index 1a37a6f97..1419e67d1 100644 --- a/en/docs/mpi.md +++ b/en/docs/mpi.md @@ -1,5 +1,8 @@ # MPI +!!! note + Due to the Compute Node service outage on October 31, 2024, MPI is no longer available. + The following MPIs can be used with the ABCI system. * [NVIDIA HPC-X](https://developer.nvidia.com/networking/hpc-x) diff --git a/en/docs/storage.md b/en/docs/storage.md index 3cab750c7..d843055d3 100644 --- a/en/docs/storage.md +++ b/en/docs/storage.md @@ -5,10 +5,6 @@ ABCI has the following five types of storage. * [Home Area](#home-area) * [Group Area](#group-area) * [Global scratch area](#scratch-area) -* [Local Storage](#local-storage) - * [Local scratch](#local-scratch) - * [Persistent local scratch](#persistent-local-scratch) (Reserved only) - * [BeeOND storage](#beeond-storage) * [ABCI Cloud Storage](abci-cloudstorage.md) !!! Tips @@ -257,6 +253,9 @@ Example) Enable the DoM feature and set a striping pattern (for OST(s)) of the d ## Local Storage +!!! note + Local Storage service was discontinued on October 31, 2024. + In ABCI System, a 1.6 TB NVMe SSD x1 is installed into each compute node (V) and a 2.0 TB NVMe SSD x2 are installed into each compute node (A). There are two ways to utilize these storages as follows: * Using as a local scratch of a node (*Local scratch*, *Persistent local scratch (Reserved only)*). diff --git a/en/docs/system-overview.md b/en/docs/system-overview.md index 72b25dc84..6b352ffb6 100644 --- a/en/docs/system-overview.md +++ b/en/docs/system-overview.md @@ -4,6 +4,9 @@ The ABCI system consists of 1,088 compute nodes with 4,352 NVIDIA V100 GPU accelerators, 120 compute nodes with 960 NVIDIA A100 GPU accelerators and other computing resources, shared file systems and ABCI Cloud Storage with total capacity of approximately 24.6 PB, InfiniBand network that connects these elements at high speed, firewall, and so on. It also includes software to make the best use of these hardware. And, the ABCI system uses SINET5, the Science Information NETwork, to connect to the Internet at 100 Gbps. +!!! note + The [Compute Node (V)](#compute-node-v) and [Compute Node (A)](#compute-node-a) services were discontinued on October 31, 2024. + [![ABCI System Overview](img/abci_system_en.svg)](img/abci_system_en.svg) The main specifications of the ABCI system are as follows: diff --git a/ja/docs/apps/index.md b/ja/docs/apps/index.md index f19efb3c8..f609780f1 100644 --- a/ja/docs/apps/index.md +++ b/ja/docs/apps/index.md @@ -2,6 +2,9 @@ 本セクションでは、TensorFlow、PyTorch、MXNetなど各種アプリケーションを、利用者がABCI上にインストールして利用するための手順を説明します。 +!!! note + 2024年10月31日の計算ノードサービス停止により、各種アプリケーション は使用できなくなりました。 + - [TensorFlow](tensorflow.md) - [PyTorch](pytorch.md) - [MXNet](mxnet.md) diff --git a/ja/docs/gpu.md b/ja/docs/gpu.md index a3d7053ab..391a8c558 100644 --- a/ja/docs/gpu.md +++ b/ja/docs/gpu.md @@ -1,5 +1,8 @@ # GPU +!!! note + 2024年10月31日の計算ノードサービス停止により、GPUは使用できなくなりました。 + ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。 * [CUDA Toolkit](https://developer.nvidia.com/cuda-toolkit) diff --git a/ja/docs/job-execution.md b/ja/docs/job-execution.md index 714c787ae..d66bc168e 100644 --- a/ja/docs/job-execution.md +++ b/ja/docs/job-execution.md @@ -2,6 +2,9 @@ ## ジョブサービス {#job-services} +!!! note + ジョブサービスは、2024年10月31日をもって終了しました。 + ABCIシステムでは、以下のジョブサービスが利用可能です。 | サービス名 | 説明 | サービス課金係数 | 利用形態 | diff --git a/ja/docs/mpi.md b/ja/docs/mpi.md index bd735be32..e1c573b8c 100644 --- a/ja/docs/mpi.md +++ b/ja/docs/mpi.md @@ -1,5 +1,8 @@ # MPI +!!! note + 2024年10月31日の計算ノードサービス停止により、MPIは使用できなくなりました。 + ABCIシステムでは、以下のMPIを利用できます。 * [NVIDIA HPC-X](https://developer.nvidia.com/networking/hpc-x) diff --git a/ja/docs/storage.md b/ja/docs/storage.md index 2961a8589..dc66937ed 100644 --- a/ja/docs/storage.md +++ b/ja/docs/storage.md @@ -5,10 +5,6 @@ ABCIで利用可能なストレージは、下記の5種類です。 * [ホーム領域](#home-area) * [グループ領域](#group-area) * [グローバルスクラッチ領域](#scratch-area) -* [ローカルストレージ](#local-storage) - * [ローカルスクラッチ](#local-scratch) - * [永続ローカルスクラッチ](#persistent-local-scratch) (Reserved専用) - * [BeeONDストレージ](#beeond-storage) * [ABCIクラウドストレージ](abci-cloudstorage.md) !!! Tips @@ -256,6 +252,9 @@ dom-stripe-file ## ローカルストレージ {#local-storage} +!!! note + ローカルストレージのサービスは、2024年10月31日 をもって終了しました。 + ABCIシステムでは、計算ノード(V)に1.6 TBのNVMe SSD x 1、計算ノード(A)に2.0 TBのNVMe SSD x 2が搭載されています。これらローカルストレージは次のように利用できます。 - ノードに閉じたスクラッチ領域として利用する(*ローカルスクラッチ*、*永続ローカルスクラッチ (Reserved専用)*)。 diff --git a/ja/docs/system-overview.md b/ja/docs/system-overview.md index a640caa5b..de2423c11 100644 --- a/ja/docs/system-overview.md +++ b/ja/docs/system-overview.md @@ -4,6 +4,9 @@ ABCIシステムは、合計4,352基のNVIDIA V100 GPUアクセラレーターを備えた1,088台の計算ノード(V)と合計960基のNVIDIA A100 GPUアクセラレーターを備えた120台の計算ノード(A)を始めとする計算リソース、合算で約24.6 PBの容量を有する共有ファイルシステム及びABCIクラウドストレージ、これらを高速に結合するInfiniBandネットワーク、ファイアウォールなどからなるハードウェアと、これらを最大限活用するためのソフトウェアから構成されます。また、ABCIシステムは学術情報ネットワークSINET5を利用して、100 Gbpsでインターネットに接続しています。 +!!! note + 2024年10月31日をもって、[計算ノード(V)](#compute-node-v)および[計算ノード(A)](#compute-node-a)のサービスを終了いたしました。 + [![ABCI System Overview](img/abci_system_ja.svg)](img/abci_system_ja.svg) ABCIシステムの主要な諸元は以下のとおりです。 From b4ffb1574d1f63dd1730799e85ec117586ca4073 Mon Sep 17 00:00:00 2001 From: axc01050oa Date: Tue, 19 Nov 2024 16:08:00 +0900 Subject: [PATCH 2/2] mod about informations --- en/docs/apps/index.md | 6 +++--- en/docs/gpu.md | 6 +++--- en/docs/job-execution.md | 6 +++--- en/docs/mpi.md | 6 +++--- en/docs/storage.md | 17 ++++++++++------- en/docs/system-overview.md | 6 +++--- ja/docs/apps/index.md | 6 +++--- ja/docs/gpu.md | 6 +++--- ja/docs/job-execution.md | 6 +++--- ja/docs/mpi.md | 6 +++--- ja/docs/storage.md | 17 ++++++++++------- ja/docs/system-overview.md | 6 +++--- 12 files changed, 50 insertions(+), 44 deletions(-) diff --git a/en/docs/apps/index.md b/en/docs/apps/index.md index 5f872f13b..6f183cfdd 100644 --- a/en/docs/apps/index.md +++ b/en/docs/apps/index.md @@ -1,10 +1,10 @@ +!!! info + Applications will not be available due to the termination of the Compute Node service. + # Overview This section will explain how users can set up and execute applications, such as TensorFlow, PyTorch, MXNet, on ABCI. -!!! note - Due to the Compute Node service outage on October 31, 2024, applications are no longer available. - - [TensorFlow](tensorflow.md) - [PyTorch](pytorch.md) - [MXNet](mxnet.md) diff --git a/en/docs/gpu.md b/en/docs/gpu.md index ea4278249..0b2ec2e4c 100644 --- a/en/docs/gpu.md +++ b/en/docs/gpu.md @@ -1,7 +1,7 @@ -# 7. GPU +!!! info + GPU is no longer available due to the end of service of Compute Nodes. -!!! note - Due to the Compute Node service outage on October 31, 2024, GPUs are no longer available. +# 7. GPU The following libraries provided by NVIDIA are available on the ABCI System: diff --git a/en/docs/job-execution.md b/en/docs/job-execution.md index edd327a2a..e404a2dcb 100644 --- a/en/docs/job-execution.md +++ b/en/docs/job-execution.md @@ -1,10 +1,10 @@ +!!! info + The Job Service ended on October 31, 2024. + # Job Execution ## Job Services -!!! note - Job Services ended on October 31, 2024. - The following job services are available in the ABCI System. | Service name | Description | Service charge coefficient | Job style | diff --git a/en/docs/mpi.md b/en/docs/mpi.md index 1419e67d1..56f3950cd 100644 --- a/en/docs/mpi.md +++ b/en/docs/mpi.md @@ -1,7 +1,7 @@ -# MPI +!!! info + MPI is no longer available due to the end of service of Compute Nodes. -!!! note - Due to the Compute Node service outage on October 31, 2024, MPI is no longer available. +# MPI The following MPIs can be used with the ABCI system. diff --git a/en/docs/storage.md b/en/docs/storage.md index d843055d3..c9522e333 100644 --- a/en/docs/storage.md +++ b/en/docs/storage.md @@ -1,10 +1,13 @@ +!!! info + * As of 15:00 on October 27, 2023, the Memory Intensive Node service was terminated. + * As of October 31, 2024, the [Global scratch area](#scratch-area) and [Local Storage](#local-storage) services have been discontinued. + # Storage -ABCI has the following five types of storage. +ABCI has the following three types of storage. * [Home Area](#home-area) * [Group Area](#group-area) -* [Global scratch area](#scratch-area) * [ABCI Cloud Storage](abci-cloudstorage.md) !!! Tips @@ -133,6 +136,9 @@ In the following example, the ABCI group uses MDT:0. ## Global scratch area {#scratch-area} +!!! info + As of October 31, 2024, the Global Scratch Area service was discontinued. + Global scratch area is lustre file system and available for all ABCI users. This storage is shared by interactive nodes and all Compute Nodes V and A. The quota for every users is set in 5TiB. @@ -253,17 +259,14 @@ Example) Enable the DoM feature and set a striping pattern (for OST(s)) of the d ## Local Storage -!!! note - Local Storage service was discontinued on October 31, 2024. +!!! info + As of October 31, 2024, the Local Storage service was discontinued. In ABCI System, a 1.6 TB NVMe SSD x1 is installed into each compute node (V) and a 2.0 TB NVMe SSD x2 are installed into each compute node (A). There are two ways to utilize these storages as follows: * Using as a local scratch of a node (*Local scratch*, *Persistent local scratch (Reserved only)*). * Using as a distributed shared file system, which consists of multiple NVMe storages in multiple compute nodes (*BeeOND storage*). -!!! note - The memory-intensive node service ended at 15:00 on October 27, 2023. - ### Local scratch Local storage on compute nodes is available as a local scratch without specifying any special options at job submission. diff --git a/en/docs/system-overview.md b/en/docs/system-overview.md index 6b352ffb6..66508f198 100644 --- a/en/docs/system-overview.md +++ b/en/docs/system-overview.md @@ -1,12 +1,12 @@ +!!! info + [Compute Node (V)](#compute-node-v) and [Compute Node (A)](#compute-node-a) were discontinued on October 31, 2024. + # ABCI System Overview ## System Architecture The ABCI system consists of 1,088 compute nodes with 4,352 NVIDIA V100 GPU accelerators, 120 compute nodes with 960 NVIDIA A100 GPU accelerators and other computing resources, shared file systems and ABCI Cloud Storage with total capacity of approximately 24.6 PB, InfiniBand network that connects these elements at high speed, firewall, and so on. It also includes software to make the best use of these hardware. And, the ABCI system uses SINET5, the Science Information NETwork, to connect to the Internet at 100 Gbps. -!!! note - The [Compute Node (V)](#compute-node-v) and [Compute Node (A)](#compute-node-a) services were discontinued on October 31, 2024. - [![ABCI System Overview](img/abci_system_en.svg)](img/abci_system_en.svg) The main specifications of the ABCI system are as follows: diff --git a/ja/docs/apps/index.md b/ja/docs/apps/index.md index f609780f1..ed27de38e 100644 --- a/ja/docs/apps/index.md +++ b/ja/docs/apps/index.md @@ -1,10 +1,10 @@ +!!! info + 計算ノードのサービス終了にともない、各種アプリケーションは使用できません。 + # 概要 本セクションでは、TensorFlow、PyTorch、MXNetなど各種アプリケーションを、利用者がABCI上にインストールして利用するための手順を説明します。 -!!! note - 2024年10月31日の計算ノードサービス停止により、各種アプリケーション は使用できなくなりました。 - - [TensorFlow](tensorflow.md) - [PyTorch](pytorch.md) - [MXNet](mxnet.md) diff --git a/ja/docs/gpu.md b/ja/docs/gpu.md index 391a8c558..949fd3b8e 100644 --- a/ja/docs/gpu.md +++ b/ja/docs/gpu.md @@ -1,7 +1,7 @@ -# GPU +!!! info + 計算ノードのサービス終了にともない、GPUは使用できません。 -!!! note - 2024年10月31日の計算ノードサービス停止により、GPUは使用できなくなりました。 +# GPU ABCIシステムでは、NVIDIAが提供する以下のライブラリが利用できます。 diff --git a/ja/docs/job-execution.md b/ja/docs/job-execution.md index d66bc168e..eac09fc96 100644 --- a/ja/docs/job-execution.md +++ b/ja/docs/job-execution.md @@ -1,10 +1,10 @@ +!!! info + 2024年10月31日をもって、ジョブサービスは終了しました。 + # ジョブ実行 ## ジョブサービス {#job-services} -!!! note - ジョブサービスは、2024年10月31日をもって終了しました。 - ABCIシステムでは、以下のジョブサービスが利用可能です。 | サービス名 | 説明 | サービス課金係数 | 利用形態 | diff --git a/ja/docs/mpi.md b/ja/docs/mpi.md index e1c573b8c..691007bd1 100644 --- a/ja/docs/mpi.md +++ b/ja/docs/mpi.md @@ -1,7 +1,7 @@ -# MPI +!!! info + 計算ノードのサービス終了にともない、MPIは使用できません。 -!!! note - 2024年10月31日の計算ノードサービス停止により、MPIは使用できなくなりました。 +# MPI ABCIシステムでは、以下のMPIを利用できます。 diff --git a/ja/docs/storage.md b/ja/docs/storage.md index dc66937ed..23e038fe3 100644 --- a/ja/docs/storage.md +++ b/ja/docs/storage.md @@ -1,10 +1,13 @@ +!!! info + * 2023年10月27日15:00をもって、メモリインテンシブノードサービスは終了しました。 + * 2024年10月31日をもって、[グローバルスクラッチ領域](#scratch-area)、[ローカルストレージ](#local-storage)サービスは終了しました。 + # ストレージ -ABCIで利用可能なストレージは、下記の5種類です。 +ABCIで利用可能なストレージは、下記の3種類です。 * [ホーム領域](#home-area) * [グループ領域](#group-area) -* [グローバルスクラッチ領域](#scratch-area) * [ABCIクラウドストレージ](abci-cloudstorage.md) !!! Tips @@ -134,6 +137,9 @@ groups-MDT0005_UUID 3110850464 433 3110850031 1% /groups[MDT:5] ## グローバルスクラッチ領域 {#scratch-area} +!!! info + 2024年10月31日をもって、グローバルスクラッチ領域サービスは終了しました。 + グローバルスクラッチ領域は、利用者全員が利用可能な、インタラクティブノードおよび各計算ノードで共有されたLustreファイルシステムの短期利用向け高速ストレージです。ディスククォータは5TiBに設定されています。 各利用者は以下の領域を短期利用高速データ領域として利用することが可能です。 ``` @@ -252,17 +258,14 @@ dom-stripe-file ## ローカルストレージ {#local-storage} -!!! note - ローカルストレージのサービスは、2024年10月31日 をもって終了しました。 +!!! info + 2024年10月31日をもって、ローカルストレージサービスは終了しました。 ABCIシステムでは、計算ノード(V)に1.6 TBのNVMe SSD x 1、計算ノード(A)に2.0 TBのNVMe SSD x 2が搭載されています。これらローカルストレージは次のように利用できます。 - ノードに閉じたスクラッチ領域として利用する(*ローカルスクラッチ*、*永続ローカルスクラッチ (Reserved専用)*)。 - 複数の計算ノードのローカルストレージにまたがる分散共有ファイルシステムを構成して利用する(*BeeONDストレージ*)。 -!!! note - メモリインテンシブノードのサービスは、2023年10月27日15:00 をもって終了しました。 - ### ローカルスクラッチ {#local-scratch} 計算ノードのローカルストレージは、ジョブ投入時に特別なオプションを指定することなくローカルスクラッチとして利用できます。 diff --git a/ja/docs/system-overview.md b/ja/docs/system-overview.md index de2423c11..ca665b821 100644 --- a/ja/docs/system-overview.md +++ b/ja/docs/system-overview.md @@ -1,12 +1,12 @@ +!!! info + 2024年10月31日をもって、[計算ノード(V)](#compute-node-v)および[計算ノード(A)](#compute-node-a)のサービスは終了しました。 + # ABCIシステムの概要 ## システム全体概要 {#system-architecture} ABCIシステムは、合計4,352基のNVIDIA V100 GPUアクセラレーターを備えた1,088台の計算ノード(V)と合計960基のNVIDIA A100 GPUアクセラレーターを備えた120台の計算ノード(A)を始めとする計算リソース、合算で約24.6 PBの容量を有する共有ファイルシステム及びABCIクラウドストレージ、これらを高速に結合するInfiniBandネットワーク、ファイアウォールなどからなるハードウェアと、これらを最大限活用するためのソフトウェアから構成されます。また、ABCIシステムは学術情報ネットワークSINET5を利用して、100 Gbpsでインターネットに接続しています。 -!!! note - 2024年10月31日をもって、[計算ノード(V)](#compute-node-v)および[計算ノード(A)](#compute-node-a)のサービスを終了いたしました。 - [![ABCI System Overview](img/abci_system_ja.svg)](img/abci_system_ja.svg) ABCIシステムの主要な諸元は以下のとおりです。