Berikut beberapa perintah yang berguna untuk bekerja menggunakan fasilitas parallel computing di HPC BRIN (Mahameru). Perintah-perintah ini umumnya digunakan untuk mengetahui spesifikasi sistem yang digunakan sebelum menjalankan batch job pada slurm workload manager.
1. Mengetahui spesifikasi lengkap HPC
$ lscpu
2. Mengetahui jumlah processor pada node saat ini
$nproc
128
128 adalah jumlah cpu pada node yang aktif.
3. Mengetahui konfigurasi cluster HPC (Slurm)
$ sinfo -p medium-small -o "%N %c %m %G"
NODELIST CPUS MEMORY GRES
trembesi[51-72] 128 256000 (null)
trembesi[51-72] adalah node yang digunakan pada partisi medium-small, dengan jumlah cpu dan memori max masing-masing 128 dan 256 GB.
4. Submit dan menghentikan batch job (Slurm)
$ sbatch <script program.sh> --> menjalankan script untuk batch job
$ scancel -u <nama_user> --> menghentikan batch job oleh <nama_user>
5. Melihat status batch job dari user (slurm)
$ squeue -u 'whoami' --> melihat status batch job oleh user saat ini
$ squeue -u <nama_user> --> melihat status batch job oleh <nama_user>
$ sqeueu -all --> melihat status batch job oleh semua user
6. Melihat daftar seluruh partisi yang tersedia pada HPC (slurm)
$ sinfo -all
7. Masuk ke mode interaktif (slurm)
$ srun --partition=interactive --pty /bin/bash
Setelah masuk ke mode interaktif, anda bisa menjalankan script/program yang anda inginkan. Bila ingin keluar dari mode interaktif, ketik perintah 'exit' pada prompt shell.
No comments:
Post a Comment