Prometheus:Podstawy
Spis treści
Logowanie
Dostęp do klastra Prometheus realizowany jest za pośrednictwem maszyny dostępowej:
prometheus.cyfronet.pl
Możliwe jest także użycie krótszego aliasu pro.cyfronet.pl (a także domen cyf-kr.edu.pl i cyfronet.krakow.pl).
Logowanie na maszynę dostępową możliwe jest poprzez ssh.
Dostępne oprogramowanie
Opis dostępnego oprogramowania znajduje się tutaj.
Uruchamianie zadań
Zlecanie zadań na klastrze Prometheus odbywa się poprzez system kolejkowy SLURM.
Zadanie może być zlecone zarówno w trybie wsadowym jak i w trybie interaktywnym.
Tryb wsadowy
Do zlecania zadania w trybie wsadowym służy komenda sbatch.
Użycie komendy:
sbatch skrypt.sh
Przykładowy skrypt:
---
#!/bin/bash -l
## Nazwa zlecenia
#SBATCH -J ADFtestjob
## Liczba węzłów
#SBATCH -N 2
## Maksymalna liczba zadań w zleceniu (domyślnie ilość rdzeni)
#SBATCH -n 48
## Ilość zadań na węzeł
#SBATCH --ntasks-per-node=24
## Maksymalna ilość zużytej pamięci na węzeł (w MB)
#SBATCH --mem 24000
## Maksymalny czas trwania zlecenia
#SBATCH --time=20:00:00
## Nazwa grantu do rozliczenia zużycia zasobów
#SBATCH -A testgrant
## Specyfikacja partycji
#SBATCH -p blue
## Plik ze standardowym wyjściem
#SBATCH --output="adf.out"
## Plik ze standardowym wyjściem błędów
#SBATCH --error="adf.err"
## Typ powiadomień e-mail
#SBATCH --mail-type=ALL
## E-mail na który wysłać powiadomienia
#SBATCH --mail-user=user@example.com
## przejscie do katalogu z ktorego wywolany zostal sbatch
cd $SLURM_SUBMIT_DIR
srun /bin/hostname
module load apps/adf/2014.07
adf input.adf
---
Tryb interaktywny
Do zlecania zadań w trybie interaktywnym z powłoką służy komenda (przykład):
srun -p partycja -N 2 -n 48 -A testgrant --pty /bin/bash -l
Samo polecenie srun odpowiada za uruchomienie komendy w ramach zaalokowanych zasobów.
Jednak w przypadku, gdy zasoby nie zostały wcześniej zaalokowane, komenda ta dodatkowo dokonuje ich rezerwacji przed uruchomieniem obliczeń.
Uwaga: Wszelkie informacje na temat komend SLURMa można znaleźć w manualu, np.: man sbatch
Partycje
Odpowiednikiem kolejek PBS w SLURMie są partycje. Prometheus posiada aktualnie następujące partycje:
Nazwa partycji | Zasoby | Informacje |
---|---|---|
red | 576 węzłów (13824 CPU) | Partycja domyślna, pierwsza wyspa |
green | 576 węzłów (13824 CPU) | Druga wyspa |
blue | 576 węzłów (13824 CPU) | Trzecia wyspa |
all | 1728 węzłów (41472 CPU) | Zbiór wszystkich węzłów Prometheusa |
Dokładne informacje na temat partycji można otrzymać przy pomocy polecenia
scontrol show partition [<nazwa_partycji>]
Uwaga: Zadania nieprzekraczające rozmiaru wyspy obliczeniowej powinny być uruchamiane w ramach partycji wyspy. Zlecanie obliczeń w partycji all powoduje potencjalne rozbicie zadania pomiędzy wyspami obliczeniowymi, co skutkuje obniżeniem efektywności obliczeń.
Zasady obowiązujące na klastrze Zeus
- obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia
- obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
- W celu skompilowania programu proszę użyć polecenia:
srun -p all -n 1 --pty /bin/bash -l
Polecenie to spowoduje zalogowanie użytkownika na węzeł obliczeniowy, tam proszę uruchomić kompilację programu