Zeus:Podstawy: Różnice pomiędzy wersjami

Z Komputery Dużej Mocy w ACK CYFRONET AGH
Skocz do:nawigacja, szukaj
(→‎Zasoby dyskowe: Info o zeus-fs)
Linia 31: Linia 31:
 
== Uruchamianie zadań ==
 
== Uruchamianie zadań ==
  
System kolejkowy: Torque
+
System kolejkowy: SLURM
  
Zarządca zasobów: Moab
+
W celu uruchomienia zadania niezbędna jest wiedza na temat [[Podstawy:SLURM|podstawowych komend systemu kolejkowego]].
  
W celu uruchomienia zadania niezbędna jest wiedza na temat [[Podstawy:PBS|podstawowych komend systemu kolejkowego]].
+
== Opis partycji ==
 
 
== Opis kolejek ==
 
  
 
{| class="wikitable"  style="text-align:center;"
 
{| class="wikitable"  style="text-align:center;"
! Nazwa kolejki !! Maksymalna liczba<br/> zadań użytkownika !!  Maksymalny czas<br/> trwania zadania !! Maksymalna ilość rdzeni<br/> dla użytkownika !! Dodatkowe informacje
+
! Nazwa partycji !! Maksymalna liczba<br/> zadań użytkownika !!  Maksymalny czas<br/> trwania zadania !! Maksymalna ilość rdzeni<br/> dla użytkownika !! Dodatkowe informacje
 
|-
 
|-
 
| l_test || 3 || 15 minut || 100 || kolejka do testów działania zadania
 
| l_test || 3 || 15 minut || 100 || kolejka do testów działania zadania
Linia 65: Linia 63:
 
|}
 
|}
  
'''Uwaga:''' Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą <tt>qstat -Q -f <nazwa_kolejki></tt>
+
'''Uwaga:''' Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą <tt>scontrol show partition=<nazwa_partycji></tt>
  
 
== Opis właściwości węzłów obliczeniowych ==
 
== Opis właściwości węzłów obliczeniowych ==
Linia 103: Linia 101:
 
* w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się [[Granty|tutaj]].
 
* w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się [[Granty|tutaj]].
 
* w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
 
* w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
* w celu skompilowania programu proszę użyć polecenia: <code>qsub -I -q l_interactive -l nodes=1:ppn=1</code><br/>Polecenie to spowoduje zalogowanie użytkownika na węzeł obliczeniowy, tam proszę uruchomić kompilację programu
+
* w celu skompilowania programu proszę użyć [[Podstawy:SLURM#Zadanie_interaktywne|zadań interaktywnych]].

Wersja z 11:01, 10 paź 2017


Nazwa maszyny dostępowej

zeus.cyfronet.pl

lub ui.cyfronet.pl (możliwe są też kombinacje domen Cyfronetu: zeus.cyf-kr.edu.pl, zeus.cyfronet.krakow.pl)

Zasoby dyskowe

Lokalizacja Limit Przeznaczenie Sposób
dostępu
Kopia
bezpieczeństwa
Możliwość wykonywania intensywnych
zapisów i/lub odczytów
Uwagi
$HOME 7GB katalog domowy użytkownika NFS tak nie
$STORAGE 100GB składowanie danych użytkownika GPFS nie nie
$SCRATCH brak limitu przestrzeń dla plików tymczasowych zadań Lustre nie tak dane starsze niż 30 dni
będą usuwane automatycznie
$PLG_GROUPS_SHARED/nazwa_zespołu
$PLG_GROUPS_STORAGE/nazwa_zespołu
suma grantów przestrzeń dla katalogów zespołów (PL-Grid) Lustre nie nie

Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem zeus-fs.

Dostępne oprogramowanie

Opis dostępnego oprogramowania znajduje się tutaj.

Uruchamianie zadań

System kolejkowy: SLURM

W celu uruchomienia zadania niezbędna jest wiedza na temat podstawowych komend systemu kolejkowego.

Opis partycji

Nazwa partycji Maksymalna liczba
zadań użytkownika
Maksymalny czas
trwania zadania
Maksymalna ilość rdzeni
dla użytkownika
Dodatkowe informacje
l_test 3 15 minut 100 kolejka do testów działania zadania
l_prio 40 1 godzina 50 kolejka przeznaczona dla krótkich zadań, które powinny się szybko policzyć
l_short 1000 3 godziny 2048
l_long 500 2 tygodnie 2048
l_infinite 30 90 dni 2048
l_exclusive 700 2 tygodnie 2048 kolejka tylko dla zadan rownoległych z ppn=12
l_bigmem - 1 tydzień 72 dostęp limitowany
l_interactive 3 72 godziny 72 kolejka do pracy interaktywnej
plgrid-testing 1 1 godzina 12
plgrid 700 72 godziny 1024
plgrid-long 1000 168 godzin 1024

Uwaga: Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą scontrol show partition=<nazwa_partycji>

Opis właściwości węzłów obliczeniowych

Właściwość Opis
E5645, X5650, opteron6276 model procesora
intel, amd producent procesora
mhz2667 szybkość procesora
mem16gb, mem24gb ilość pamięci RAM w serwerze obliczeniowym
core8, core12, core64 ilość rdzeni w serwerze obliczeniowym
ib_ql sieć Inifniband firmy Qlogic
ib_mlx sieć Infiniband firmy Mellanox
infiniband serwer obliczeniowy z siecią Infiniband

Zasady obowiązujące na klastrze Zeus

  • obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia
  • obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
  • obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
  • uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone
  • po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
  • logowanie za pomocą kluczy SSH jest zablokowane
  • prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
  • prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
  • w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się tutaj.
  • w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
  • w celu skompilowania programu proszę użyć zadań interaktywnych.