Zeus:Podstawy: Różnice pomiędzy wersjami

Z Komputery Dużej Mocy w ACK CYFRONET AGH
Skocz do:nawigacja, szukaj
Linia 37: Linia 37:
 
== Opis partycji ==
 
== Opis partycji ==
  
{| class="wikitable"  style="text-align:center;"
+
{| class="wikitable"  style="text-align:left;"
! Nazwa partycji !! Maksymalna liczba<br/> zadań użytkownika !!  Maksymalny czas<br/> trwania zadania !! Maksymalna ilość rdzeni<br/> dla użytkownika !! Dodatkowe informacje
+
! Nazwa partycji !!  Maksymalny czas<br/> trwania zadania !! Dodatkowe informacje
 
|-
 
|-
| l_test || 3 || 15 minut || 100 || kolejka do testów działania zadania
+
| plgrid-testing || 1 godzina || zwiększony priorytet<br/> przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych
 
|-
 
|-
| l_prio || 40 || 1 godzina || 50 || kolejka przeznaczona dla krótkich zadań, które powinny się szybko policzyć
+
| plgrid || 72 godziny || partycja domyślna, ustawiana automatycznie przy braku wyboru partycji
 
|-
 
|-
| l_short || 1000 || 3 godziny || 2048 ||  
+
| plgrid-short || 3 godziny ||  
 
|-
 
|-
| l_long || 500 || 2 tygodnie || 2048 ||
+
| plgrid-long || 168 godzin || partycja pozwalająca na zlecanie zadań z długim czasem wykonania
 
|-
 
|-
| l_infinite || 30 || 90 dni || 2048 ||
+
| plgrid-gpu || 72 godziny || partycja zawierająca węzły GPGPU
|-
 
| l_exclusive || 700 || 2 tygodnie || 2048 || kolejka tylko dla zadan rownoległych z ppn=12
 
|-
 
| l_bigmem || - || 1 tydzień || 72 || dostęp limitowany
 
|-
 
| l_interactive || 3 || 72 godziny || 72 || kolejka do pracy interaktywnej
 
|-
 
| plgrid-testing || 1 || 1 godzina || 12 ||
 
|-
 
| plgrid || 700 || 72 godziny || 1024 ||
 
|-
 
| plgrid-long || 1000 || 168 godzin || 1024 ||
 
 
|}
 
|}
  

Wersja z 11:42, 24 lis 2017


Nazwa maszyny dostępowej

zeus.cyfronet.pl

lub ui.cyfronet.pl (możliwe są też kombinacje domen Cyfronetu: zeus.cyf-kr.edu.pl, zeus.cyfronet.krakow.pl)

Zasoby dyskowe

Lokalizacja Limit Przeznaczenie Sposób
dostępu
Kopia
bezpieczeństwa
Możliwość wykonywania intensywnych
zapisów i/lub odczytów
Uwagi
$HOME 7GB katalog domowy użytkownika NFS tak nie
$STORAGE 100GB składowanie danych użytkownika GPFS nie nie
$SCRATCH brak limitu przestrzeń dla plików tymczasowych zadań Lustre nie tak dane starsze niż 30 dni
będą usuwane automatycznie
$PLG_GROUPS_SHARED/nazwa_zespołu
$PLG_GROUPS_STORAGE/nazwa_zespołu
suma grantów przestrzeń dla katalogów zespołów (PL-Grid) Lustre nie nie

Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem zeus-fs.

Dostępne oprogramowanie

Opis dostępnego oprogramowania znajduje się tutaj.

Uruchamianie zadań

System kolejkowy: SLURM

W celu uruchomienia zadania niezbędna jest wiedza na temat podstawowych komend systemu kolejkowego.

Opis partycji

Nazwa partycji Maksymalny czas
trwania zadania
Dodatkowe informacje
plgrid-testing 1 godzina zwiększony priorytet
przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych
plgrid 72 godziny partycja domyślna, ustawiana automatycznie przy braku wyboru partycji
plgrid-short 3 godziny
plgrid-long 168 godzin partycja pozwalająca na zlecanie zadań z długim czasem wykonania
plgrid-gpu 72 godziny partycja zawierająca węzły GPGPU

Uwaga: Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą scontrol show partition=<nazwa_partycji>

Opis właściwości węzłów obliczeniowych

Właściwość Opis
E5645, X5650, opteron6276 model procesora
intel, amd producent procesora
mhz2667 szybkość procesora
mem16gb, mem24gb ilość pamięci RAM w serwerze obliczeniowym
core8, core12, core64 ilość rdzeni w serwerze obliczeniowym
ib_ql sieć Inifniband firmy Qlogic
ib_mlx sieć Infiniband firmy Mellanox
infiniband serwer obliczeniowy z siecią Infiniband

Zasady obowiązujące na klastrze Zeus

  • obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia
  • obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
  • obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
  • uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone
  • po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
  • logowanie za pomocą kluczy SSH jest zablokowane
  • prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
  • prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
  • w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się tutaj.
  • w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
  • w celu skompilowania programu proszę użyć zadań interaktywnych.