Zeus:Podstawy: Różnice pomiędzy wersjami

Z Komputery Dużej Mocy w ACK CYFRONET AGH
Skocz do:nawigacja, szukaj
 
(Nie pokazano 10 wersji utworzonych przez 4 użytkowników)
Linia 4: Linia 4:
  
 
<code>
 
<code>
zeus.cyfronet.pl
+
 
 
</code>
 
</code>
  
lub '''ui.cyfronet.pl''' (możliwe są też kombinacje domen Cyfronetu: '''zeus.cyf-kr.edu.pl''', '''zeus.cyfronet.krakow.pl''')
+
Aktualnie dostęp jest możliwy jedynie za pomocą narzędzi gridowych.
 +
 
 +
Logowanie na maszynę dostępową możliwe jest poprzez SSH.
 +
Odciski palca (tzw. fingeprint) kluczy:
 +
<pre>
 +
(RSA)    SHA256:n5ro4MNw3Lmn1kr9SlnfBeFYSQ5u480kxAXMLDbyYnQ
 +
(RSA)    MD5:d6:ca:74:0a:e5:64:2d:4d:64:ef:9b:c6:75:3c:88:2b
 +
(ECDSA)  SHA256:o/fzPMSmXEtbBNrg/dY9egMBQvDqzr2cP3qcpZWgpgo
 +
(ECDSA)  MD5:35:43:39:c9:98:d3:8d:ad:af:80:9d:0a:c9:84:22:89
 +
</pre>
 +
 
 +
Proszę upewnić się, że został przedstawiony poprawny odcisk klucza.
  
 
== Zasoby dyskowe ==
 
== Zasoby dyskowe ==
Linia 22: Linia 33:
 
| <tt>$PLG_GROUPS_SHARED/nazwa_zespołu</tt><br/> <tt>$PLG_GROUPS_STORAGE/nazwa_zespołu</tt>  || suma grantów || przestrzeń dla katalogów zespołów (PL-Grid) || Lustre || nie || nie ||
 
| <tt>$PLG_GROUPS_SHARED/nazwa_zespołu</tt><br/> <tt>$PLG_GROUPS_STORAGE/nazwa_zespołu</tt>  || suma grantów || przestrzeń dla katalogów zespołów (PL-Grid) || Lustre || nie || nie ||
 
|}
 
|}
 +
 +
Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem '''zeus-fs'''.
  
 
== Dostępne oprogramowanie ==
 
== Dostępne oprogramowanie ==
Linia 29: Linia 42:
 
== Uruchamianie zadań ==
 
== Uruchamianie zadań ==
  
System kolejkowy: Torque
+
System kolejkowy: SLURM
  
Zarządca zasobów: Moab
+
W celu uruchomienia zadania niezbędna jest wiedza na temat [[Podstawy:SLURM|podstawowych komend systemu kolejkowego]].
  
W celu uruchomienia zadania niezbędna jest wiedza na temat [[Podstawy:PBS|podstawowych komend systemu kolejkowego]].
+
== Opis partycji ==
  
== Opis kolejek ==
+
{| class="wikitable"  style="text-align:left;"
 
+
! Nazwa partycji !!  Maksymalny czas<br/> trwania zadania !! Dodatkowe informacje
{| class="wikitable"  style="text-align:center;"
 
! Nazwa kolejki !! Maksymalna liczba<br/> zadań użytkownika !!  Maksymalny czas<br/> trwania zadania !! Maksymalna ilość rdzeni<br/> dla użytkownika !! Dodatkowe informacje
 
|-
 
| l_test || 3 || 15 minut || 100 || kolejka do testów działania zadania
 
|-
 
| l_prio || 40 || 1 godzina || 50 || kolejka przeznaczona dla krótkich zadań, które powinny się szybko policzyć
 
|-
 
| l_short || 1000 || 3 godziny || 2048 ||
 
|-
 
| l_long || 500 || 2 tygodnie || 2048 ||
 
|-
 
| l_infinite || 30 || 90 dni || 2048 ||
 
|-
 
| l_exclusive || 700 || 2 tygodnie || 2048 || kolejka tylko dla zadan rownoległych z ppn=12
 
 
|-
 
|-
| l_bigmem || - || 1 tydzień || 72 || dostęp limitowany
+
| plgrid-testing || 1 godzina || zwiększony priorytet<br/> przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych
 
|-
 
|-
| l_interactive || 3 || 72 godziny || 72 || kolejka do pracy interaktywnej
+
| plgrid || 72 godziny || partycja domyślna, ustawiana automatycznie przy braku wyboru partycji
 
|-
 
|-
| plgrid-testing || 1 || 1 godzina || 12 ||
+
| plgrid-short || 3 godziny ||  
 
|-
 
|-
| plgrid || 700 || 72 godziny || 1024 ||
+
| plgrid-long || 168 godzin || partycja pozwalająca na zlecanie zadań z długim czasem wykonania
 
|-
 
|-
| plgrid-long || 1000 || 168 godzin || 1024 ||
+
| plgrid-gpu || 72 godziny || partycja zawierająca węzły GPGPU
 
|}
 
|}
  
'''Uwaga:''' Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą <tt>qstat -Q -f <nazwa_kolejki></tt>
+
'''Uwaga:''' Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą <tt>scontrol show partition=<nazwa_partycji></tt>
  
 
== Opis właściwości węzłów obliczeniowych ==
 
== Opis właściwości węzłów obliczeniowych ==
Linia 94: Linia 93:
 
* obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
 
* obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
 
* obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
 
* obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
 +
* uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone
 
* po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
 
* po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
* logowanie za pomocą kluczy SSH jest zablokowane
 
 
* prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
 
* prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
 
* prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
 
* prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
* W celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się [[Granty|tutaj]].
+
* w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się [[Granty|tutaj]].
 
* w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
 
* w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
* W celu skompilowania programu proszę użyć polecenia: <code>qsub -I -q l_interactive -l nodes=1:ppn=1</code><br/>Polecenie to spowoduje zalogowanie użytkownika na węzeł obliczeniowy, tam proszę uruchomić kompilację programu
+
* w celu skompilowania programu proszę użyć [[Podstawy:SLURM#Zadanie_interaktywne|zadań interaktywnych]].

Aktualna wersja na dzień 08:56, 10 maj 2022


Nazwa maszyny dostępowej

Aktualnie dostęp jest możliwy jedynie za pomocą narzędzi gridowych.

Logowanie na maszynę dostępową możliwe jest poprzez SSH. Odciski palca (tzw. fingeprint) kluczy:

 (RSA)     SHA256:n5ro4MNw3Lmn1kr9SlnfBeFYSQ5u480kxAXMLDbyYnQ
 (RSA)     MD5:d6:ca:74:0a:e5:64:2d:4d:64:ef:9b:c6:75:3c:88:2b
 (ECDSA)   SHA256:o/fzPMSmXEtbBNrg/dY9egMBQvDqzr2cP3qcpZWgpgo
 (ECDSA)   MD5:35:43:39:c9:98:d3:8d:ad:af:80:9d:0a:c9:84:22:89

Proszę upewnić się, że został przedstawiony poprawny odcisk klucza.

Zasoby dyskowe

Lokalizacja Limit Przeznaczenie Sposób
dostępu
Kopia
bezpieczeństwa
Możliwość wykonywania intensywnych
zapisów i/lub odczytów
Uwagi
$HOME 7GB katalog domowy użytkownika NFS tak nie
$STORAGE 100GB składowanie danych użytkownika GPFS nie nie
$SCRATCH brak limitu przestrzeń dla plików tymczasowych zadań Lustre nie tak dane starsze niż 30 dni
będą usuwane automatycznie
$PLG_GROUPS_SHARED/nazwa_zespołu
$PLG_GROUPS_STORAGE/nazwa_zespołu
suma grantów przestrzeń dla katalogów zespołów (PL-Grid) Lustre nie nie

Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem zeus-fs.

Dostępne oprogramowanie

Opis dostępnego oprogramowania znajduje się tutaj.

Uruchamianie zadań

System kolejkowy: SLURM

W celu uruchomienia zadania niezbędna jest wiedza na temat podstawowych komend systemu kolejkowego.

Opis partycji

Nazwa partycji Maksymalny czas
trwania zadania
Dodatkowe informacje
plgrid-testing 1 godzina zwiększony priorytet
przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych
plgrid 72 godziny partycja domyślna, ustawiana automatycznie przy braku wyboru partycji
plgrid-short 3 godziny
plgrid-long 168 godzin partycja pozwalająca na zlecanie zadań z długim czasem wykonania
plgrid-gpu 72 godziny partycja zawierająca węzły GPGPU

Uwaga: Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą scontrol show partition=<nazwa_partycji>

Opis właściwości węzłów obliczeniowych

Właściwość Opis
E5645, X5650, opteron6276 model procesora
intel, amd producent procesora
mhz2667 szybkość procesora
mem16gb, mem24gb ilość pamięci RAM w serwerze obliczeniowym
core8, core12, core64 ilość rdzeni w serwerze obliczeniowym
ib_ql sieć Inifniband firmy Qlogic
ib_mlx sieć Infiniband firmy Mellanox
infiniband serwer obliczeniowy z siecią Infiniband

Zasady obowiązujące na klastrze Zeus

  • obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia
  • obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
  • obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
  • uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone
  • po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
  • prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
  • prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
  • w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się tutaj.
  • w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
  • w celu skompilowania programu proszę użyć zadań interaktywnych.