Zeus:Podstawy: Różnice pomiędzy wersjami
Z Komputery Dużej Mocy w ACK CYFRONET AGH
| (Nie pokazano 33 wersji utworzonych przez 8 użytkowników) | |||
| Linia 4: | Linia 4: | ||
<code> | <code> | ||
| − | + | ||
</code> | </code> | ||
| − | + | Aktualnie dostęp jest możliwy jedynie za pomocą narzędzi gridowych. | |
| + | |||
| + | Logowanie na maszynę dostępową możliwe jest poprzez SSH. | ||
| + | Odciski palca (tzw. fingeprint) kluczy: | ||
| + | <pre> | ||
| + | (RSA) SHA256:n5ro4MNw3Lmn1kr9SlnfBeFYSQ5u480kxAXMLDbyYnQ | ||
| + | (RSA) MD5:d6:ca:74:0a:e5:64:2d:4d:64:ef:9b:c6:75:3c:88:2b | ||
| + | (ECDSA) SHA256:o/fzPMSmXEtbBNrg/dY9egMBQvDqzr2cP3qcpZWgpgo | ||
| + | (ECDSA) MD5:35:43:39:c9:98:d3:8d:ad:af:80:9d:0a:c9:84:22:89 | ||
| + | </pre> | ||
| + | |||
| + | Proszę upewnić się, że został przedstawiony poprawny odcisk klucza. | ||
== Zasoby dyskowe == | == Zasoby dyskowe == | ||
{| class="wikitable" style="text-align:center;" | {| class="wikitable" style="text-align:center;" | ||
| − | ! Lokalizacja | + | ! Lokalizacja !! Limit !! Przeznaczenie !! Sposób<br/>dostępu !! Kopia<br/> bezpieczeństwa !! '''Możliwość wykonywania intensywnych<br/> zapisów i/lub odczytów''' !! Uwagi |
| − | ! Limit | ||
| − | ! Przeznaczenie | ||
| − | |||
| − | ! Kopia<br/> bezpieczeństwa | ||
| − | |||
|- | |- | ||
| − | |/ | + | |<tt>$HOME</tt> || 7GB || [[Podstawy#Katalogi_domowe|katalog domowy użytkownika]] || NFS || tak || nie || |
|- | |- | ||
| − | |/ | + | |<tt>$STORAGE</tt> || 100GB || [[Podstawy#Składowanie_danych|składowanie danych użytkownika]] || GPFS || nie || nie || |
|- | |- | ||
| − | |/ | + | |<tt>$SCRATCH</tt> || brak limitu || [[Podstawy#Przestrzeń tymczasowa|przestrzeń dla plików tymczasowych zadań]] || Lustre || nie || tak || dane starsze niż '''30 dni'''<br/>będą usuwane automatycznie |
|- | |- | ||
| − | | $PLG_GROUPS_SHARED/nazwa_zespołu<br/> | + | | <tt>$PLG_GROUPS_SHARED/nazwa_zespołu</tt><br/> <tt>$PLG_GROUPS_STORAGE/nazwa_zespołu</tt> || suma grantów || przestrzeń dla katalogów zespołów (PL-Grid) || Lustre || nie || nie || |
|} | |} | ||
| + | |||
| + | Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem '''zeus-fs'''. | ||
== Dostępne oprogramowanie == | == Dostępne oprogramowanie == | ||
| Linia 34: | Linia 42: | ||
== Uruchamianie zadań == | == Uruchamianie zadań == | ||
| − | System kolejkowy: | + | System kolejkowy: SLURM |
| − | + | W celu uruchomienia zadania niezbędna jest wiedza na temat [[Podstawy:SLURM|podstawowych komend systemu kolejkowego]]. | |
| − | + | == Opis partycji == | |
| − | + | {| class="wikitable" style="text-align:left;" | |
| − | + | ! Nazwa partycji !! Maksymalny czas<br/> trwania zadania !! Dodatkowe informacje | |
| − | {| class="wikitable" style="text-align: | ||
| − | ! Nazwa | ||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
| − | |||
|- | |- | ||
| − | | | + | | plgrid-testing || 1 godzina || zwiększony priorytet<br/> przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych |
|- | |- | ||
| − | | | + | | plgrid || 72 godziny || partycja domyślna, ustawiana automatycznie przy braku wyboru partycji |
|- | |- | ||
| − | | plgrid- | + | | plgrid-short || 3 godziny || |
|- | |- | ||
| − | | plgrid || | + | | plgrid-long || 168 godzin || partycja pozwalająca na zlecanie zadań z długim czasem wykonania |
|- | |- | ||
| − | | plgrid- | + | | plgrid-gpu || 72 godziny || partycja zawierająca węzły GPGPU |
|} | |} | ||
| + | |||
| + | '''Uwaga:''' Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą <tt>scontrol show partition=<nazwa_partycji></tt> | ||
== Opis właściwości węzłów obliczeniowych == | == Opis właściwości węzłów obliczeniowych == | ||
| Linia 68: | Linia 70: | ||
! Opis | ! Opis | ||
|- | |- | ||
| − | | | + | | E5645, X5650, opteron6276 || model procesora |
| + | |- | ||
| + | | intel, amd || producent procesora | ||
| + | |- | ||
| + | | mhz2667 || szybkość procesora | ||
|- | |- | ||
| mem16gb, mem24gb || ilość pamięci RAM w serwerze obliczeniowym | | mem16gb, mem24gb || ilość pamięci RAM w serwerze obliczeniowym | ||
|- | |- | ||
| − | | core8, core12 || ilość rdzeni w serwerze obliczeniowym | + | | core8, core12, core64 || ilość rdzeni w serwerze obliczeniowym |
|- | |- | ||
| ib_ql || sieć Inifniband firmy Qlogic | | ib_ql || sieć Inifniband firmy Qlogic | ||
| Linia 81: | Linia 87: | ||
|} | |} | ||
| − | == Sposób korzystania z sieci Infiniband == | + | <!-- == Sposób korzystania z sieci Infiniband == --> |
| − | |||
== Zasady obowiązujące na klastrze Zeus == | == Zasady obowiązujące na klastrze Zeus == | ||
| − | * | + | * obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia |
| − | + | * obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia | |
| − | * | + | * obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia |
| − | + | * uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone | |
| − | * | + | * po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut |
| + | * prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami | ||
| + | * prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia | ||
| + | * w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się [[Granty|tutaj]]. | ||
| + | * w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych | ||
| + | * w celu skompilowania programu proszę użyć [[Podstawy:SLURM#Zadanie_interaktywne|zadań interaktywnych]]. | ||
Aktualna wersja na dzień 08:56, 10 maj 2022
Spis treści
Nazwa maszyny dostępowej
Aktualnie dostęp jest możliwy jedynie za pomocą narzędzi gridowych.
Logowanie na maszynę dostępową możliwe jest poprzez SSH. Odciski palca (tzw. fingeprint) kluczy:
(RSA) SHA256:n5ro4MNw3Lmn1kr9SlnfBeFYSQ5u480kxAXMLDbyYnQ (RSA) MD5:d6:ca:74:0a:e5:64:2d:4d:64:ef:9b:c6:75:3c:88:2b (ECDSA) SHA256:o/fzPMSmXEtbBNrg/dY9egMBQvDqzr2cP3qcpZWgpgo (ECDSA) MD5:35:43:39:c9:98:d3:8d:ad:af:80:9d:0a:c9:84:22:89
Proszę upewnić się, że został przedstawiony poprawny odcisk klucza.
Zasoby dyskowe
| Lokalizacja | Limit | Przeznaczenie | Sposób dostępu |
Kopia bezpieczeństwa |
Możliwość wykonywania intensywnych zapisów i/lub odczytów |
Uwagi |
|---|---|---|---|---|---|---|
| $HOME | 7GB | katalog domowy użytkownika | NFS | tak | nie | |
| $STORAGE | 100GB | składowanie danych użytkownika | GPFS | nie | nie | |
| $SCRATCH | brak limitu | przestrzeń dla plików tymczasowych zadań | Lustre | nie | tak | dane starsze niż 30 dni będą usuwane automatycznie |
| $PLG_GROUPS_SHARED/nazwa_zespołu $PLG_GROUPS_STORAGE/nazwa_zespołu |
suma grantów | przestrzeń dla katalogów zespołów (PL-Grid) | Lustre | nie | nie |
Użytkownik klastra może sprawdzić użycie przydzielonych mu zasobów dyskowych poleceniem zeus-fs.
Dostępne oprogramowanie
Opis dostępnego oprogramowania znajduje się tutaj.
Uruchamianie zadań
System kolejkowy: SLURM
W celu uruchomienia zadania niezbędna jest wiedza na temat podstawowych komend systemu kolejkowego.
Opis partycji
| Nazwa partycji | Maksymalny czas trwania zadania |
Dodatkowe informacje |
|---|---|---|
| plgrid-testing | 1 godzina | zwiększony priorytet przeznaczona na krótkie zadania testowe, kompilację kodu, kopiowanie danych |
| plgrid | 72 godziny | partycja domyślna, ustawiana automatycznie przy braku wyboru partycji |
| plgrid-short | 3 godziny | |
| plgrid-long | 168 godzin | partycja pozwalająca na zlecanie zadań z długim czasem wykonania |
| plgrid-gpu | 72 godziny | partycja zawierająca węzły GPGPU |
Uwaga: Limity kolejek mogą zostać zmienione przez administratorów. Aktualne limity kolejek można sprawdzić komendą scontrol show partition=<nazwa_partycji>
Opis właściwości węzłów obliczeniowych
| Właściwość | Opis |
|---|---|
| E5645, X5650, opteron6276 | model procesora |
| intel, amd | producent procesora |
| mhz2667 | szybkość procesora |
| mem16gb, mem24gb | ilość pamięci RAM w serwerze obliczeniowym |
| core8, core12, core64 | ilość rdzeni w serwerze obliczeniowym |
| ib_ql | sieć Inifniband firmy Qlogic |
| ib_mlx | sieć Infiniband firmy Mellanox |
| infiniband | serwer obliczeniowy z siecią Infiniband |
Zasady obowiązujące na klastrze Zeus
- obliczenia wykonywane na maszynie dostępowej będą usuwane bez ostrzeżenia
- obliczenia z intensywnym wykorzystywaniem /people/[login] lub /storage/[login] będą usuwane bez ostrzeżenia
- obliczenia wykraczające poza zakres deklarowanego tematu badań zużywające znaczną część zasobów klastra będą usuwane bez ostrzeżenia
- uruchamianie benchmarków bez uprzedniego kontaktu z administratorami jest niedozwolone
- po pięciu nieudanych próbach zalogowania adres IP "atakującego" jest blokowany na 30 minut
- prosimy uzywac oprogramowania ssh-agent do inicjalizacji kluczy z hasłem w celu połączenia z innymi maszynami
- prywatne klucze SSH nie posiadające haseł zabezpieczających będą usuwane bez ostrzeżenia
- w celu wykonywania obliczeń niezbędne jest podanie identyfikatora grantu za pomocą parametru "-A". Szczegółowy opis grantów znajduje się tutaj.
- w ramach grantu osobistego w jednym zadaniu można użyć 96 rdzeni obliczeniowych
- w celu skompilowania programu proszę użyć zadań interaktywnych.
