Checkpointing

Z Komputery Dużej Mocy w ACK CYFRONET AGH
Skocz do:nawigacja, szukaj

Checkpointing jest mechanizmem automatycznego zapisywania stanu obliczeń w określonych odstępach czasu, dzięki czemu możliwe jest ponowne wznowienie zadania od momentu ostatniego checkpointu w razie awarii jednego z węzłów biorącego udział w obliczeniach lub po zabiciu zadania z powodów administracyjnych, takich jak przekroczenie dopuszczalnego limitu czasu w kolejce.

Część aplikacji naukowych posiada już zaimplementowaną tę funkcję i wymagane jest jedynie jej aktywowanie przez użytkownika.