pl:faq:slurm_queue:why_pending
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revision | |||
pl:faq:slurm_queue:why_pending [2024/12/06 02:05] – removed - external edit (Unknown date) 127.0.0.1 | pl:faq:slurm_queue:why_pending [2024/12/06 02:05] (current) – ↷ Page moved from faq:slurm_queue:why_pending to pl:faq:slurm_queue:why_pending mkadlof | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== Pytania i odpowiedzi ====== | ||
+ | ===== Kolejka Slurm ===== | ||
+ | |||
+ | |||
+ | ==== Dlaczego moje zadanie trwa w stanie PENDING (PD) choć wydaje się, że na klastrze jest dość wolnych zasobów? ==== | ||
+ | |||
+ | Istnieje wiele powodów, dla których zadanie może nie być uruchamiane od razu po wstawieniu do kolejki. Na niektóre z nich użytkownik ma wpływ, na inne nie. Slurm udziela nam wskazówek dlaczego zadanie czeka. Po wpisaniu polecenia '' | ||
+ | |||
+ | === Komunikat '' | ||
+ | |||
+ | Komunikat ten oznacza, że w systemie istnieje rezerwacja i zadanie nie zdążyłoby się wykonać przed jej rozpoczęciem. Rezerwacje tworzą administratorzy, | ||
+ | |||
+ | Jeśli tylko jesteś w stanie wskazać górne ograniczenie czasu wykonania zadania (mniejsze niż maksymalny czas w kolejce) to należy to zrobić. Im dokładniejsze oszacowanie, | ||
+ | |||
+ | == Wskazówki == | ||
+ | - Sprawdź jakie rezerwacje znajdują się w systemie: '' | ||
+ | - Sprawdź limity czasu w kolejkach: '' | ||
+ | - Sprawdź najpóźniej wykona się Twoje zadanie: '' | ||
+ | - Wykonaj próbę uruchomienia zadania z flagą '' | ||
+ | - Dodaj do swojego zadania flagę ograniczającą czas zadania: '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | === Komunikat '' | ||
+ | |||
+ | Wszystkie wymienione powyżej uwagi i wskazówki mają zastosowanie i w tym wypadku. Różnica tkwi w przyczynie utworzenia rezerwacji. Niektóre przedsięwzięcia wymagają dostępności określonych zasobów w konkretnym czasie. W uzasadnionych wypadkach administrator może wykonać taką rezerwacje na prośbę użytkownika. | ||
+ | |||
+ | === Komunikat (PartitionConfig) === | ||
+ | |||
+ | Użytkownik zażądał zasobów niemożliwych do spełnienia w ramach danej kolejki. Np. zbyt wiele węzłów obliczeniowych. | ||
+ | |||
+ | === Komunikat (PartitionTimeLimit) === | ||
+ | |||
+ | Użytkownik zażądał czasu dla zadania dłuższego niż limit kolejki. | ||
+ | |||
+ | == Wskazówki == | ||
+ | |||
+ | - Należy sprawdzić parametry zadania i skonfrontować je z konfiguracją kolejki | ||
+ | - Parametry kolejek można wyświetlić przy pomocy polecenie '' | ||
+ | |||
+ | === Komunikat (Resources) === | ||
+ | |||
+ | Ten komunikat oznacza typową sytuację gdy na klastrze trwają inne obliczenia i zadanie czeka na ich zwolnienie. Żadna akcja ze strony użytkownika nie jest wymagana. Warto się jednak upewnić, czy nie blokujemy sami siebie zbyt " | ||
+ | |||
+ | === Komunikat (Priority) === | ||
+ | |||
+ | Komunikat oznacza, że zadanie zostało zepchnięte w dół listy priorytetów. Szczegółowy opis algorytmu obliczania priorytetu pojawi się niebawem. Aby sprawdzić jakie wartości składowe wpływają na obliczenie priorytetu zadania należy wpisać polecenie '' |