pl:first_steps:slurm_overview
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
pl:first_steps:slurm_overview [2024/12/06 02:05] – removed - external edit (Unknown date) 127.0.0.1 | pl:first_steps:slurm_overview [2024/12/06 02:12] (current) – ↷ Links adapted because of a move operation mkadlof | ||
---|---|---|---|
Line 1: | Line 1: | ||
+ | ====== System kolejkowy SLURM ====== | ||
+ | Klaster działa pod kontrolą [[https:// | ||
+ | |||
+ | <wrap center round info 80%> | ||
+ | Wszystkie zdania są uruchamiane za pośrednictwem hosta dostępowego. Nie ma możliwości bezpośredniego logowania się na węzły obliczeniowe przez SSH. | ||
+ | </ | ||
+ | |||
+ | <wrap center round info 80%> | ||
+ | W przypadku gdy użytkownik pominie specyfikację wymagań zostaną użyte wartości domyślne (np. maksymalny dostępny czas zasobów. Może to jednak spowodować zachowanie niezgodne z oczekiwaniem: | ||
+ | </ | ||
+ | |||
+ | ===== Podstawowe polecenia SLURM' | ||
+ | |||
+ | |||
+ | ==== sinfo ==== | ||
+ | Wyświetla informacje o stanie klastra - liczba dostępnych kolejek i węzłów obliczeniowych wchodzących w ich skład, oraz ich dostępność. | ||
+ | |||
+ | ==== squeue ==== | ||
+ | Wyświetla informacje o aktualnie wysłanych do kolejki zadaniach (zarówno uruchomionych jak i oczekujących). | ||
+ | |||
+ | ==== srun ==== | ||
+ | Służy do urcuchamiania poleceń w czasie rzeczywistym. Dobre do eksperymentowania i wykonywania niewielkich testów. | ||
+ | |||
+ | Przykładowo polecenie: | ||
+ | '' | ||
+ | uruchomione na hoście dostępowym spowoduje, że do kolejki zostanie dodane zadanie wykonania programu '' | ||
+ | |||
+ | ==== sbatch ==== | ||
+ | Służy do uruchamiania zadań za pośrednictwem tzw. [[pl: | ||
+ | |||
+ | ==== scontrol ==== | ||
+ | |||
+ | Służy do uzyskiwania szczegółowych informacji na temat stanu klastra. Przykłady: | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | ===== Konsola interaktywna ===== | ||
+ | Niektóre zadania mogą wymagać dostępu do powłoki bash na węźle obliczeniowym. Przykładem takiego zadania może być kompilacja własnego programu przed jego właściwym uruchomieniem. Ze względu na brak możliwości logowania się przez SSH bezpośrednio na węzły obliczeniowe należy zarządać od SLURM' | ||
+ | |||
+ | '' | ||
+ | |||
+ | niekiedy warto doprecyzować na którym węźle interesuje nas uruchomienie powłoki: | ||
+ | |||
+ | '' | ||
+ | |||
+ | a także wskazać na ile czasu będziemy jej potrzebować. W szczególności przydatne, gdy chcemy zrobić coś "na szybko" | ||
+ | |||
+ | '' | ||
+ | |||
+ | powyższy zapis oznacza maksymalny czas dla zadania 15 minut. | ||
+ | |||
+ | <wrap center round info 80%> | ||
+ | Jeśli nie precyzujemy na jaki czas potrzebujemy zasobu, to SLURM zakłada najdłuższy możliwy czas dla danej kolejki (zazwyczaj kilka dni). Jeśli w systemie istnieje rezerwacja zbliżająca się np. za dwie godziny, a my potrzebujemy dostępu do konsoli na 10 minut, a mimo to nie podamy tej informacji, to SLURM założy, że oczekujemy dostępnego maksymalnego czasu i nie wpuści zadania przed rezerwacją. | ||
+ | </ | ||
+ | |||
+ | <wrap center round important 80%> | ||
+ | Częstym błędem jest pomieszanie kolejności argumentów. | ||
+ | |||
+ | zapis: '' | ||
+ | </ | ||
+ | |||
+ |