meta data stránky
Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revizePředchozí verzeNásledující verze | Předchozí verze | ||
computing:cluster:fronty:start [2022/06/06 09:54] – Jan Pech | computing:cluster:fronty:start [2024/09/17 11:33] (aktuální) – Jan Pech | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | Od února 2022 dochází | + | Od února 2022 je spouštění úloh na výpočetních uzlech |
- | * <wrap em>Na výpočetních uzlech úlohy mimo frontový systém nespouštějte!</ | + | <wrap em> |
- | * <wrap em> | + | |
- | Níže naleznete základní popis práce s frontami, specifika spouštění konkrétních aplikací jsou popsány | + | |
+ | Aktuální vytížení clusteru zobrazuje, kromě [[computing: | ||
+ | |||
+ | '' | ||
+ | |||
+ | {{: | ||
+ | |||
+ | **Uživatelé zadáním úlohy do fronty přenechávají spuštění výpočtu frontovému systému. Úloha je do fronty zařazena v pořadí dle interních priorit systému a čeká na spuštění. Frontový systém úlohu spustí hned jak jsou dostupné výpočetní kapacity, <wrap em> | ||
+ | |||
+ | Níže naleznete základní popis práce s frontovým systémem (SLURM), specifika spouštění konkrétních aplikací jsou na samostatných stránkách: | ||
* [[computing: | * [[computing: | ||
* [[computing: | * [[computing: | ||
Řádek 13: | Řádek 21: | ||
* [[computing: | * [[computing: | ||
* [[computing: | * [[computing: | ||
- | \\ | + | |
====== Frontový systém SLURM ====== | ====== Frontový systém SLURM ====== | ||
- | Frontový systém | + | Frontový systém |
+ | |||
+ | Kompletní dokumentace je na adrese [[https:// | ||
==== Základní příkazy: ==== | ==== Základní příkazy: ==== | ||
=== Spouštění úloh === | === Spouštění úloh === | ||
- | + | K dispozici jsou 2 příkazy pro zařazení úlohy do fronty, '' | |
- | srun <volby> < | + | srun <parametry> < |
- | // | + | // |
+ | '' | ||
sbatch < | sbatch < | ||
- | //Zadání úlohy do fronty dle připraveného skriptu, viz příklady níže. Součástí skriptu bývá řádka s příkazem " | + | //Zadání úlohy do fronty dle připraveného skriptu, viz příklady níže. Součástí skriptu |
=== Řízení úloh === | === Řízení úloh === | ||
Řádek 33: | Řádek 45: | ||
squeue | squeue | ||
//Vypíše informace o běžících úlohách ve frontovém systému.// | //Vypíše informace o běžících úlohách ve frontovém systému.// | ||
+ | |||
+ | Význam zkratek ve výpisu //squeue// ([[https:// | ||
+ | |||
+ | - ve sloupci " | ||
+ | |||
+ | - ve sloupci REASON: **Priority** - ve frontě je/jsou úloha/y s vyšší prioritou, **Dependency** - úloha čeká na dokončení úlohy v závislosti a bude spuštěna poté, **Resources** - úloha čeká na uvolnění potřebných výp. zdrojů,... | ||
+ | |||
scancel < | scancel < | ||
Řádek 48: | Řádek 67: | ||
Úlohy je možné spouštěn na více uzlech, ale vždy jen na jedné části serveru kraken: | Úlohy je možné spouštěn na více uzlech, ale vždy jen na jedné části serveru kraken: | ||
- | * část **M** - stroje kraken-m1 až m9 (všichni uživatelé) | + | * část **M** - stroje kraken-m1 až m10 (všichni uživatelé) |
* část **L** - stroje kraken-l1 až l4 (omezený přístup) | * část **L** - stroje kraken-l1 až l4 (omezený přístup) | ||
Řádek 69: | Řádek 88: | ||
Na clusteru Kraken je k dispozici 6 front (" | Na clusteru Kraken je k dispozici 6 front (" | ||
- | ^ cluster part ^ partition | + | ^ cluster part ^ partition |
- | | M (nodes kraken-m[1-9]) | **Mexpress** | + | | M (nodes kraken-m[1-10]) | **Mexpress** |
- | | ::: | Mshort | + | | ::: | Mshort |
- | | ::: | Mlong | + | | ::: | ::: | ::: | 3 days | |
- | | ::: | ::: | 2 weeks | | + | | ::: | Mlong | kraken-m[3-6], |
- | | L (nodes kraken-l[1-4]) | + | | ::: |
- | | ::: | Lshort | + | | L (nodes kraken-l[1-4]) |
- | | ::: | Llong | **1 week** | + | | ::: | Lshort |
- | | ::: | ::: | 2 months (max) | | + | | ::: | Llong |
- | | admin node only | NoCompute | + | | ::: |
- | | ::: | ::: | 8 hours | | + | | admin node only | NoCompute |
+ | | ::: | ||
*bold=default | *bold=default | ||
+ | Detaily nastavení lze zobrazit také příkazem | ||
+ | scontrol show partition [partition_name] | ||
==== Parametry příkazů '' | ==== Parametry příkazů '' | ||
Řádek 108: | Řádek 129: | ||
Do jmen souborů výstupu (output, error) lze začlenit proměnné jako jméno nodu (%N), číslo úlohy (%J), jméno uživatele (%u), apod... Výpis standardní chyby zadaný ve skriptu ''# | Do jmen souborů výstupu (output, error) lze začlenit proměnné jako jméno nodu (%N), číslo úlohy (%J), jméno uživatele (%u), apod... Výpis standardní chyby zadaný ve skriptu ''# | ||
+ | |||
+ | Začátek běhu nově zadávané úlohy lze podmínit např. dokončením úlohy již běžící | ||
+ | ``sbatch --dependency=after: | ||
+ | 123456 je zde číslo úlohy (dle výpisu squeue) a " | ||
Kompletní seznam parametrů naleznete např. na stránce [[https:// | Kompletní seznam parametrů naleznete např. na stránce [[https:// |