[[computing:cluster:|{{:up1.png?direct|}}]] [[computing:cluster:|Cluster KRAKEN]] ====== KRAKEN - Hardware ====== Cluster KRAKEN je složen z **administrativního uzlu** (přístup, ovládání front, příprava úloh, ...) **Platí zákaz obsazování administrativního uzlu výpočetními úlohami!** ^ Procesor:|[[https://www.amd.com/en/products/cpu/amd-epyc-7302p|AMD EPYC 7302P 16-Core Processor]] |16 jader, 3.0GHz, hyperthreading, 128MB cache| ^ Paměť:|320GB|DDR4 3200 ECC| ^ Disky:|2x 960GB| NVMe M.2 SSD| ^ Vzdálená správa:|IPMI |KVM-o-E | a dvou výpočetních částí (všem uživatelům je přístupná jen část "M"): === M - jako MultiCore === Část M obsahuje celkem **10 výpočetních uzlů** (celkem 576 jader, 3.33TB RAM) postavených na třech architekturách procesorů: **1. Intel - broadwell**, 6 uzlů (kraken-m1, ..., kraken-m6): ^ Základní deska:|[[https://www.supermicro.nl/products/motherboard/Xeon/C600/X10DRW-ET.cfm|SUPERMICRO X10DRW-ET]] |2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management | ^ Procesory:|2x [[https://ark.intel.com/products/91766/Intel-Xeon-Processor-E5-2683-v4-40M-Cache-2_10-GHz|Intel(R) Xeon(R) CPU E5-2683 v4 @ 2.10-3.0GHz]] |**16 jader, hyperthreading, 48MB cache** | ^ Paměť:|256GB na 1 nod |DDR4 2400MHz ECC reg. | ^ Disky:|4x 6TB SATA, 2x1TB SSD | [[https://toshiba.semicon-storage.com/us/product/storage-products/enterprise-hdd/mg04acaxxxx.html|TOSHIBA MG04ACA6]], [[ https://www.micron.com/parts/solid-state-storage/ssd/mtfddak960tcc-1ar16ab?pc={BD70429E-50BD-4D5C-A386-3E2D4143F5B3}|Micron_5100_MTFD]] | ^ Vzdálená správa:|IPMI |IPMI 2.0 with virtual media over LAN and KVM-over-LAN support | **2. AMD - zen 2**, 3 uzly (kraken-x1,...,kraken-x3), v provozu od 10/2021: ^ Procesory:|2x [[https://www.amd.com/en/products/cpu/amd-epyc-7552|2nd Gen AMD EPYC(TM) 7552]] |**48 jader, 2.2-3.3GHz, 192MB cache** (96 jader na 1 nod) | ^ Paměť:|512GB na 1 nod |DDR4 3200MHz ECC | ^ Disky:|960GB na 1 nod |NVMe M.2 SSD | ^ Vzdálená správa:|IPMI |KVM-o-E | **3. AMD - zen 4**, 1 uzel (kraken-x4), v provozu od 11/2023: ^ Procesory:|1x [[https://www.amd.com/en/products/cpu/amd-epyc-9654p|4nd Gen AMD EPYC(TM) 9654P]] |**96 jader, 2.4-3.7GHz, 384MB cache** | ^ Paměť:|256GB |DDR5 4800MHz ECC | ^ Disky:|960GB |NVMe M.2 SSD | ^ Vzdálená správa:|IPMI |KVM-o-E | === L - jako LowCore (dostupná jen vybraným uživatelům)=== Část L obsahuje **4 uzly** (kraken-l1,...,kraken-l4): ^ Základní deska:|[[https://www.supermicro.nl/products/motherboard/Xeon/C600/X10DRW-ET.cfm|SUPERMICRO X10DRW-ET]] |2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management | ^ Procesory:|2x [[https://ark.intel.com/products/92983/Intel-Xeon-Processor-E5-2637-v4-15M-Cache-3_50-GHz|Intel(R) Xeon(R) CPU E5-2637 v4 @ 3.50GHz]] |**4 jádra, hyperthreading, 16MB cache** | ^ Paměť:|256GB na 1 nod |DDR4 2400 ECC reg. | ^ Disky:|4x 6TB SATA, 2x1TB SSD | [[https://toshiba.semicon-storage.com/us/product/storage-products/enterprise-hdd/mg04acaxxxx.html|TOSHIBA MG04ACA6]], [[ https://www.micron.com/parts/solid-state-storage/ssd/mtfddak960tcc-1ar16ab?pc={BD70429E-50BD-4D5C-A386-3E2D4143F5B3}|Micron_5100_MTFD]] | ^ Vzdálená správa:|IPMI |IPMI 2.0 with virtual media over LAN and KVM-over-LAN support | == Teplota v serverovně == {{ https://eye.it.cas.cz/g/?.png? |Temperature TR1}} Omezení výkonu clusteru dle teploty v serverovně: - 32˚C - 34˚C omezovat spouštění dalších úloh ve frontách (režim DRAIN) - 34˚C - 36˚C vypínat stroje (režim DOWN) Omezování (DRAIN) provádět nejprve na strojích, na kterých mají úlohy brzy doběhnout. Vypínat (DOWN) nejprve stroje na nichž běží úlohy s nižším poměrem "doba běhu/deklarovaná doba běhu" V delších obdobích problémů s vysokými teplotami ponechat části clusteru odstavené v pořadí - nody m1-m6 - nody l1-l4 - nody m7-m10