[[computing:cluster:|{{:up1.png?direct|}}]]
[[computing:cluster:|Cluster KRAKEN]]
====== KRAKEN - Hardware ======
Cluster KRAKEN je složen z **administrativního uzlu** (přístup, ovládání front, příprava úloh, ...)
**Platí zákaz obsazování administrativního uzlu výpočetními úlohami!**
^ Procesor:|[[https://www.amd.com/en/products/cpu/amd-epyc-7302p|AMD EPYC 7302P 16-Core Processor]] |16 jader, 3.0GHz, hyperthreading, 128MB cache|
^ Paměť:|320GB|DDR4 3200 ECC|
^ Disky:|2x 960GB| NVMe M.2 SSD|
^ Vzdálená správa:|IPMI |KVM-o-E |
a dvou výpočetních částí (všem uživatelům je přístupná jen část "M"):
=== M - jako MultiCore ===
Část M obsahuje celkem **10 výpočetních uzlů** (celkem 576 jader, 3.33TB RAM) postavených na třech architekturách procesorů:
**1. Intel - broadwell**, 6 uzlů (kraken-m1, ..., kraken-m6):
^ Základní deska:|[[https://www.supermicro.nl/products/motherboard/Xeon/C600/X10DRW-ET.cfm|SUPERMICRO X10DRW-ET]] |2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management |
^ Procesory:|2x [[https://ark.intel.com/products/91766/Intel-Xeon-Processor-E5-2683-v4-40M-Cache-2_10-GHz|Intel(R) Xeon(R) CPU E5-2683 v4 @ 2.10-3.0GHz]] |**16 jader, hyperthreading, 48MB cache** |
^ Paměť:|256GB na 1 nod |DDR4 2400MHz ECC reg. |
^ Disky:|4x 6TB SATA, 2x1TB SSD | [[https://toshiba.semicon-storage.com/us/product/storage-products/enterprise-hdd/mg04acaxxxx.html|TOSHIBA MG04ACA6]], [[ https://www.micron.com/parts/solid-state-storage/ssd/mtfddak960tcc-1ar16ab?pc={BD70429E-50BD-4D5C-A386-3E2D4143F5B3}|Micron_5100_MTFD]] |
^ Vzdálená správa:|IPMI |IPMI 2.0 with virtual media over LAN and KVM-over-LAN support |
**2. AMD - zen 2**, 3 uzly (kraken-x1,...,kraken-x3), v provozu od 10/2021:
^ Procesory:|2x [[https://www.amd.com/en/products/cpu/amd-epyc-7552|2nd Gen AMD EPYC(TM) 7552]] |**48 jader, 2.2-3.3GHz, 192MB cache** (96 jader na 1 nod) |
^ Paměť:|512GB na 1 nod |DDR4 3200MHz ECC |
^ Disky:|960GB na 1 nod |NVMe M.2 SSD |
^ Vzdálená správa:|IPMI |KVM-o-E |
**3. AMD - zen 4**, 1 uzel (kraken-x4), v provozu od 11/2023:
^ Procesory:|1x [[https://www.amd.com/en/products/cpu/amd-epyc-9654p|4nd Gen AMD EPYC(TM) 9654P]] |**96 jader, 2.4-3.7GHz, 384MB cache** |
^ Paměť:|256GB |DDR5 4800MHz ECC |
^ Disky:|960GB |NVMe M.2 SSD |
^ Vzdálená správa:|IPMI |KVM-o-E |
=== L - jako LowCore (dostupná jen vybraným uživatelům)===
Část L obsahuje **4 uzly** (kraken-l1,...,kraken-l4):
^ Základní deska:|[[https://www.supermicro.nl/products/motherboard/Xeon/C600/X10DRW-ET.cfm|SUPERMICRO X10DRW-ET]] |2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management |
^ Procesory:|2x [[https://ark.intel.com/products/92983/Intel-Xeon-Processor-E5-2637-v4-15M-Cache-3_50-GHz|Intel(R) Xeon(R) CPU E5-2637 v4 @ 3.50GHz]] |**4 jádra, hyperthreading, 16MB cache** |
^ Paměť:|256GB na 1 nod |DDR4 2400 ECC reg. |
^ Disky:|4x 6TB SATA, 2x1TB SSD | [[https://toshiba.semicon-storage.com/us/product/storage-products/enterprise-hdd/mg04acaxxxx.html|TOSHIBA MG04ACA6]], [[ https://www.micron.com/parts/solid-state-storage/ssd/mtfddak960tcc-1ar16ab?pc={BD70429E-50BD-4D5C-A386-3E2D4143F5B3}|Micron_5100_MTFD]] |
^ Vzdálená správa:|IPMI |IPMI 2.0 with virtual media over LAN and KVM-over-LAN support |
== Teplota v serverovně ==
{{ https://eye.it.cas.cz/g/?.png? |Temperature TR1}}
Omezení výkonu clusteru dle teploty v serverovně:
- 32˚C - 34˚C omezovat spouštění dalších úloh ve frontách (režim DRAIN)
- 34˚C - 36˚C vypínat stroje (režim DOWN)
Omezování (DRAIN) provádět nejprve na strojích, na kterých mají úlohy brzy doběhnout.
Vypínat (DOWN) nejprve stroje na nichž běží úlohy s nižším poměrem "doba běhu/deklarovaná doba běhu"
V delších obdobích problémů s vysokými teplotami ponechat části clusteru odstavené v pořadí
- nody m1-m6
- nody l1-l4
- nody m7-m10