meta data stránky
- Česky (cs)
- English (en)
Toto je starší verze dokumentu!
KRAKEN - Hardware
Cluster KRAKEN je složen z administrativního uzlu (přístup, ovládání front, příprava úloh, …)
Procesor: | AMD EPYC 7302P 16-Core Processor | 16 jader, 3.0GHz, hyperthreading, 128MB cache |
---|---|---|
Paměť: | 320GB | DDR4 3200 ECC |
Disky: | 2x 960GB | NVMe M.2 SSD |
Vzdálená správa: | IPMI | KVM-o-E |
a dvou výpočetních částí (všem uživatelům je přístupná jen část „M“):
M - jako MultiCore
Část M obsahuje celkem 9 výpočetních uzlů (celkem 480 jader, 2.56TB RAM). Z toho 6 uzlů (kraken-m1, …, kraken-m6) s touto specifikací:
Základní deska: | SUPERMICRO X10DRW-ET | 2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management |
---|---|---|
Procesory: | 2x Intel(R) Xeon(R) CPU E5-2683 v4 @ 2.10GHz | 16 jader, hyperthreading, 48MB cache |
Paměť: | 256GB na 1 nod | DDR4 2400 ECC reg. |
Disky: | 4x 6TB SATA, 2x1TB SSD | TOSHIBA MG04ACA6, Micron_5100_MTFD |
Vzdálená správa: | IPMI | IPMI 2.0 with virtual media over LAN and KVM-over-LAN support |
a 3 nové uzly (kraken-m7,…,kraken-m9) v provozu od 10/2021 se specifikací:
Procesory: | 2x 2nd Gen AMD EPYC(TM) 7552 | 48 jader, 2.2GHz, 192MB cache (96 jader na 1 nod) |
---|---|---|
Paměť: | 2 uzly 256GB, 1 uzel 512GB (kraken-m8) | DDR4 3200 ECC |
Disky: | 960GB na 1 nod | NVMe M.2 SSD |
Vzdálená správa: | IPMI | KVM-o-E |
L - jako LowCore (dostupná jen vybraným uživatelům)
Část L obsahuje 4 uzly (kraken-l1,…,kraken-l4):
Základní deska: | SUPERMICRO X10DRW-ET | 2x Intel Xeon processor E5-2600 v4, max. 2TB RAM, 2x 10 Gbit Ethernet, Remote management |
---|---|---|
Procesory: | 2x Intel(R) Xeon(R) CPU E5-2637 v4 @ 3.50GHz | 4 jádra, hyperthreading, 16MB cache |
Paměť: | 256GB na 1 nod | DDR4 2400 ECC reg. |
Disky: | 4x 6TB SATA, 2x1TB SSD | TOSHIBA MG04ACA6, Micron_5100_MTFD |
Vzdálená správa: | IPMI | IPMI 2.0 with virtual media over LAN and KVM-over-LAN support |
Teplota v serverovně
Omezení výkonu clusteru dle teploty v serverovně:
- 32˚C - 34˚C omezovat spouštění dalších úloh ve frontách (režim DRAIN)
- 34˚C - 36˚C vypínat stroje (režim DOWN)
Omezování (DRAIN) provádět nejprve na strojích, na kterých mají úlohy brzy doběhnout.
Vypínat (DOWN) nejprve stroje na nichž běží úlohy s nižším poměrem „doba běhu/deklarovaná doba běhu“
V delších obdobích problémů s vysokými teplotami ponechat části clusteru odstavené v pořadí
- nody m1-m6
- nody l1-l4
- nody m7-m9