rossleor asseco murr

Nový král fascinujícího světa superpočítačů

Pořadí na prestižním žebříčku TOP500 nejvýkonnějších počítačů světa se po čase opět změnilo a do čela se dostal nový šampion – a ne ledajaký. El Capitan má simulovat jaderné výbuchy.

 

Jaderné zbraně v amerických zásobách je třeba prověřovat, aby bylo zajištěno, že budou správně fungovat a je také nutné je přepracovat a znovu použít jejich výbušniny, jenže zákaz zkoušek znamená, že to musí být provedeno pouze prostřednictvím simulací, což je důvodem velkých rozpočtů DOE na superpočítače v USA.
Superpočítač El Capitan v kalifornské Lawrence Livermore National Lab (LLNL) je stroj tzv. exascale třídy, šitý na míru pro některé z nejsložitějších simulačních a modelovacích úloh, jaké kdy byly vytvořeny. Má být dost dobrý i v nových velkých jazykových modelech, které jsou jádrem revoluce GenAI. Kromě simulací reagujících na zhoršenou bezpečnostní situaci ve světě, bude využit ovšem i k mírumilovnějším účelům – počítá se s jeho využitím i k výzkumu jaderné fúze, návrhům nových léků, vytváření detailních klimatických modelů apod.
Stroj pojmenovaný podle 914 metrů vysokého strmého skalního masivu v Yosemitském údolí v pohoří Sierra Nevada, který první člověk zdolal teprve v roce 2017, k tomu bude také mimořádně dobře vybaven. Díky výpočetní síle 24jádrových procesorů v počtu 1 051 392 nabídne výkon až 1,742 exaFLOPS, tzn., že zvládne 1 742 000 000 000 000 000 operací s plovoucí desetinnou čárkou za sekundu – exa před označením FLOPS (FLoating-point Operations Per Second), což je standardizovaná jednotka pro měření výpočetního výkonu, znamená trilion (jednička a 18 nul).
El Capitan tak překonal dosavadního rekordmana přehledu TOP500, superpočítač Frontier v americkém Tennessee, který v roce 2022 jako první překročil s výkonem 1,353 exaFLOPS magickou hranici trilionu operací za sekundu.

Počítače jsou stále výkonnější, ale vývoj zpomaluje
Dříve se žebříček nejvýkonnějších počítačů světa měnil i několikrát do roka. V posledních letech se však tempo jejich stavby zpomalilo poté, co přestává platit tzv. Moorův zákon, který formuloval spoluzakladatel Intelu Gordon Moore v roce 1965 na základě dosavadních poznatků z vývoje výkonových parametrů počítačů s tím, že: „počet tranzistorů, které se vejdou na integrovaný obvod, se zhruba každého jedenapůl roku zdvojnásobí, a to při zachování víceméně stejné ceny“.
Za zpomalením stojí zejména zmenšování polovodičových komponent a z nich složených čipů, které už nějakou dobu začíná narážet na fyzikální hranice dané vlastnostmi materiálů používaných pro jejich výrobu. Postupně tak došlo ke zpomalování růstu počtu tranzistorů a u superpočítačů se tak začal prosazovat nový trend: Dosáhnout větší výkon znamená zvětšit i samotný počítač.
Jak konstatoval v časopise New Scientist odborník na superpočítače z Bristolské univerzity Simon McIntosh-Smith, zatímco ještě donedávna se výkon systému stejné velikosti mohl díky Mooreovu zákonu zdvojnásobit zhruba za dva roky, dnes už to neplatí, a dvakrát výkonnější počítač musí být naopak zhruba o polovinu větší a bude spotřebovávat o čtvrtinu více energie, což znamená, že stavba nových strojů této kategorie se tak stává stále náročnější, komplikovanější a dražší. Experti proto odhadují, že nynější lídr El Capitan by se mohl na čelní pozici TOP500 udržet nejméně rok, pokud ne déle.

Co se skrývá uvnitř šampiona
Jako hlavní výpočetní motor v systému El Capitan jsou použita hybridní konvergovaná zařízení, které integrují CPU a GPU komponenty do jedné, označované AMD jako zrychlená procesorová jednotka neboli APU.
El Capitan má 11 136 uzlů v kapalinou chlazených stojanech Cray EX se čtyřmi těmito výpočetními jednotkami MI300A na uzel a celkem 44 544 zařízeními v celém systému. Každé má 128 GB hlavní paměti HBM3, sdílené mezi čiplety CPU a GPU, která běží na frekvenci 5,2 GHz a poskytuje dohromady 5,3 TB/s agregované šířky pásma do a z čipletů CPU (na 1,8 GHz) a GPU (pracujících podle AMD na max. frekvenci 2,1 GHz). Každý uzel má tak 250,8 teraflopů špičkového výkonu FP64. Spojením všech těchto uzlů dohromady lze získat 2 792,9 petaflopů agregovaného FP64 s 5,475 PB paměti HBM3. To vše doplňují výkonné síťové karty Slingshot 11, které propojují APU mezi sebou napříč systémem.
A to nejlepší nakonec: Server NextPlatform, zaměřený na výkonné výpočetní systémy, si všímá skutečnosti, že část stroje, která byla využita ke spuštění benchmarku High Performance Linpack, používaného k hodnocení superpočítačů, měla aktivovaných 43 808 APU, tzn., pokud jich bylo ve fyzickém stroji celkem 44 544, představuje to „jen“ 98,3 % kapacity stroje. Pokud LLNL spustí HPL na všech APU v systému, dojde u El Capitana k dalšímu nárůstu výkonu o 1,65 %, zlepšení souhry výpočetní techniky, paměti a propojení by mohlo výkon zvýšit o dalších zhruba 5 %. A jestliže LLNL dokáže zvýšit výkon softwaru a ladění sítě o 7,5 %, pak špičková kapacita HPL stroje může prolomit hranici tří exaflops, což by byl dvojnásobek původního očekávaného výkonu El Capitana před pěti lety, kdy byl projekt zahájen.

Kamil Pittner
Foto: Lawrence Livermore National Lab

 
Publikováno: 30. 12. 2024 | Počet zobrazení: 13 | Počet přeposlání: 0 článek mě zaujal 2
Zaujal Vás tento článek?
Ano