asseco Aimtec murr

Nové supervýkonné čipy pro AI

Pokrok v oblasti umělé inteligence a počítačové grafiky, zlepšení modelovacích programů, tvorba videí i jejich rostoucí kvalita vedou k vyšší poptávce a zájmu o výkonnější polovodiče.

 

Řešením by měla být nová generace čipů vyvinutých a optimalizovaných pro tyto účely. První z nich představila nedávno firma Samsung s tím, že masová výroba nového čipu je plánována na první polovinu letošního roku. Předpokládá, že vzhledem k exponenciálnímu růstu počtu aplikací pro AI bude novinka optimálním řešením pro budoucí systémy, které vyžadují více paměti. Její nový paměťový čip pro AI zvyšuje výkon i kapacitu o více než 50 procent.

Jak zvládnout datová tsunami
Zanedlouho přišla se svým trumfem i americká Nvidia. Tento výrobce jednotek GPU (mikroprocesorů zajišťujících grafické výpočty) představil svou platformu Blackwell GB200, která je několikrát rychlejší a úspornější než dosavadní hardware. Měla by nejen zlevnit výpočetní technologie, ale přinést i revoluci ve vývoji AI. Produkty založené na nové platformě budou k dispozici koncem roku.
Nová architektura, pojmenovaná na počest Davida Harolda Blackwella (matematika a prvního černošského učence uvedeného do americké Národní akademie věd), nahrazuje architekturu Nvidia Hopper, uvedenou na trh před dvěma lety. Zatímco chatovací robot ChatGPT od OpenAI mohl být vycvičen s 8000 čipy a příkonem 15 MW energie za tři měsíce, nově to má představený systém zvládnout se čtvrtinovým počtem čipů a příkonem čtyř MW.
Enormní výkonností posun je umožněn schopností rozložit i velmi složité úkoly na řadu dílčích jednodušších kroků, které systém dokáže řešit současně, a tak významně zrychlit celkový proces zpracování.
Klíčové inovativní technologie pro školení umělé inteligence a vyvozování LLM v reálném čase pro modely škálovatelné až na 10 bilionů parametrů zahrnují:

Nejvýkonnější čip na světě – GPU Nvidia GB200 Grace Blackwell Superchip (jak zní oficiální název) obsahuje 208 miliard tranzistorů, páruje dvě CPU Nvidia Grace B200 Tensor Core přes ultra nízkopříkonové propojení NVLink typu chip-to-chip 10 TB/s do jediné sdružené GPU jednotky.

Transformer Engine druhé generace – díky nové podpoře škálování mikrotensorů a pokročilým algoritmům správy dynamického rozsahu nabízí Blackwell dvojnásobný výpočetní a modelový výkon. Dokáže zpracovávat poloviční počet bitů (z osmi na čtyři), čímž zdvojnásobuje výkon.
AI je tím lepší, čím více datových bodů může analyzovat, a s Blackwellem jich lze analyzovat biliony místo miliard jako dosud. Pro urychlení výkonu pro modely AI s mnoha biliony parametrů poskytuje nejnovější iterace NVLink (5. generace) obousměrnou propustnost 1,8 TB/s na GPU a zajišťuje bezproblémovou vysokorychlostní komunikaci mezi až 576 GPU.
V příštích letech bude zpracování dat stále více akcelerované pomocí GPU – vyhrazený dekompresní stroj urychluje databázové dotazy a poskytuje maximální výkon v oblasti analýzy dat. GPU Blackwell obsahují vyhrazený RAS engine a architektura navíc přidává na úrovni čipu možnosti preventivní údržby založené na AI ke spouštění diagnostiky a predikci problémů se spolehlivostí, což významně zlepšuje odolnost pro rozsáhlá nasazení umělé inteligence, aby běžela nepřetržitě bez přerušení několik týdnů či dokonce měsíců.

Znásobená síla
K dosažení nejvyššího výkonu umělé inteligence lze systémy GB200 propojit s platformami Nvidia Quantum-X800 InfiniBand a Spectrum-X800 Ethernet, které byly oznámeny spolu se zmíněnou novinkou a poskytují pokročilé sítě s rychlostí až 800 Gb/s.
Blackwell GB200 je klíčovou součástí víceuzlového, kapalinou chlazeného rackového systému Nvidia GB200 NVL72 pro nejnáročnější pracovní zátěže, který kombinuje 36 superčipů Grace Blackwell (zahrnují 72 GPU Blackwell) a 36 CPU Grace propojených NVLink. Obsahuje jednotky pro zpracování dat Nvidia BlueField-3 umožňující akceleraci cloudové sítě a výpočetní pružnost GPU v hyperškálovaných cloudech AI. Systém GB200 NVL72 nabízí až 30násobný nárůst výkonu ve srovnání se stejným počtem GPU Nvidia H100 Tensor Core a snižuje náklady a spotřebu energie až 25krát. Platforma funguje jako jediný GPU čip s výkonem 1,4 exaflops AI a 30 TB rychlé paměti.
Firma už nabízí i serverovou desku HGX B200, která propojuje osm GPU B200 prostřednictvím NVLink pro generativní platformy AI na bázi x86 a podporuje síťové rychlosti až 400 Gb/s prostřednictvím síťových platforem Nvidia Quantum-2 InfiniBand a Spectrum-X Ethernet. Podstatné je, že nové čipy jsou kompatibilní se svými předchůdci.

Josef Vališka
Foto: Nvidia

 
Publikováno: 19. 7. 2024 | Počet zobrazení: 1 | Počet přeposlání: 0 článek mě zaujal 0
Zaujal Vás tento článek?
Ano