asseco Aimtec murr

Čip inspirovaný mozkem

Kalifornská laboratoř IBM Research vyvíjí prototyp čipu s názvem NorthPole, jehož design je založen na architektuře, která napodobuje lidský mozek – nejdokonalejší přírodní počítač – a je příslibem výrazného zlepšení efektivity počítačů.

 

Rané sálové počítače byly složitou směsí technologií a byly koncipovány tak, že jejich různé funkce, jako řízení, logika a paměť byly rozděleny do samostatných jednotek, mezi nimiž systém v rámci výpočetního procesu přesouval data. Tato historická architektura, pojmenovaná po průkopníkovi výpočetní techniky Johnu von Neumannovi, ovšem vytvořila rovněž problém známý jako von Neumannovo úzké místo, kdy datové transakce mezi jednotlivými prvky systému působí v době o několik řádů vyspělejšího a rychlejšího hardwaru jako brzda.  
Od zrodu polovodičového průmyslu se však počítačové čipy primárně řídí stejnou základní strukturou, kde jsou procesorové jednotky i paměť uchovávající informace, které mají být zpracovány, uloženy diskrétně. I když tato struktura umožnila jednodušší návrhy, které bylo možné dobře škálovat, von Neumannovo úzké hrdlo je problém u řešení, kde je potřeba čas a energie k neustálému míchání dat tam i zpět mezi pamětí, zpracováním a jakýmikoli jinými zařízeními.
To se naplno projevilo v rámci současné exploze umělé inteligence (AI), která během posledních let přešla do nasazení v masovém podnikovém měřítku, ale hardware používaný k jejímu spuštění, i když je stále výkonnější, nebyl navržen s ohledem na dnešní AI. Jak se systémy AI rozšiřují, náklady raketově rostou a tzv. Moorův zákon, teorie, že hustota obvodů v procesorech se každý rok zdvojnásobí, se zpomalil.

Stvořen pro AI
Nicméně nový výzkum kalifornské laboratoře IBM Research, která pracuje na vývoji procesoru založeného na nové koncepci, má potenciál výrazně změnit způsob, jak efektivně škálovat výkonné hardwarové systémy AI v rámci čipu a to, jak a kde se AI efektivně používá. Vývoj prototypu čipu NorthPole trval téměř dvě desetiletí a podařilo se mu obejít von Neumannovo úzké místo pomocí několika chytrých inovací. Jednou z nich bylo založit architekturu na lidském mozku, který je mnohem energeticky účinnější než jakýkoli počítač, a vytvořit to, co IBM nazývá „slabé znázornění mozku v zrcadle křemíkového plátku“.
Dharmendra Modha z IBM Research a jeho kolegové se inspirovali tím, jak počítá mozek a vytvořili zcela odlišnou cestu od von Neumannovy architektury. Během posledních osmi let tým pracoval na novém typu digitálního AI čipu pro neurální inferenci, který dostal označení NorthPole – jde o rozšíření TrueNorth, posledního čipu inspirovaného mozkem, na němž Dramendra Modha pracoval před rokem 2014. V testech na populárních modelech rozpoznávání obrazu ResNet-50 a detekce objektů YOLOv4 prokázal nový prototyp zařízení vyšší energetickou účinnost, vyšší prostorovou efektivitu a nižší latenci než kterýkoli jiný čip aktuálně na trhu, a je zhruba 4000krát rychlejší než TrueNorth.
První slibná sada výsledků, zveřejněná v magazínu Science, naznačuje, že NorthPole může být průlomem v architektuře čipů, který přináší masivní zlepšení energetické, prostorové i časové účinnosti. Při použití modelu ResNet-50 jako benchmarku je NorthPole podstatně efektivnější než běžné 12nm GPU a 14nm CPU. Čip samotný je postaven na 12nm technologii a v obou případech je až 25krát energeticky účinnější, pokud jde o počet snímků interpretovaných na joul potřebného výkonu. NorthPole také předčil výkon v latenci a v prostoru potřebném k výpočtu, pokud jde o počet snímků interpretovaných za sekundu na miliardu požadovaných tranzistorů. Podle Dharmendry Modhy novinka předčí na zmíněném benchmarkovém modelu všechny hlavní převládající architektury – dokonce i ty, které využívají pokročilejší technologické procesy, jako je GPU implementovaný pomocí 4nm procesu.
Tajemství, jak dokáže NorthPole počítat s takovou účinností výrazně převyšující stávající čipy, tkví možná v tom, že veškerá paměť pro zařízení je na samotném čipu, nikoli připojena samostatně. Bez tohoto von Neumannova úzkého místa může čip provádět inferencování AI podstatně rychleji než jiné čipy, které jsou již na trhu. NorthPole obsahuje na ploše 800 mm2 na 22 mld. tranzistorů, má 256 jader a dokáže provést 2048 operací na jádro za cyklus s 8bitovou přesností, s potenciálem zdvojnásobit a zčtyřnásobit počet operací s 4bitovou a 2bitovou přesností. A jak upřesňuje Dharmendra Modha: „Je to celá síť na čipu.“

Potenciální využití je široké
Zatímco výzkum čipu NorthPole stále pokračuje, jeho struktura se hodí pro nově vznikající případy použití AI, stejně jako pro ty zavedené. Při dosavadním testování se tým NorthPole zaměřil hlavně na využití související s počítačovým viděním – některé z primárních aplikací byly detekce, segmentace obrazu a klasifikace videa – ale systém byl testován i v jiných oblastech, jako je zpracování přirozeného jazyka a rozpoznávání řeči. Vědci v současné době zkoumají mapování velkých jazykových modelů pro dekodéry do škálovatelných systémů NorthPole. Potencionálně se pro novinku nabízí rozsáhlá škála aplikací pro nejrůznější případy použití, od autonomních vozidel po robotiku, digitální asistenty nebo prostorové výpočty.
Pro NorthPole by se mohlo dobře hodit i mnoho druhů okrajových aplikací, které vyžadují zpracování obrovského množství dat v reálném čase. Včetně takových, které dokážou přemýšlet nestandardně a reagovat na vzácné okrajové situace, které jsou problematické pro rychlé řešení v rámci rutinních operací.

Josef Vališka
Foto: IBM

 
Publikováno: 22. 3. 2024 | Počet zobrazení: 47 článek mě zaujal 7
Zaujal Vás tento článek?
Ano