Scalarea este simplă. Ethernet o face mai inteligentă

Share

Există o convingere persistentă în industrie că scalarea sistemelor de inteligență artificială este dificilă. Aceasta înseamnă să te bazezi pe interconectări proprietare sau să creezi un standard de interconectare complet nou, să gestionezi topologii strict constrânse și să trăiești cu costuri mai mari, împreună cu un nou set de instrumente operaționale.

Adevărul este că scalarea este mai simplă decât scalarea orizontală. Și cu o bază adecvată, cum ar fi Scale-Up Ethernet (SUE) anunțat de Broadcom luna trecută, este mult mai flexibil. În ultimii ani, Ethernet s-a dovedit a fi cea mai bună tehnologie pentru rețelele de inteligență artificială scalabile – conectarea nodurilor XPU într-un centru de date și între centrele de date. Acum este momentul să aducem avantajele Ethernet la scalare: permiterea unei comunicări rapide, fiabile și deschise într-un nod sau rack, între zeci și sute de XPU strâns cuplate.

Când modelele de inteligență artificială rulează la scară largă, apar adesea blocaje de performanță în interiorul sistemului – unde XPU-urile trebuie să partajeze memorie, să coordoneze colective sau să direcționeze ieșirile pentru inferențe Mixture-of-Experts.

În implementările de inteligență artificială la scară largă, în special în arhitecturile de scalare, mai multe elemente de calcul (XPU-uri și CPU-uri) funcționează îndeaproape împreună, adesea într-un singur server sau sistem strâns integrat. Pe măsură ce modelele devin extrem de mari – potențial trilioane de parametri – cerințele de calcul și memorie depășesc ceea ce poate gestiona eficient orice unitate de procesare unică. Acest lucru necesită o comunicare intra-sistem extrem de eficientă, permițând XPU-urilor să partajeze rapid date, să sincronizeze calculele și să execute colectiv operațiuni precum all-reduce, broadcast și gather, care sunt comune în antrenamentul și inferența modelelor distribuite.

Aceste domenii de scalare necesită:

Lățime de bandă mare: XPU-urile moderne pot avea 40 – 100 TB/s de lățime de bandă HBM. Legăturile de scalare trebuie să corespundă acestei cerințe.
Latență redusă: Latența dus-întors sub 2µs este esențială pentru accesul la memorie la distanță și sincronizarea rapidă.
Fiabilitate: Pe măsură ce XPU-urile accesează memoria reciprocă, fiecare transfer trebuie să se finalizeze în mod fiabil – fără a introduce congestie, contrapresiune sau reîncercări vizibile pentru aplicație.
Eficiență: Atunci când se mută sarcini utile mici – adesea 64 de octeți simultan – suprasarcina de rețea trebuie să fie minimă.

Aceste cerințe împing tehnologiile de interconectare la limitele lor – și aici se remarcă Ethernet-ul. Pentru a aduce Ethernet-ul în domeniile scale-up, Broadcom a dezvoltat cadrul Scale-Up Ethernet (SUE) – o specificație curată, bazată pe standarde, pentru interconectarea XPU de înaltă performanță.
Am contribuit cu specificația SUE completă la Open Compute Project, punând-o la dispoziția altora pentru a o dezvolta.

La nivel general, SUE definește:

Semantica interfeței: Un model consistent pentru traficul de comandă, date și gestionare între XPU-uri și switch.
Modelul de memorie: O interfață simplă, coerentă cu memoria cache, care acceptă operațiuni put, get și atomice prin Ethernet, concepută pentru a emula accesul la memorie strâns cuplat.
Format pachet: Anteturi ușoare, optimizate pentru latență, care minimizează costurile per transfer – cruciale pentru unitățile de date mici.
Gestionarea congestiei: Suport pentru reîncercare la nivel de legătură (LLR), controlul fluxului bazat pe credit (CBFC) și controlul fluxului prioritar (PFC) pentru a asigura funcționarea fără pierderi și latența deterministă.
Interfețe fungibile: Același port XPU poate fi utilizat atât pentru scaling-up, cât și pentru scaling-out, permițând partiționarea dinamică a resurselor și un design hardware simplificat.

SUE permite, de asemenea, flexibilitate în lățimea de bandă – cu 800G per instanță SUE și suportând mai multe planuri de rețea pentru echilibrarea încărcării, izolarea erorilor și creșterea debitului agregat – și suportă sisteme de scaling-up de până la 1.024 XPU într-un singur domeniu.

Infrastructura AI nu ar trebui să necesite două rețele separate – una pentru comunicarea intra-nod și una pentru comunicarea inter-nod. Cu SUE, puteți unifica scalarea verticală și orizontală pe o singură structură Ethernet, utilizând aceleași interconexiuni optice și de cupru, aceleași instrumente de vizibilitate și aceeași telemetrie la nivel de platformă.

Aceasta se traduce prin:

● Complexitate mai mică a sistemului
● Agilitate mai mare în proiectarea sistemului
● Cost total de proprietate redus
● Inovație neutră față de furnizor

Spre deosebire de modelele de interconectare proprietare sau semi-personalizate, SUE rulează pe Ethernet – deschis prin design, nu doar prin licență. Nu sunt necesare chipleturi speciale, PHY-uri sau structuri de comutare. SUE permite proiectarea sistemelor multi-vendor fără a dicta aspectul plăcii, arhitectura rack-ului sau anvelopa termică. Funcționează cu ecosistemul Ethernet global, fără a fi nevoie de integrare specializată sau certificare a furnizorilor.

Infrastructura AI evoluează rapid – iar nevoile de rețea dintr-un nod XPU sunt acum la fel de critice ca cele dintre noduri. Cu Scale-Up Ethernet, am făcut scalarea verticală simplă, eficientă și deschisă. Să vedem cum va construi industria pe această fundație.

SolvIT Networks este partener strategic pentru Europa Centrală și de Est al Broadcom.