+86-755-82561458
Namuose / žinios / Turinys

Jun 19, 2024

Didėjantis IC pramonės vaidmuo tvarumo srityje

Didžiuliai AI sistemų energijos poreikiai atkreipia dėmesį į puslaidininkių ekosistemos tvarumą. Lustų pramonė turi sugebėti gaminti efektyvesnius ir mažesnės galios puslaidininkius. Tačiau didesnio apdorojimo greičio poreikiai auga plačiai naudojant didelių kalbų modelius ir apskritai didėjant duomenų, kuriuos reikia apdoroti, kiekiui. „Gartner“ apskaičiavo, kad iki 2026 m. 50 % organizacijų imsis tvarumo palaikančio stebėjimo, kad galėtų valdyti savo hibridinių debesų aplinkos energijos suvartojimo ir anglies pėdsako metriką. Anot įmonės, tai būtina, atsižvelgiant į tai, kad iki 2027 m. 40% duomenų centrų gali būti apriboti.

 

Tinkamai suprojektuoti puslaidininkiai gali padėti užtikrinti tvarumą. Tai pasakytina net apie AI / ML lustus, sukurtus maksimaliam našumui, jei jie gali greičiau atlikti skaičiavimus naudojant retesnius algoritmus. Dėl to bendras suvartojamos energijos kiekis sumažėja. Čia pradeda veikti pasirinktiniai greitintuvai. Jie gali žymiai patobulinti, palyginti su bendrosios paskirties procesoriais, dažnai veikiančiais kartu.

 

Augantis AI pėdsakas


Skaičiavimas vyksta visur, ir visa tai turi būti efektyvesnė. Išmanieji miestai, išmani infrastruktūra ir išmanusis transportas neįmanomi be išmaniųjų technologijų, kurias vis dažniau įgalina dirbtinis intelektas. Kai dirbtinis intelektas vis labiau įsitvirtina, puslaidininkių ekosistema stengiasi sumažinti savo poveikį ištekliams.

 

Šiandieniniai duomenų centrai jau sunaudoja labai daug energijos. Pasaulyje kasmet reikia 460 teravatvalandžių (TWh) elektros energijos. Tai prilygsta visam Vokietijos pagamintos energijos kiekiui. „Boston Consulting Group“ duomenimis, JAV duomenų centrų elektros suvartojimas sudarė 2,5% viso JAV (~130 TWh) 2022 m., o iki 2030 m. šis skaičius išaugs tris kartus iki 7,5% (~390 TWh). Tai prilygsta maždaug 40 milijonų JAV namų sunaudojamai elektros energijai arba beveik trečdaliui visų JAV namų.

„AI gali pranokti visas transformacines naujoves, sukurtas per praėjusį šimtmetį“, – sakė „Arm's Infrastructure Group“ techninės įrangos ekosistemų direktorius Imranas Yusufas. "Tačiau dirbtinio intelekto skaičiavimo galios poreikiai yra dideli, o įmonėms skubant plėtoti savo AI galimybes, jos rizikuoja viršyti savo tvarumo tikslus. Ateities AI modeliai ir toliau taps didesni ir išmanesni, todėl reikės daugiau skaičiavimo, o tai didina. Energijos poreikis kaip naudingo ciklo dalis AI skaičiavimo sistemos“.

 

Kiti sutinka. „Tai susiję su efektyvesniu dizainu“, – sakė Neilas Handas, „Siemens EDA“ rinkodaros direktorius. "Galite pažvelgti į bet kurį algoritmą. Yra efektyvumo eilės. Neefektyviausias būdas energijos požiūriu yra paleisti neapdorotą kodą bendrosios paskirties procesoriuje ir leisti jam suktis ir paskrudinti keletą zefyrų virš procesoriaus, nes jis veikia. kad būtų labai šilta“.

Serverių, pagrįstų NVIDIA Grace Blackwell GPU, stovui reikia 120 kilovatų. Tačiau, pasak Ansys direktoriaus Richo Goldmano, jie taip pat yra 1,{2}} karto pajėgesni nei ankstesnės kartos, o tai prilygsta 500 kartų daugiau skaičiavimo vienam galios vienetui. „Jei statote procesorių duomenų centrą ir norite daug skaičiuoti, galite pakeisti procesorius naujausiais GPU ir sumažinti tų pačių skaičiavimo galimybių galią. Vis tiek turėsime didelių energijos problemų, nes su AI mes dirbame daugiau, bet tai padės.

 

Handas mano, kad specializuota Grace Blackwell tipo specialiai sukurta AI aparatinė įranga yra kitas kūrimo žingsnis, tačiau jis priduria, kad galima nuveikti daug daugiau, nes tai vis dar yra bendrosios paskirties lustai. Jis sakė, kad galima sukurti efektyvesnius AI lustus, skirtus klasifikuoti ir dirbti su plačia klasifikacija.

 

„Mes matome, kad tai daro NVIDIA, tai daro Google ir daugelis debesų paslaugų teikėjų“, - pažymėjo Hand. "Galime atlikti tam tikrus efektyvumo lygius, kad šie lustai būtų gaminami veiksmingiau ir kad viskas, kas su tuo susiję su tvarumu. Tada galite žengti dar vieną žingsnį į priekį naudodamiesi naujomis technologijomis, kuriose naudojamas visiškai parengtas dirbtinio intelekto modelis. ir konvertuoti jį į aparatinę įrangą, kuri bus efektyviausia, ir sunaudos dalį galios. ir taip greitai keičiasi. Mes matome tai, kai „Intel“ ir „Qualcomm“ tai daro jau keletą kartų bet kokį neuroninį tinklą, kurį norite turėti luste, ir toks tęstinumas tiesiog bus.

 

Steve'as Roddy, „Quadric“ rinkodaros vadovas, sutiko. „Jėgos, skatinančios AI/ML modelių sprogimą, yra didžiulės apimties. Generacinė AI banga keičia asmenų ir korporacijų darbo būdą; galbūt tai paveiks milijonus darbo vietų visame pasaulyje. Puslaidininkių/EDA/IP ekosistema negali pagrįstai išlenkti pažanga kuriant didžiulius dirbtinio intelekto modelius, kuriuos kasmet skatina šimtai milijardų dolerių investicijų iš technologijų titanų, tačiau puslaidininkių ir IP pramonė gali padėti radikaliai sumažinti energijos suvartojimą naudojant tuos GenAI modelius per dieną. - kasdienis išvadų naudojimas“.

 

Didžiausias GenAI išvados tvarumo iššūkis yra režimų konvertavimas į mažesnio energijos suvartojimo sveikųjų skaičių formatus. „Duomenų mokslo komandos, kuriančios GenAI modelius, atrodo, pamiršta faktą, kad etaloniniai modeliai, kuriuos jie skelbia slankiojo kablelio formatu, sunaudoja 10 kartų daugiau energijos vienai išvadai, palyginti su tuo pačiu modeliu, konvertuotu į sveikųjų skaičių formatus (palyginus 32b slankiojo kablelio dauginimo ir kaupimo metodą su 8 x 8 arba 4 x 8 sveikųjų skaičių MAC)“, – sakė Roddy. "Nesvarbu, ar daroma išvada duomenų centre, ar įrenginyje, energijos taupymas ir iš to gaunama nauda tvarumui nuo konvertavimo į mažesnės galios sveikųjų skaičių formatus yra didelė. Ši spraga egzistuoja šiandien, nes duomenų mokslininkai, kuriantys naujus GenAI modelius, yra matematikai, o ne įterptieji. inžinieriai“.

 

Technologijų pažanga


Kai projektavimo komanda nuspręs, kad laikas pereiti prie aparatinės įrangos, nors AI algoritmai taip greitai tobulėja, bus tam tikras stabilumas, sakė Hand. "Tai šiek tiek panašu į tai, kai pradėjome plėtoti TPU, NPU, XPU. Paprastai jie kurį laiką nebuvo labai gyvybingi, nes pagrindiniai kūrimo blokai keitėsi reguliariau. Tačiau per pastaruosius kelerius metus šios pagrindinės funkcijos stabilizavosi, kad dabar būtų galima sukurti efektyvesnę aparatinę įrangą, nes viskas pradės stabilizuotis. Visada atsiras daug galingesnių algoritmų, kuriems reikės naujos aparatinės įrangos. Tikriausiai visada sunaudosime daugiau, nei sakome, nes duomenų centrai yra didžiuliai energijos vartotojai, bet tai yra visas klausimas, žiūrint iš produktyvumo perspektyvos. Ar jie leidžia mums daryti tai, ko kitaip negalėtume? Tačiau daug kas priklauso nuo to, ar tai sudėtingas dirbtinio intelekto lustas. EDA aspektai yra maždaug tokie patys.

 

Kitas svarstymas – kaip generuoti pakankamai energijos duomenų centrui. Kaip įdėti šiuos duomenų centrus ten, kur nepakanka energijos? „Duomenų centrus dažniau matysite tose vietose, kuriose yra energijos perteklius, o šalys, kuriose yra energijos perteklius, taps duomenų centrų centrais“, – sakė Goldmanas. "Jie ten suras duomenų centrą, tada išves žinias, kurias gaunate iš tos galios."

 

Tai lydės nauji ir nauji galios šaltiniai. „Girdėjome kalbas apie mini atomines elektrines, skirtas maitinti atskirus duomenų centrus, ir tokias programas, kaip jų pastatymas ant naftos gręžinių, kad metanas, kuris dabar patenka į orą ir teršia orą, galime jį sudeginti ir sukurti energiją iš tiems, kurie valdys duomenų centrus“, – sakė Goldmanas. „Turime sukurti tokį romaną, kad galėtume maitinti šiuos duomenų centrus.

 

Neatsiejama DI tvarumo diskusijos dalis yra duomenų centro efektyvumas, kai vyksta nuolatinis konfliktas tarp galios, reikalingos duomenims perkelti, ir to, kiek tie duomenys iš tikrųjų turi judėti. „Matome, kad žmonės iš mikroschemų kuria labai didelius procesorius, ir iš dalies dėl to, kad jie žino, kad galėtų sukurti lygiavertę sistemą iš dviejų lustų, sujungtų per magistralę, tačiau duomenų perkėlimas tarp jų kainuos daug. galios“, – paaiškino Stevenas Woo, „Rambus“ kolega ir žymus išradėjas. "Kuo daugiau dalykų sujungiate, tuo mažesnį atstumą turi nukeliauti duomenys, tuo mažiau energijos išleidžiate duomenims perkelti. Tačiau tada problema yra ta, kad energijos tankis didėja. Turite tiekti daugiau energijos, ir jūs turite Taigi, kaip atvėsinti šį daiktą, sutaupau energijos, nes lustai nėra nutolę vienas nuo kito, bet dabar jis turi tiekti daugiau energijos į tą garsą. Turiu tai atvėsinti, tai yra virvės traukimas, su kuriuo dabar susiduria sistemos lygio architektai.

 

Duomenų centrų lygmeniu vis dažniau naudojami pažangūs aušinimo būdai serveriuose. „Daugiau žmonių kalba apie aušinimą skysčiu, įskaitant šaltąsias plokštes“, – sakė Woo. "Tai darė "Google", o NVIDIA apie tai kalbėjo Grace Blackwell. Tai technologija, kurią šiandien naudoja kai kurie superkompiuteriai, ir tai nėra svetima ar nauja technologija. Tik laiko klausimas, kada ją pamatysime kaip Tikriausiai artimiausioje ateityje bus keletas sistemų, kurios bus aušinamos oru, tačiau pamatysite daugiau sistemų, kuriose bus naudojamas siurbiamas skystis su dviejų fazių aušinimo sistema.

 

Kraštutinėje šio metodo pabaigoje yra panardinamasis aušinimas. „Gali būti, kad artimiausiu metu tai nebus perspektyvus duomenų centro serverio aušinimo sprendimas, bet taip gali būti, jei skysčiams pritrūks kilimo ir tūpimo tako“, – pridūrė jis. „Kai sugebėsite valdyti šilumą skysčiu ar panašiai, galėsite apriboti temperatūros diapazoną, kurį pereina lustas, o tai reiškia, kad jei ji atlieka terminį ciklą, ji gali nepasiekti ekstremalios temperatūros. Tai gerai. , nes tada jūs neturite šiluminio plėtimosi ir susitraukimo per šį didesnį diapazoną, o kai kurie kiti su patikimumu susiję gedimai šiek tiek palengvėja.

 

Didelių duomenų analizė taip pat vaidina svarbų vaidmenį užtikrinant tvarumą, nustatydama lustų dizaino tendencijas, pagrįstas duomenų centro naudojimu. „Yra visas jėgos traukinys“, – sakė žinomas „Synopsys“ architektas Adamas Kronas. "Susirūpinimą kelia tik štampo lygis. Tada jūs turite plokštę, kurioje ji yra, stelažą, ūkį, o tada grįžta iki perdavimo linijų. Ir tai, ką duomenų centrų vadovai mėgsta matyti, yra gražus, lygus kilis, per daug nesiūbinkite valties, nes jei norite daug čia, gali tekti ten nusileisti arba atvirkščiai.

 

Idealiu atveju galia būtų sumažinta visur. „Duomenų centrai sunaudoja nuo 1 iki 2 % pasaulio elektros energijos, ir jie skuba visa tai panaudoti“, – sakė Cronas.

 

Išeiga, gamybos nuorodos


„Siemens' Hand“ pažymėjo, kad yra įdomus ryšys tarp pastangų sukurti tvarius puslaidininkius ir išeigą bei pagaminamumą. "Šios skiedros tampa vis didesnės. Todėl derlius tampa vis didesne problema. Kuo daugiau galime nuveikti su derliumi, tuo geriau galime siekti tvarumo, nes negyvas kauliukas yra išteklių švaistymas. Geras kauliukas visada yra geresnis dalykas. Ką mes galime nuveikti EDA puslaidininkių ekosistemoje, kad padidintume našumą, kai kurie iš jų naudoja dirbtinį intelektą, kad gautų didesnį derlių AI tvarumo kaina ir tvarumo galimybė, kaip jie veikia kartu sako, kiek kainuoja mokyti šiuos modelius. Bet kaip tada išmatuoti įžvalgas, kad būtų galima pabandyti patobulinti automatizavimą. čia galima panaudoti dirbtinio intelekto technologijas. Tai tiesiog EDA atlieka savo EDA reikalą.

 

Šiluminė analizė ir senėjimas taip pat turės įtakos AI duomenų centro tvarumui. Žinoma, tai nėra būdinga AI. Tai taikoma visoms lustams“, – sakė Hand. „Galite pradėti suprasti, kas yra termostatai štampų lygyje, antrinio štampo lygyje, kad suprastumėte pasekmes. Ar galiu sudėti 3D steką ir užtikrinti, kad ji būtų patikima? Ar galiu paleisti šiuos dalykus pakankamai galingu lygiu, kad nepagretinčiau jų nykimo? Šios galimybės leis mums eiti dar toliau. Be to, kai pradedame plėsti skaitmeninio dvynio apibrėžimą ir pradėti plėsti, kas į jį įtraukta, galite pradėti matyti sistemos lygio poveikį. Ir nors tai nėra būdinga dirbtiniam intelektui ir tvarumui, būtent čia pamatysime didelius efektyvumo šuolius, nes kiek šiuo metu yra per daug suprojektuota? Kiek jame yra per daug atliekų? Kai tik galime pradėti kurti nuoseklesnį gaminio ir problemos lygio dizainą, tai taip pat turės naudos. Grąžinant jį konkrečiai į DI, norint pasiekti tikrus kelių domenų išsamius skaitmeninius dvynius, AI reikės, nes AI atliks kryžminę domenų analizę už jus ir surogatinio modelio išgavimą bei automatinį tikslumo pritaikymą. Bus visų tų. Kuo daugiau dirbtinio intelekto mums reikia, tuo daugiau AI mes naudojame."

 

Išvada


Tvarumas nėra nauja tema, tačiau ji visada buvo būsimų diskusijų tema. Taip nebėra.

„Aparatinės ir programinės įrangos pardavėjai jau daugelį metų suprato, kad skaičiavimo mastelio keitimas ir tvarumas gali susidurti su realybe, tačiau tai nebūtinai turi būti, jei pramonė išnaudoja savo ekosistemos galimybes“, – sakė Arm's Yusuf. „Paimkite, pavyzdžiui, Arm Total Design, kuri yra pirmaujančių kompanijų iš visos puslaidininkių pramonės ekosistema, skirta veiksmingiems, pritaikytiems silicio sprendimams dirbtinio intelekto / ML naudojimo atvejais. Tai suteikia partneriams pirmenybę prieiga prie Arm Neoverse Compute posistemių. (CSS), iš anksto integruoti IP ir EDA įrankiai, projektavimo paslaugos, liejyklų palaikymas ir komercinės programinės įrangos palaikymas. Tai taip pat yra naujas požiūris, skatinantis bendradarbiavimą, lankstumą ir naujoves, kartu suprantant, kad dirbtinio intelekto amžius turi egzistuoti kartu. su pasauliniais tvarumo tikslais“.

 

Pasikeitė tai, kad tvarumas perėjo iš „malonu turėti“ į „būtina turėti“. Žvelgiant iš savo, kaip pramonės lyderės, perspektyvos, „Intel“ sukūrė septynis patarimus, kaip naudoti dirbtinį intelektą be didelių aplinkosaugos išlaidų. Be to, „Intel“ mano, kad norint pasiekti tvarumo tikslus labai svarbu apgalvoti, kaip dirbtinis intelektas yra įgyvendinamas kuriant dizainą. Sąmoningai tie, kurie vykdo DI iniciatyvas, gali pasinaudoti optimizuoto darbo krūvio privalumais (daugiau žr. čia), o iniciatyvus požiūris į projektų kūrimą ir IT valdymą yra labai svarbus siekiant maksimaliai padidinti AI iniciatyvų poveikį ir sumažinti anglies pėdsaką (daugiau žr. čia naudojimo atvejai).

 

Iš esmės AI poveikio tvarumui mažinimas priklausys nuo pačios technologijos. „Quadric's Roddy“ teigė, kad puslaidininkių ekosistema gali padėti „didinant bendrą supratimą apie būtinybę naudoti mažesnio tikslumo duomenų formatus, taip pat kuriant labiau automatizuotus įrankius, kad būtų panaikintas atotrūkis tarp matematiko ir įterptųjų inžinierių“.

Tau taip pat gali patikti

Siųsti žinutę