„ZeroPoint“ nanosekundžių masto atminties suspaudimas galėtų sutramdyti energijos ištroškusią AI infrastruktūrą


AI yra tik naujausia ir ištroškusi didelio našumo skaičiavimo rinka, o sistemų architektai dirba visą parą, kad iš kiekvieno vato iškraipytų kiekvieną našumo lašą. Švedijos startuolis „ZeroPoint“, apsiginklavęs 5 milijonų eurų (5,5 mln. USD) nauju finansavimu, nori padėti jiems panaudoti naują atminties suspaudimo techniką nanosekundžių mastu – ir taip, tai tiksliai taip sudėtinga, kaip atrodo.

Koncepcija yra tokia: be nuostolių suspauskite duomenis prieš pat juos patenkant į RAM, o po to išskleiskite, efektyviai praplėsdami atminties kanalą 50% ar daugiau, tiesiog pridėdami vieną nedidelį lustą.

Žinoma, suspaudimas yra pagrindinė skaičiavimo technologija; Kaip pažymėjo „ZeroPoint“ generalinis direktorius Klasas Moreau (kairėje esančiame paveikslėlyje, kartu su įkūrėjais Peru Stenströmu ir Angelosu Arelakiu), „Šiandien nesaugotume duomenų standžiajame diske jų nesuglaudinę. Tyrimai rodo, kad 70% atmintyje esančių duomenų yra nereikalingi. Tai kodėl nesuglaudinus atmintyje?“

Atsakymas yra tas, kad mes neturime laikas. Didelio failo suspaudimas saugojimui (arba jo kodavimas, kaip sakome, kai tai yra vaizdo ar garso įrašas) yra užduotis, kuri gali užtrukti sekundes, minutes ar valandas, atsižvelgiant į jūsų poreikius. Tačiau duomenys praeina per atmintį per nedidelę sekundės dalį, perkeliami ir išeina taip greitai, kaip gali CPU. Vienos mikrosekundės delsa pašalinti „nereikalingus“ bitus iš duomenų paketo, patenkančio į atminties sistemą, būtų katastrofiškas našumui.

Atmintis nebūtinai vystosi tokiu pat greičiu kaip ir procesoriaus greitis, nors jie abu (kartu su daugybe kitų lusto komponentų) yra neatsiejamai susiję. Jei procesorius per lėtas, duomenų atsarginės kopijos sukuriamos atmintyje, o jei atmintis per lėta, procesorius eikvoja ciklus laukdamas kitos bitų krūvos. Viskas veikia kartu, kaip ir galima tikėtis.

Nors buvo įrodytas ypač greitas atminties suspaudimas, dėl to kyla antra problema: iš esmės turite išskleisti duomenis taip pat greitai, kaip juos suglaudinote, grąžindami juos į pradinę būseną, kitaip sistema nesupras, kaip tai padaryti. tai tvarkyti. Taigi, jei nekonvertuosite visos architektūros į šį naują suspaustos atminties režimą, tai beprasmiška.

„ZeroPoint“ teigia, kad abi šias problemas išsprendė itin sparčiu, žemo lygio atminties glaudinimu, kuriam nereikia jokių realių pakeitimų likusioje skaičiavimo sistemoje. Pridedate jų technologiją į savo lustą ir tarsi dvigubai padidinote savo atmintį.

Nors smulkios smulkmenos greičiausiai bus suprantamos tik šios srities žmonėms, pagrindus yra pakankamai lengva suvokti neišmanantiems, kaip įrodė Moreau, kai tai man paaiškino.

„Mes paimame labai nedidelį duomenų kiekį – talpyklos eilutę, kartais 512 bitų – ir nustatome joje esančius šablonus“, – sakė jis. „Tai yra duomenų prigimtis, tai yra, kad jie yra užpildyti ne tokia efektyvia informacija, informacija, kuri yra retai. Tai priklauso nuo duomenų: kuo jis atsitiktinis, tuo mažiau suspaudžiamas. Bet kai žiūrime į daugumą duomenų įkėlimų, matome, kad esame 2–4 kartų diapazone [more data throughput than before].

Iš tikrųjų atmintis atrodo ne taip. Bet supranti mintį.
Vaizdo kreditai: Nulinis taškas

Ne paslaptis, kad atmintį galima suspausti. Moreau sakė, kad visi didelio masto skaičiavimo specialistai žino apie tokią galimybę (jis man parodė 2012 m. dokumentą, kuriame tai demonstruoja), bet daugiau ar mažiau nurašė ją kaip akademinę, kurios neįmanoma įgyvendinti dideliu mastu. Tačiau „ZeroPoint“, anot jo, išsprendė suglaudinimo – suglaudintų duomenų pertvarkymo, kad jie būtų dar efektyvesni – ir skaidrumo problemas, todėl technologija ne tik veikia, bet ir veikia gana sklandžiai esamose sistemose. Ir visa tai vyksta per kelias nanosekundes.

„Dauguma glaudinimo technologijų, tiek programinės, tiek aparatinės įrangos, yra tūkstančiai nanosekundžių. CXL [compute express link, a high-speed interconnect standard] gali sumažinti tai iki šimtų“, – sakė Moreau. „Galime sumažinti iki 3 ar 4“.

Štai CTO Angelos Arelakis tai paaiškina savo būdu:

„ZeroPoint“ debiutas neabejotinai įvyko laiku, nes įmonės visame pasaulyje ieško greitesnių ir pigesnių skaičiavimų, su kuriais galėtų apmokyti dar vienos kartos dirbtinio intelekto modelius. Dauguma hiperskalerių (jei reikia juos taip vadinti) mėgsta bet kokią technologiją, kuri gali suteikti jiems daugiau galios vienam vatui arba leisti jiems šiek tiek sumažinti elektros energijos sąskaitą.

Pagrindinis viso to įspėjimas yra tas, kad, kaip minėta, tai turi būti įtraukta į lustą ir integruota nuo pat pradžių – jūs negalite tiesiog įdėti ZeroPoint rakto į stovą. Tuo tikslu bendrovė bendradarbiauja su lustų gamintojais ir sistemų integratoriais, siekdama licencijuoti techniką ir techninės įrangos dizainą standartiniams didelio našumo skaičiavimo lustams.

Žinoma, tai yra jūsų „Nvidias“ ir „Intel“, bet vis dažniau ir tokios įmonės kaip „Meta“, „Google“ ir „Apple“, kurios sukūrė pritaikytą aparatinę įrangą, kad galėtų vykdyti savo AI ir kitas brangiai kainuojančias užduotis. „ZeroPoint“ savo technologiją vertina kaip taupymo priemonę, o ne priemoką: tikėtina, kad efektyviai padvigubinus atmintį, technologija greitai atsiperka.

Ką tik pasibaigusiam 5 milijonų eurų vertės raundui vadovavo „Matterwave Ventures“, o „Industrifonden“ veikė kaip vietinis Šiaurės šalių lyderis, o esami investuotojai „Climentum Capital“ ir „Chalmers Ventures“ taip pat dalyvavo.

Moreau teigė, kad pinigai turėtų leisti jiems plėstis į JAV rinkas, taip pat padvigubinti Švedijos rinkas, kurių jie jau siekia.



Source link

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Miesto naujienos - Šeimos gydytojai - Saulius Narbutas - Įvaizdžio kūrimas - VeidoskaitaTeniso treniruotės - Pranešimai spaudai