Foto: Xportal / ilustracija
Na Computexu je izvršni direktor Nvidije Jensen Huang povezao cloud, osobna računala, automobile i humanoidne robote u jedan agentni računalni obrazac koji, kako tvrdi, Nvidia sada širi kroz različite vrste uređaja i sustava. Huang je rekao da se radi o „novom računalnom obrascu” te opisao arhitekturu koju naziva harness, a koja orkestrira zaključivanje, memoriju i korištenje alata, neovisno o tome radi li se o podatkovnom centru ili prijenosnom računalu.
Tu je tvrdnju povezao s proizvodima koje je Nvidia predstavila na sajmu, uključujući Vera CPU za podatkovne centre, koji je sada u punoj proizvodnji, te RTX Spark, prvi Windows PC uređaj te platforme, koji bi se trebao isporučivati u prijenosnim računalima ove jeseni. Huang je pritom rekao da namjerno ponavlja istu strukturu keynotea kako bi, prema njegovim riječima, pokazao da je budućnost računarstva upravo taj obrazac.
U njegovoj interpretaciji, taj obrazac počinje treniranjem i izvođenjem u cloudu, a zatim se širi na sve ostalo. Huang je rekao i da će „svaki edge uređaj postati autonoman” te da će „svaki edge uređaj imati agentne sustave”. Ideju je proširio na samovozeće automobile, humanoidne robote, Nokia bazne stanice i slikovne satelite, koje vidi kao isti agentni profil na različitom hardveru. Posebnu je pozornost posvetio autonomnoj vožnji, opisujući Nvidia Alpamayo driving stack kao sustav koji razmišlja u jeziku umjesto da samo reagira na slike.
Za taj dio priče Huang je rekao da bi sustav mogao čitati „skill file” i gledati video-upute za upravljanje nepoznatom opremom, na način sličan čovjeku. Dodao je da je to, po njegovu mišljenju, način na koji će autonomna vozila raditi u budućnosti, odnosno „agentni računalni obrazac s fizičkim AI modelom”. Na strani podatkovnih centara, Vera je 88-jezgreni Arm procesor koji je Nvidia, prema Huangovim riječima, razvila za agente, a ne za ljudske korisnike. Rekao je i da je to tržište do prije šest mjeseci bilo praktički nepostojeće.
Huang je naveo da hiperskalerski CPU-ovi gomilaju jezgre zato što ih ljudi unajmljuju stotinama, dok agent, kako je rekao, „ne želi unajmiti CPU jezgru, nego želi generirati tokene”. Zbog toga Nvidia, prema njegovim riječima, više naglašava brzinu jedne niti i propusnost memorije nego sam broj jezgri. Tvrdio je i da Vera donosi najveći skok u performansama jedne niti koji je vidio „u 25 godina”, uz objašnjenje da su ljudi strpljiviji od agenata i da agenti rade na nanosekundnoj, a ne sekunidnoj skali.
Nvidia navodi da Vera postiže 1,8 puta brže dovršavanje zadataka od x86 rješenja i 1,5 puta veći broj instrukcija po taktu u odnosu na prethodni Grace. Tvrtka također navodi da 256-jezgreni Vera rack s tekućinskim hlađenjem doseže šest puta veći protok od klasičnog CPU racka. Čip se isporučuje nakon gotovo 2,5 milijuna prodanih Grace jedinica, a kao rani kupci navedeni su Anthropic, OpenAI, xAI, ByteDance, CoreWeave i Oracle. Financijska direktorica Colette Kress rekla je na posljednjem pozivu ulagačima da tvrtka ove godine vidi „gotovo 20 milijardi dolara ukupnih CPU prihoda”.
Phoronix je u svibnju objavio prve javne Vera benchmarke i izmjerio otprilike 10 posto prednosti pred AMD-ovim 64-jezgrenim EPYC 9575F te oko 55 posto prednosti pred Intelovim 128-jezgrenim Xeon 6980P u odabranim Linux radnim opterećenjima. Nvidia je te testove pokrenula na predserijskom silikonu u vlastitom sjedištu, ograničila ih na radna opterećenja koja smatra relevantnima i, prema navodu Phoronixa, tijekom sesije isključila nadzor potrošnje i frekvencije procesora.
Za RTX Spark Huang kaže da je riječ o prvom stvarnom promišljanju osobnog računala nakon četiri desetljeća. Rekao je da postoji prilika da se računalo „iznova osmisli za doba umjetne inteligencije” te predvidio pomak od toga da PC bude alat prema tome da postane „vaš sustav”. Dodatno je rekao: „Vaše prijenosno računalo bit će vaš R2-D2.”
Najjača varijanta RTX Sparka, interno označena kao N1X, spaja 20-jezgreni Arm CPU koji izrađuje MediaTek s 10 Cortex-X925 performansnih i 10 Cortex-A725 učinkovitih jezgri, Blackwell GPU s 6.144 CUDA jezgre, do 128 GB LPDDR5X jedinstvene memorije i 600 GB/s NVLink-C2C vezom, sve na TSMC-ovu 3nm procesu. Huang je te specifikacije obrazložio istom logikom kao i Vera: agent koji upravlja uređajem neće čekati, pa softver s kojim radi, od Adobea do Blendera, „ne može biti spor”.