Foto: NVIDIA Blog
NVIDIA je priopćio da su prvi Vera CPU sustavi stigli u ruke korisnika, nakon što je tvrtka svoj samostalni CPU za agentnu umjetnu inteligenciju predstavila u ožujku na GTC-u u San Joseu. Prema objavi, riječ je o prvom NVIDIA-inom CPU-u izrađenom za agentne AI sustave, a isporuke su krenule od laboratorija i cloud okruženja koja razvijaju i pokreću takve modele.
Prve isporuke otišle su u tri vodeća AI laboratorija: Anthropic u San Franciscu, OpenAI u Mission Bayu i SpaceXAI u Palo Altu, a u ponedjeljak je uslijedila i dostava Oracle Cloud Infrastructureu u Santa Clari. Kako navodi NVIDIA, potpredsjednik za hyperscale i visokoučinkovito računalstvo Ian Buck osobno je predao prve primjerke partnerima. Buck je pritom rekao da agentna umjetna inteligencija stvara novu CPU fazu u AI infrastrukturi jer se modeli sve više pomiču s odgovaranja na izvršavanje zadataka.
Vera je zamišljen kao CPU za radna opterećenja koja zahtijevaju puno procesorske obrade, a ne samo GPU resurse. NVIDIA navodi da agentni sustavi koriste CPU pri sandboxovima za agente, pozivima alata, orkestracijskim slojevima i dugom dohvaćanju konteksta. Tvrtka tvrdi i da Vera ima 88 prilagođenih Olympus jezgri koje je dizajnirao NVIDIA, propusnost memorije od 1,2 TB/s te 50% brže performanse po jezgri. Uz stalno opterećenje, navodi se, zadaci bi se trebali dovršavati brže.
Na prvom zaustavljanju, u uredima Anthropica u SoMa četvrti, James Bradbury, voditelj računalne infrastrukture u Anthropicu, preuzeo je sustav od Bucka. Bradbury je rekao da je skaliranje računalnih resursa važan pokretač rasta modela te da je tvrtka uzbuđena zbog pojave Vere kao dijela ekosustava za agentna radna opterećenja. Buck je pritom demonstrirao i samu arhitekturu sustava koji se gradi oko novog CPU-a.
Na OpenAI-jevu sjedištu u Mission Bayu predaja je održana na otvorenom balkonu. Sachin Katti, voditelj računalne infrastrukture u OpenAI-ju, zahvalio je Bucku na donesenom sustavu, a NVIDIA je prikazala unutrašnjost računala. U SpaceXAI-ju u Palo Altu NVIDIA-ina je ekipa Elonu Musku pokazala sustav, nakon čega je on postavljao pitanja o jezgrama, rasporedu memorije i hlađenju. SpaceXAI navodi da Veru procjenjuje za reinforcement learning opterećenja i za agentne simulacijske pipelineove koji stoje iza njegova trening-stoga.
U Oracle AI Customer Excellence Centeru u Santa Clari tim iz OCI-ja, među kojima su Karan Batta i Gary Miller, pregledao je unboxed Vera CPU sustav. NVIDIA je ondje predstavio i tvrdnju da će Vera pomoći pri obradama u kojima modeli moraju generirati i Python kod kako bi došli do točnog odgovora. Batta je rekao da OCI planira rasporediti stotine tisuća NVIDIA Vera CPU-a počevši od 2026. godine zbog potreba agentne umjetne inteligencije za održivim performansama u velikom opsegu. Prema njegovim riječima, OCI je prvi pružatelj oblaka koji će Veru rasporediti na hyperscale razini.
Za NVIDIA-u je Vera pozicionirana kao novi CPU koji treba odgovarati na rastuću potrebu za procesorskim resursima u agentnim AI sustavima. Za Oracle, prema objavi, to znači infrastrukturu za produkcijski agentni AI u razmjeru koji drugi pružatelji oblaka trenutačno ne nude. Nije navedeno kada bi svi planirani sustavi trebali biti dostupni, nego samo da OCI planira početak raspoređivanja od 2026. godine.