Foto: NVIDIA Blog
NVIDIA i Microsoft najavili su proširenje suradnje usmjereno na agentičnu umjetnu inteligenciju, uz naglasak na cijeli tehnološki sloj koji uključuje brzi hardver, sigurna izvršna okruženja, responzivan podatkovni sloj i modele prilagođene dugotrajnom zaključivanju. U sklopu partnerstva razvijaju se rješenja za Windows uređaje, Azure cloud i lokalna okruženja, a cilj je developerima omogućiti rad na svim tim razinama kroz jedinstven skup alata i infrastrukture.
Na Microsoft Buildu je osnivač i glavni izvršni direktor NVIDIE Jensen Huang sudjelovao u uvodnom govoru izvršnog predsjednika i glavnog izvršnog direktora Microsofta Satye Nadelle putem videoveze iz Taipeija. Tom su prilikom istaknuti RTX Spark i DGX Station za Windows, GPU-ubrzani Microsoft Fabric, NVIDIA-ini otvoreni modeli na Microsoft Foundryju, sigurni runtime NVIDIA OpenShell u GitHub Copilotu te nova generacija AI tvornica pogonjenih NVIDIA-inom tehnologijom.
NVIDIA i Microsoft istodobno predstavljaju nove Windows sustave namijenjene razvoju i pokretanju AI agenata. RTX Spark je nova linija prijenosnih računala i malih stolnih računala, a NVIDIA ga opisuje kao prvi Windows PC izrađen za osobne agente, s do 1 petaflopom AI performansi, do 128 GB objedinjene memorije te cjelodnevnim trajanjem baterije i punim AI i grafičkim performansama bez priključka na struju. Sustavi bi trebali stići ove jeseni kroz Microsoft Surface, ASUS, Dell, HP, Lenovo i MSI.
DGX Station for Windows namijenjen je poslovnom okruženju i NVIDIA ga opisuje kao najmoćnije stolno AI superračunalo za izgradnju i pokretanje agenata u Windows poslovnim aplikacijama i radnim tokovima. Uređaj se temelji na NVIDIA GB300 Grace Blackwell Ultra Desktop Superchipu, ima do 748 GB koherentne memorije i 20 petaflopa FP4 performansi te može pokretati modele do 1 bilijuna parametara za agente koji su stalno uključeni. Sustavi se očekuju od ASUS-a, Della, GIGABYTE-a, HP-a, MSI-ja i Supermicroa u četvrtom tromjesečju, a oba proizvoda koriste NVIDIA OpenShell, runtime dizajniran za autonomne agente.
Suradnja se proteže i na Azure te Foundry. NVIDIA i Microsoft navode da su modeli Anthropica, OpenAI-ja i NVIDIE, uz Hermes special agents, dostupni u hostanim agentima u Foundry Agent Serviceu, što poduzećima omogućuje rad s agentičnim sustavima na Azureu uz ugrađene identitet i upravljanje. Anthropicovi Claude modeli sada rade i izvorno na NVIDIA GB300 Blackwell Ultra sustavima na Azureu, a dostupnost za korisnike očekuje se u nadolazećim tjednima.
NVIDIA Nemotron 3 Ultra, novi otvoreni model za dugotrajne agente u kodiranju, istraživanju i poslovnim radnim tokovima, dostupan je ovoga mjeseca na Foundry managed computeu, zajedno s Nemotronom 3.5 ASR za prepoznavanje govora i Nemotronom 3.5 Content Safety. Razvojni inženjeri mogu kombinirati Nemotron s vodećim i lokalnim modelima kako bi prilagodili trošak i kvalitetu svakom pojedinom zadatku. U Foundryju je proširen i portfelj otvorenih modela NVIDIE za agentičnu, fizičku i znanstvenu umjetnu inteligenciju, uključujući Cosmos 3, koji je opisan kao prvi potpuno otvoreni omnimodel za fizičku umjetnu inteligenciju, te Earth-2 AI modele za vremensku prognozu kroz Microsoft Planetary Computer Pro i Foundry.
Za razvoj proizvodnih agenata NVIDIA je također ponudila Agent Toolkit i blueprintove NVIDIA NemoClaw, dok su CUDA-X biblioteke poput cuDF-a, cuOpta, AI-Q-a i NeMo-a sada dostupne agentima kao specijalizirane vještine. U području podataka NVIDIA ubrzano računalstvo sada je ugrađeno u Microsoft Fabric Data Warehouse, a Microsoftovo interno benchmarkiranje pokazuje SQL izvršavanje do 6 puta brže od CPU temeljnog modela te do 7 puta brže od triju drugih vodećih pružatelja cloud podatkovnih skladišta u radnim opterećenjima s visokom istodobnošću. Microsoft i NVIDIA to povezuju s podatkovnim slojem koji mora pratiti agente koji neprekidno pretražuju i analiziraju podatke.
Microsoft također integrira NVIDIA-ine otvorene alate i vještine za fizičku umjetnu inteligenciju s Azureom i Physical AI Toolchainom. Time razvijatelji dobivaju jedinstvenu platformu s Cosmos 3 arhitekturom temeljenom na mješavini transformera za simulaciju, treniranje i implementaciju autonomnih sustava, uključujući robote, autonomna vozila i industrijske sustave koji mogu opažati, zaključivati, planirati i djelovati u fizičkom svijetu. NVIDIA navodi i da Cosmos 3 zauzima prvo mjesto među otvorenim modelima u ključnim benchmarkovima za vizualno zaključivanje, generiranje svijeta i generiranje akcija.
Najnoviji dio suradnje odnosi se i na lokalna okruženja: Microsoft, prema objavi NVIDIE, uvodi Foundry Local na Azure Local. Time se agentična umjetna inteligencija širi izvan oblaka prema lokalnim implementacijama, uz jedinstveni skup alata koji se proteže od Windows uređaja do Azurea i lokalnih sustava.