AI

QumulusAI osigurao više od 124 milijuna dolara pretplata za Blackwell GPU klastere

20:41, 11.06.2026.
QumulusAI osigurao više od 124 milijuna dolara pretplata za Blackwell GPU klastere

Foto: SiliconANGLE

Neocloud pružatelj QumulusAI objavio je da je osigurao više od 124 milijuna dolara korisničkih pretplata na rok od tri godine, u ugovorima s Hyperbolicom i još jednom vodećom platformom za AI inferenciju. Riječ je o deploymentsima koji obuhvaćaju ukupno 1.280 Nvidia Blackwell GPU-ova, isporučenih kroz 160 Lenovo i Supermicro bare-metal poslužitelja povezanih Cisco Nexus mrežom kako bi se stvorili klasteri visokog protoka i niske latencije.

QumulusAI navodi i da je gotovo 21,9 milijuna dolara vrijednosti unaprijed ugovoreno kroz zajedničke početne obveze kupaca, što tvrtki osigurava obrtna sredstva. Strukturno, riječ je o pretplatama na GPU kao uslugu, a ne o jednokratnim hardverskim poslovima, pa su prihodi QumulusAI-ja raspoređeni kroz vrijeme, dok su troškovi za korisnike predvidljivi tijekom trajanja ugovora.

Tvrtka se, kako navodi, pokušava pozicionirati kao pružatelj AI infrastrukture koji smanjuje troškove inferencije i širi njezinu dostupnost. Umjesto općih referentnih arhitektura, QumulusAI gradi pristup koji usklađuje broj CPU jezgri, količinu sistemske memorije i lokalnu pohranu s ponašanjem velikih open-source inferencijskih opterećenja, deep-research agenata, sustava za automatizirano programiranje i drugih asinkronih aplikacija. Prema vlastitoj analizi tvrtke, takav pristup može smanjiti troškove AI inferencije za oko 20% u odnosu na standardne konfiguracije, ponajviše zbog manjeg rasipanja CPU i pohrambenih resursa.

Kerravala u kolumni ističe da se prva faza generativne AI-ja temeljila na nestašici GPU-ova, dok se tržište sada pomiče prema pitanju koliko se ti GPU-ovi mogu kontinuirano ekonomski koristiti. U tom okviru QumulusAI-jeva arhitektura spaja Blackwell GPU-ove s Lenovo i Supermicro bare-metal sustavima te Cisco Nexus mrežom, a naglasak stavlja na to da ostatak infrastrukture bude precizno dimenzioniran uz GPU, umjesto da bude generički i prevelik. U članku se to opisuje kao prijelaz prema infrastrukturi u kojoj se uspjeh mjeri troškom po upitu i iskorištenošću, a ne samo vršnim performansama.

QumulusAI također navodi da inferencija postaje zasebna kategorija AI infrastrukture, odvojena od treniranja, s drugačijim dizajnom i metrikama uspjeha. Dok su okruženja za treniranje usmjerena na kratke i intenzivne valove obrade, inferencijska okruženja optimizirana su za stalan promet zahtjeva, predvidivu latenciju i stabilne ekonomske uvjete tijekom višegodišnjih razdoblja. Tvrtka pritom naglašava model s pretplatama, višegodišnjim ugovorima i distribuiranom implementacijom koja računalnu snagu približava krajnjim korisnicima umjesto koncentriranja u nekoliko velikih regija.