Foto: 9to5Mac
Novo izvješće The Informationa donosi dodatne pojedinosti o tome kako bi nova verzija Sirija s Gemini modelom trebala raditi u pozadini. Ključna promjena, prema navodima, jest da Apple za dio korisničkih upita ne bi oslanjao isključivo na vlastitu infrastrukturu, nego bi dio obrade išao preko Google Clouda i Nvidia čipova. Isti izvještaj navodi i da je Apple nedavno odobrio uporabu Nvidia tehnologije za privatnost u tom okruženju, što upućuje na korištenje Nvidia AI čipova za barem dio računalnih potreba u Google Cloudu.
The Information sada piše da bi Apple trebao koristiti Googleovu flotu Nvidia Blackwell B200 podatkovnih čipova. Prema navodima osoba upoznatih s prilikama, Apple će uključiti Nvidiajevu značajku confidential compute, koja šifrira podatke dok se obrađuju na čipovima. Riječ je o hardverskom sigurnosnom sustavu koji štiti podatke dok su aktivno u obradi na Nvidia GPU-ima, a Nvidia ističe da ta značajka čuva povjerljivost i integritet AI modela na Rubin, Blackwell i Hopper GPU-ima.
Blackwell B200 jedan je od Nvidiainih vodećih podatkovnih GPU-ova za veliku AI obuku i inferenciju. Temelji se na Blackwell arhitekturi, nasljednici Hoppera, a Nvidia ga pozicionira kao platformu za pokretanje i treniranje vrlo velikih AI modela, uključujući modele s bilijunima parametara. U opisu tvrtke navode se i poboljšanja u inferenciji, propusnosti memorije i skaliranju na više GPU-ova u odnosu na Hopper arhitekturu. Nvidia je za svoju confidential compute tehnologiju objavila i white paper.
The Information pritom navodi da se Appleov potez razlikuje od strategije kojom tvrtka nastoji kontrolirati sve ključne sastojke svojih proizvoda. U istom izvještaju dodaje se da nije jasno kako će se Appleov prethodno predstavljeni serverski sustav Private Cloud Compute uklopiti u nadolazeće predstavljanje Sirija. Za sada je, dakle, riječ o novim detaljima o mogućoj tehničkoj podjeli posla između Applea, Google Clouda i Nvidijine infrastrukture, dok se ukupna uloga Private Cloud Computea u novom proizvodu i dalje ne razjašnjava.
Ove informacije dolaze u trenutku kada Appleov AI plan za WWDC izaziva pažnju zbog načina na koji bi se dio obrade mogao odvijati izvan Appleove vlastite infrastrukture. U prijavljenom modelu izvršavanja, značajna je kombinacija licencirane verzije Geminija, Google Clouda i Nvidia Blackwell B200 čipova s uključenom zaštitom confidential compute. The Information navodi da to pokazuje kako bi nova Siri trebala funkcionirati „ispod haube”, ali i da ostaje otvoreno pitanje kako će se uklopiti Appleov postojeći serverski sustav.