Jensen Huang na scenie Dell Technologies World nie próbował brzmieć skromnie: popyt na AI ma być „paraboliczny”. Za tym hasłem stoi jednak coś bardziej konkretnego niż keynote’owa przesada — Dell pokazał nowe serwery oparte na platformie Vera Rubin, a Nvidia po raz kolejny ustawiła rozmowę wokół agentów, kosztu inferencji i własnej infrastruktury w firmach.
TL;DR
- Jensen Huang na Dell Technologies World powiedział, że wzrost zapotrzebowania na moc obliczeniową dla AI przyspiesza wraz z wejściem agentów do zastosowań firmowych
- Dell zapowiedział serwer PowerEdge XE9812 oparty na NVIDIA Vera Rubin NVL72 oraz kolejne modele z HGX Rubin NVL8
- Według prezentacji na scenie Vera CPU ma przyspieszać pracę środowisk agentowych i zapytań do danych względem tradycyjnych serwerów x86
- Michael Dell mówił o 5 tys. firm korzystających z Dell AI Factory with NVIDIA, wskazując m.in. Eli Lilly, Samsunga i Honeywell
- Szef Della prognozował inwestycje w infrastrukturę AI rzędu 3–4 bln dolarów do 2030 roku
Jensen Huang ustawia ton: agenty mają już zjadać prawdziwy budżet
Na scenie w Las Vegas Jensen Huang, założyciel i dyrektor generalny Nvidii, mówił o „erze użytecznego AI”. W jego ujęciu chodzi o moment, w którym modele nie służą już wyłącznie do demonstracji, ale wykonują pracę: planują kroki, korzystają z narzędzi, odpytują dane i wracają z wynikiem. Stąd ten cały „paraboliczny” popyt na obliczenia.
To oczywiście język prezentacji sprzedażowej, ale trudno nie zauważyć, że Nvidia od miesięcy pcha dokładnie tę samą tezę: jeśli firmy przechodzą z chatbotów do agentów, rośnie nie tylko apetyt na GPU, lecz także na pamięć, sieć, chłodzenie i CPU. To jest sedno przekazu z Dell Technologies World — więcej AI w produkcji ma oznaczać więcej własnej infrastruktury, a nie tylko większy rachunek za chmurę.
Dell PowerEdge XE9812 i Rubin: o co chodzi w obietnicy tańszego tokena
Najmocniej wybrzmiała zapowiedź serwera Dell PowerEdge XE9812 z platformą NVIDIA Vera Rubin NVL72. Według komunikacji prezentowanej podczas wydarzenia system ma oferować do 10 razy niższy koszt na token przy inferencji agentów niż poprzednia generacja Blackwell. To liczba ważna, bo właśnie koszt obsługi zapytań decyduje dziś o tym, czy wdrożenie AI da się utrzymać poza fazą pokazu.
Dell pokazał też modele XE9880L, XE9885L i XE9882L oparte na HGX Rubin NVL8. W przekazie producentów chodzi nie tylko o surową wydajność, ale o gotowy zestaw dla firm, które chcą uruchamiać duże modele i agentów we własnym centrum danych. Ekonomia inferencji staje się tu ważniejsza niż samo „mamy więcej GPU”, bo to ona rozstrzyga, czy AI będzie używane codziennie, czy tylko od święta.
Vera CPU ma odciążyć agentów tam, gdzie GPU nie załatwia wszystkiego
W tym ogłoszeniu ciekawsze od zwykłego wyścigu na akceleratory jest to, że Nvidia i Dell mocno podkreślały rolę CPU. Serwery PowerEdge M9822 i R9822 mają korzystać z procesorów Vera, które według prezentacji Huanga wypadają szczególnie dobrze w zadaniach jednowątkowych i przy pracy z pamięcią. To ważne, bo agent nie spędza całego życia na samym GPU: część czasu czeka na dane, uruchamia narzędzia, wykonuje kod albo prowadzi orkiestrację zadań.
Na scenie padły też przykłady baz danych, takich jak Starburst i DuckDB, jako elementów takiego środowiska. Sens tej opowieści jest prosty: jeśli firmy naprawdę chcą automatyzować procesy przy pomocy agentów, sam zakup kart nie wystarczy. CPU wraca do gry, bo w praktyce to on często spina cały przepływ pracy między modelem, narzędziami i danymi.
Michael Dell mówi o 5 tys. firm, ale najważniejsze jest co one właściwie robią
Michael Dell podał ze sceny, że z Dell AI Factory with NVIDIA korzysta już 5 tys. firm. Wśród przykładów wymieniono Eli Lilly, Samsunga i Honeywell. To nie są przypadkowe logotypy do slajdu: każda z tych firm ma własny powód, by przenosić AI bliżej własnych danych i procesów.
Honeywell mówił o przejściu z chmury publicznej do własnego centrum danych, gdzie większe znaczenie mają kontrola, bezpieczeństwo i przewidywalność kosztów. W farmacji i przemyśle dochodzi jeszcze kwestia zgodności, poufności i integracji z istniejącymi systemami. Z polskiej perspektywy ten argument też brzmi znajomo — przy wdrożeniach w bankach, telekomach czy administracji temat „wyślijmy wszystko do zewnętrznej chmury” rzadko przechodzi bez oporu. To już nie są pilotaże, tylko próba ustawienia AI jako części zwykłej infrastruktury firmowej.
Prognoza 3–4 bln dolarów do 2030 roku? Brzmi ogromnie i o to właśnie chodzi
Michael Dell dorzucił jeszcze jedną liczbę: do 2030 roku globalne inwestycje w infrastrukturę AI mają sięgnąć 3–4 bln dolarów. Takie prognozy zawsze trzeba czytać ostrożnie, bo są jednocześnie analizą rynku i uzasadnieniem dla własnej ofensywy produktowej. Mimo to dobrze pokazują skalę ambicji producentów sprzętu.
Jeśli ten scenariusz choć częściowo się sprawdzi, firmy będą musiały planować nie tylko zakup serwerów, ale też zasilanie, chłodzenie cieczą, sieć, zarządzanie danymi i obsługę modeli przez kilka kolejnych lat. Infrastruktura AI przestaje być dodatkiem do IT i zaczyna konkurować o ten sam budżet co klasyczne modernizacje centrów danych.
Co z tego wynika dla klientów Della i dla konkurencji Nvidii
Najciekawsze w tym ogłoszeniu jest to, że Dell i Nvidia sprzedają dziś nie pojedynczy serwer, lecz całą opowieść o pełnym stosie: od CPU i GPU po sieć, oprogramowanie i gotowe wzorce wdrożeń. To wygodne dla klientów, bo skraca drogę od zakupu do uruchomienia. Jednocześnie jeszcze mocniej wiąże ich z jednym ekosystemem.
Dla konkurencji to kłopot, bo trudniej ścigać się wyłącznie jednym parametrem. A dla klientów sygnał jest dość jasny: jeśli zależy im na uruchamianiu modeli lokalnie, z pełną kontrolą nad danymi, to dostają coraz bardziej domknięty produkt. Suwerenne AI w firmie nie jest już hasłem dla działu marketingu, tylko argumentem zakupowym przy rozmowach o bezpieczeństwie, zgodności i kosztach.
Źródła:
Na podstawie materiałów i komunikacji z Dell Technologies World: NVIDIA Blog, Dell.com, itwire.com, wpis LinkedIn Anand Kashyap, Chartmill stock news
