W środę firma Nvidia przebiła wszelkie oczekiwania, ogłaszając gwałtowny wzrost zysków, napędzany przez swoje procesory graficzne (GPU), które doskonale sprawdzają się w obsłudze zadań związanych ze sztuczną inteligencją. Jednak inne klasy układów AI zaczynają nabierać rozpędu.
Każdy duży dostawca usług w chmurze projektuje obecnie własne układy scalone ASIC (Application-Specific Integrated Circuits), od TPU Google'a, przez Trainium Amazona, po plany OpenAI z Broadcomem. Te układy są mniejsze, tańsze, łatwiejsze w obsłudze i mogą zmniejszyć zależność tych firm od procesorów graficznych Nvidii. Daniel Newman z Futurum Group powiedział w rozmowie z CNBC, że spodziewa się, iż układy ASIC „będą rosły szybciej niż rynek GPU w ciągu najbliższych kilku lat”.
Oprócz układów GPU i ASIC dostępne są również programowalne macierze bramek (FPGA), które można rekonfigurować po produkcji do zastosowań takich jak przetwarzanie sygnałów, sieci i sztuczna inteligencja. Istnieje również cała generacja układów AI zaprojektowanych do działania bezpośrednio na urządzeniach, a nie w chmurze – segment ten przodują firmy takie jak Qualcomm i Apple.
CNBC rozmawiało z ekspertami i osobami z największych firm technologicznych, aby przyjrzeć się bliżej temu zatłoczonemu krajobrazowi i różnym rodzajom układów scalonych opartych na sztucznej inteligencji.
Procesory graficzne do obliczeń ogólnego przeznaczenia
Procesory graficzne były kiedyś wykorzystywane głównie w grach wideo, ale dzięki nim Nvidia stała się najcenniejszą spółką publiczną na świecie, gdy stała się motorem napędowym współczesnej sztucznej inteligencji. W zeszłym roku Nvidia sprzedała około 6 milionów egzemplarzy swoich procesorów graficznych „Blackwell” obecnej generacji.
Przejście od gier do sztucznej inteligencji rozpoczęło się w 2012 roku, kiedy naukowcy wytrenowali sieć neuronową AlexNet, wykorzystując procesory graficzne Nvidia – przełom, który wielu uważa za iskrę rewolucji we współczesnej sztucznej inteligencji. Sieć AlexNet wzięła udział w prestiżowym konkursie rozpoznawania obrazu i wykorzystywała procesory graficzne zamiast procesorów głównych, zapewniając imponującą dokładność i znaczącą przewagę konkurencyjną.
Ta sama zdolność przetwarzania równoległego, dzięki której procesory GPU są w stanie renderować realistyczną grafikę, sprawia, że idealnie nadają się również do trenowania modeli głębokiego uczenia, które uczą się na podstawie danych, a nie jawnego programowania.
Obecnie procesory graficzne (GPU) są sprzedawane w systemach centrów danych w połączeniu z procesorami CPU, aby obsługiwać obciążenia AI w chmurze. Procesory CPU mają kilka wydajnych rdzeni do zadań sekwencyjnych, podczas gdy procesory graficzne (GPU) mają tysiące mniejszych rdzeni specjalizujących się w operacjach równoległych, takich jak mnożenie macierzy.
Ponieważ mogą wykonywać ogromną liczbę operacji jednocześnie, procesory GPU idealnie nadają się zarówno do trenowania, jak i wnioskowania. Trenowanie uczy modele sztucznej inteligencji znajdowania wzorców w ogromnych zbiorach danych; wnioskowanie wykorzystuje te modele do podejmowania decyzji na podstawie nowych informacji.
Procesory graficzne pozostają głównym silnikiem Nvidii i jej największego konkurenta, AMD. Kluczowym czynnikiem różnicującym je jest oprogramowanie: Nvidia opiera się na swoim ekosystemie CUDA, podczas gdy AMD oferuje w dużej mierze oprogramowanie typu open source.
Obie firmy sprzedają procesory graficzne do przetwarzania w chmurze dostawcom takim jak Amazon, Microsoft, Google, Oracle i CoreWeave, którzy następnie wynajmują moc obliczeniową twórcom rozwiązań AI.
Na przykład umowa Anthropic z firmami Nvidia i Microsoft o wartości 30 miliardów dolarów obejmuje moc obliczeniową równą 1 gigawatowi, zbudowaną na sprzęcie Nvidia. AMD niedawno pozyskało również znaczące zobowiązania od firm OpenAI i Oracle.
Nvidia sprzedaje swoje produkty bezpośrednio rządom i firmom zajmującym się sztuczną inteligencją (w tym co najmniej 4 miliony procesorów graficznych firmie OpenAI) oraz rządom państw takich jak Korea Południowa, Arabia Saudyjska i Wielka Brytania.
Firma poinformowała stację CNBC, że pobiera opłatę w wysokości około 3 milionów dolarów za obudowę serwerową zawierającą 72 procesory graficzne Blackwell i co tydzień wysyła około 1000 takich obudów.
Dion Harris, starszy dyrektor ds. infrastruktury AI w firmie Nvidia, powiedział, że nigdy nie wyobrażał sobie, że popyt wzrośnie do takiego poziomu. „Kiedy lata temu rozmawialiśmy z firmami o systemie z ośmioma procesorami graficznymi, uważali, że to przesada”.
Układy ASIC do specjalistycznej sztucznej inteligencji w chmurze
Uczenie oparte na GPU napędzało pierwszą falę dużych modeli językowych, ale wnioskowanie zyskuje na znaczeniu wraz z dojrzewaniem modeli. Wnioskowanie można przeprowadzić na mniej elastycznych i tańszych układach scalonych, zbudowanych specjalnie do wykonywania określonych operacji matematycznych – i tu właśnie pojawiają się układy ASIC.
Jeśli GPU to „szwajcarski scyzoryk”, który może wykonywać wiele różnych zadań równoległych, to układ ASIC jest narzędziem o jednym przeznaczeniu — niezwykle szybkim i wydajnym, ale po wyprodukowaniu ograniczającym się do jednego typu operacji.
„Nie da się zmienić tych chipów, gdy już zostaną wytrawione w krzemie” – powiedział Chris Miller, autor książki *Chip War*. „Istnieje kompromis między wydajnością a elastycznością”.
Procesory graficzne Nvidii są na tyle wszechstronne, że spełniają niezliczone potrzeby w zakresie sztucznej inteligencji, ale są drogie (nawet 40 000 dolarów za sztukę) i trudno dostępne. Startupy polegają na nich między innymi dlatego, że zaprojektowanie niestandardowego układu ASIC może kosztować dziesiątki milionów dolarów.
Jednak giganci chmury inwestują ogromne sumy w układy ASIC, ponieważ obiecują one duże oszczędności przy dużej skali działania.
„Te firmy chcą mieć większą kontrolę nad tworzonymi przez siebie obciążeniami” – powiedział Newman. „Będą jednak nadal współpracować z firmami Nvidia i AMD – zapotrzebowanie na moc obliczeniową jest ogromne”.
Google jako pierwszy zbudował niestandardowy układ ASIC AI, wprowadzając na rynek w 2015 roku układ Tensor Processing Unit (TPU). Prace rozpoczęły się w 2006 roku, ale stały się pilne w 2013 roku, gdy Google zdało sobie sprawę, że sztuczna inteligencja może podwoić rozmiar jego centrów danych. W 2017 roku TPU umożliwiło wdrożenie architektury Transformer, która stanowi podstawę większości nowoczesnych rozwiązań AI.
Google zaprezentowało TPU siódmej generacji w listopadzie. Anthropic będzie trenować swój model Claude na milionie układów TPU. Niektórzy uważają, że układy TPU dorównują – lub przewyższają – procesory graficzne Nvidia.
„Wiele osób spodziewa się, że Google w końcu udostępni TPU szerzej” – powiedział Miller.
Po przejęciu Annapurna Labs w 2015 r. AWS wprowadziło na rynek własne układy scalone. W 2018 r. uruchomiono Inferentię, a w 2022 r. Trainium. Wkrótce spodziewane jest wydanie Trainium3.
Amazon twierdzi, że Trainium oferuje od 30% do 40% lepszy stosunek ceny do wydajności niż alternatywy. Anthropic wykorzystuje obecnie pół miliona chipów Trainium2 do trenowania swoich modeli.
Dostawcy usług w chmurze, aby tworzyć niestandardowe układy ASIC, polegają na firmach takich jak Broadcom i Marvell – które dostarczają kluczowej wiedzy z zakresu IP i sieci. „Dlatego Broadcom stał się jednym z największych beneficjentów boomu na sztuczną inteligencję” – powiedział Miller.
Broadcom pomógł zaprojektować układy TPU firmy Google i akceleratory Meta na rok 2023, a od 2026 r. będzie produkować niestandardowe układy scalone na potrzeby OpenAI.
Microsoft opracował Maia 100. Qualcomm ma A1200. Intel oferuje linię Gaudi. Tesla pracuje nad swoim układem AI5. Startupy takie jak Cerebras i Groq promują nowatorskie architektury.
W Chinach Huawei, ByteDance i Alibaba projektują własne układy ASIC, pomimo ograniczeń eksportowych nałożonych przez USA.
Sztuczna inteligencja na poziomie urządzeń z NPU i FPGA
Trzecia kategoria układów AI jest przeznaczona do uruchamiania modeli bezpośrednio na urządzeniach, a nie w chmurze. Układy te są zazwyczaj zintegrowane z projektami typu system-on-a-chip (SoC) i są znane jako procesory edge-AI. Umożliwiają one lokalne i wydajne działanie funkcji AI, oszczędzając czas pracy baterii i prywatność.
„Będziesz mógł uruchamiać zadania AI bezpośrednio na swoim telefonie z wyjątkowo niskim opóźnieniem” – powiedział Saif Khan, były doradca ds. AI i technologii Białego Domu. „I bez wysyłania danych do centrum danych”.
Istotną część tej kategorii stanowią jednostki przetwarzania neuronowego (NPU), opracowywane przez firmy Qualcomm, Intel, AMD i inne.
Apple nie używa terminu NPU, ale stosuje „silnik neuronowy” w procesorach Mac serii M oraz procesorach mobilnych serii A.
„To podejście okazało się niezwykle skuteczne” – powiedział Tim Millet, wiceprezes Apple ds. architektury platformy. „Jest szybkie i daje nam większą kontrolę nad doświadczeniem”.
Układy Snapdragon w telefonach z systemem Android, niestandardowe układy NPU firmy Samsung oraz procesory edge-AI firm NXP i Nvidia napędzają sztuczną inteligencję w samochodach, robotach, kamerach i urządzeniach inteligentnego domu.
„Większość wydatków nadal trafia do centrów danych” – powiedział Miller. „Ale to się zmieni, gdy sztuczna inteligencja rozprzestrzeni się na telefony, samochody, urządzenia noszone i wszystko inne”.
Układy FPGA oferują jeszcze większą elastyczność, ponieważ można je przeprogramować po wyprodukowaniu, choć są mniej energooszczędne niż układy ASIC i NPU.
AMD stało się największym producentem układów FPGA po przejęciu Xilinx za 49 miliardów dolarów w 2022 roku. Drugie miejsce zajmuje Intel po przejęciu Altery za 16,7 miliarda dolarów w 2015 roku.
Podsumowanie: Nvidia wciąż jest daleko z przodu
Wszystkie te firmy produkujące układy AI opierają się na jednym producencie: TSMC z Tajwanu.
TSMC buduje ogromny zakład produkcyjny w Arizonie, do którego Apple przeniesie część swojej produkcji. Prezes Nvidii, Jensen Huang, powiedział w październiku, że procesory graficzne Blackwell również osiągnęły tam „pełną produkcję”.
Mimo coraz większego zatłoczenia na rynku, pozbycie się Nvidii pozostaje niezwykle trudne.
„Nvidia jest w tej pozycji, bo na nią zasłużyła” – powiedział Newman. „Poświęciła lata na budowę tego ekosystemu deweloperskiego – i to ona wygrała”.
Większość amerykańskich indeksów giełdowych wzrosła w piątek na skutek powrotu optymizmu co do potencjalnych obniżek stóp procentowych przez Rezerwę Federalną.
John Williams, prezes nowojorskiego oddziału Rezerwy Federalnej (FOMC), powiedział w piątek, że spodziewa się, iż bank centralny będzie miał większą swobodę w obniżaniu stóp procentowych. Wpływowy polityk, przemawiając w Chile, zauważył, że ryzyko dla rynku pracy przeważa obecnie nad ryzykiem związanym z inflacją, co potwierdza stanowisko bardziej gołębiego stanowiska członków FOMC.
Williams powiedział: „Uważam, że polityka pieniężna jest nadal umiarkowanie restrykcyjna, choć mniej niż przed naszymi ostatnimi działaniami. Dlatego nadal widzę możliwość dodatkowej korekty w krótkim terminie docelowego przedziału stopy funduszy federalnych, aby zbliżyć politykę do neutralnej i zachować równowagę między naszymi dwoma celami”.
W handlu indeks Dow Jones Industrial Average wzrósł o 0,4% (185 punktów) do 45 937 punktów o godz. 16:15 GMT. Szerszy indeks S&P 500 zyskał 0,1% (7 punktów) do 6545 punktów, a Nasdaq Composite zyskał 0,1% (38 punktów) do 22 040 punktów.
Ceny palladu kontynuowały w piątek spadki pod presją silniejszego dolara amerykańskiego, niepewności co do popytu i oczekiwań na wyższą podaż.
Agencja Reuters, powołując się na wiarygodne źródła, poinformowała, że Stany Zjednoczone prywatnie naciskają na Ukrainę, by zaakceptowała porozumienie o zawieszeniu broni z Rosją. Takie posunięcie prawdopodobnie zwiększyłoby globalną podaż metali przemysłowych w miarę łagodzenia sankcji wobec Rosji – jednego z największych eksporterów palladu na świecie.
Według Capital.com, ceny palladu wzrosły o około 26% od początku października, do około 1500 dolarów za uncję. Wzrost ten nastąpił wraz z zyskami na rynku platyny i ogólną poprawą sytuacji finansowej na świecie.
Zakłady na obniżki stóp procentowych w USA i wcześniejsze osłabienie dolara również wsparły pallad w ramach tzw. rajdu „złoto + płynność”, który w ostatnich tygodniach przyczynił się do wzrostu cen metali szlachetnych.
Pallad jest stosowany niemal wyłącznie w katalizatorach silników benzynowych, co oznacza, że wszelkie wahania cen mają bezpośredni wpływ na strukturę kosztów dla amerykańskich producentów samochodów i urządzeń elektronicznych.
Analiza techniczna Monex wskazuje na opór w przedziale 1500–1520 dolarów za uncję, z oczekiwaniami na ogólny trend wzrostowy, ale w przyszłości nadal utrzymują się wahania cen. Analitycy CPM Group zauważyli, że ostatni wzrost cen palladu jest „ściśle powiązany z wynikami platyny”, ostrzegając jednocześnie, że osłabienie rynku pracy w USA i utrzymująca się inflacja mogą negatywnie wpłynąć na popyt.
Pomimo niedawno ogłoszonego rozejmu handlowego między USA a Chinami, komentarze amerykańskich urzędników sugerują, że napięcia utrzymują się na wysokim poziomie. Sekretarz Skarbu USA stwierdził, że Chiny pozostają niewiarygodnym partnerem handlowym, a prezydent Donald Trump powtórzył, że jego administracja nie zezwoli na eksport zaawansowanych układów Nvidia do Chin ani innych krajów.
Indeks dolara amerykańskiego wzrósł o 0,1% do 100,2 punktów o godz. 14:43 GMT, wahając się między maksimum 100,4 a minimum 99,9 punktów.
Cena kontraktów terminowych na pallad z dostawą w grudniu spadła o 0,9% do 1374 dolarów za uncję o godz. 14:43 GMT.
W piątek rano cena bitcoina na krótko spadła do 81 871,19 USD, po czym ustabilizowała się w okolicach 82 460 USD, co oznacza spadek o około 10,2% w ciągu ostatnich 24 godzin.
Po prawie miesiącu nieustannej sprzedaży Bitcoin jest teraz wyceniany o 10% poniżej poziomu z początku roku, tracąc większość zysków, jakie osiągnął po zeszłorocznym zwycięstwie wyborczym Donalda Trumpa.
Ostatni raz cena bitcoina spadła poniżej 82 000 dolarów w kwietniu — kiedy to spadła do 75 000 dolarów — podczas szerokiej wyprzedaży na rynku wywołanej ogłoszeniem przez Trumpa radykalnych ceł podczas wydarzenia „Dnia Wyzwolenia”.
Na podstawie danych z Deribit — giełdy opcji i kontraktów terminowych należącej do Coinbase — CoinDesk poinformował, że inwestorzy przygotowują się na dalsze spadki.
Ethereum, druga co do wielkości kryptowaluta pod względem wartości rynkowej, spadło poniżej 2740 dolarów, tracąc ponad 9,6% w ciągu 24 godzin. Inne główne tokeny również znalazły się pod silną presją, a XRP, BNB i SOL spadły odpowiednio o 9,1%, 8,4% i 10,6%. Dogecoin – największa moneta memowa – stracił 10,3% w tym samym okresie.
Po osiągnięciu nowych rekordowych poziomów na początku zeszłego miesiąca, rynek kryptowalut odnotował stałe spadki po bezprecedensowym jednodniowym wyczyszczeniu 10 października, kiedy w ciągu 24 godzin zlikwidowano 19,37 miliarda dolarów pozycji lewarowanych. Wydarzenie to zostało sprowokowane ogłoszeniem Trumpa o nałożeniu dodatkowego 100% cła na chiński import – decyzji, z której później się wycofał. Aktywa cyfrowe również znalazły się w ostatnich dniach w strefie szerszej zmienności rynkowej – według CoinGlass w ciągu 24 godzin zlikwidowano ponad 2,2 miliarda dolarów.
Całkowita wartość rynkowa wszystkich kryptowalut wynosi obecnie 2,92 biliona dolarów, według CoinGecko – to spadek o 33% w porównaniu z szczytem około 4,38 biliona dolarów osiągniętym na początku października. Od początku tego miesiąca kapitalizacja rynkowa Bitcoina spadła o około 25%, co oznacza najgłębszy miesięczny spadek od krachu kryptowalut w 2022 roku, według Bloomberga.
Akcje Strategy (dawniej MicroStrategy) – powszechnie postrzegane jako odpowiednik Bitcoina ze względu na swoje ogromne zasoby – spadły w piątek o 2,44% w handlu przedsesyjnym, po spadku o 11% w ciągu ostatniego tygodnia i 41% w ciągu ostatnich 30 dni. Firma posiada obecnie 649 870 BTC po średniej cenie zakupu 74 430 dolarów.
W nocie opublikowanej na początku tygodnia analitycy JPMorgan ostrzegali, że Strategy grozi usunięcie z głównych indeksów, takich jak Nasdaq 100 i MSCI USA. Takie wykluczenie mogłoby doprowadzić do dalszych spadków wartości akcji spółki i potencjalnie wpłynąć na rynki kryptowalut, gdyby firma była zmuszona sprzedać część swoich zasobów w Bitcoinach.