W zeszłorocznym artykule „Aplikacje, infrastruktura i koncentracja wartości” zobrazowałem krajobraz AI jako pięciowarstwowy tort, złożony z energii, czipów, infrastruktury, modeli i aplikacji. Po silnych wzrostach producentów GPU, często porównywanych do sprzedawców kilofów w czasie gorączki złota, dominująca stała się teza, że wartość szybko odpłynie w stronę warstwy aplikacyjnej. Dziś wiemy, że rynek nie wspiął się prędko na najwyższe piętra tego wypieku. Paraboliczne wzrosty południowokoreańskich spółek pamięciowych (SK Hynix, Samsung), wspierane dźwignią finansową i ograniczoną płynnością w portfelach inwestorów detalicznych, pokazują, że kapitał wciąż rozgrywa najbardziej deficytowe elementy infrastrukturalnej układanki. Po dostawcach kart graficznych ruszył w stronę pamięci, centrów danych, energii i innych wąskich gardeł infrastruktury.
W tym kontekście wyrosły neocloudy, różnicujące się od hyperscalerów koncentracją na najbardziej deficytowym fragmencie stosu: treningu i inferencji modeli AI. Nie próbują być drugim AWS-em, Azure’em czy GCP; nie walczą o klasyczną migrację danych, bazy i szeroki katalog usług enterprise. Ich produktem jest GPUaaS: dostęp do gotowych klastrów GPU, szybkiego networkingu i warstwy operacyjnej dla najbardziej obleganych obciążeń AI. Geneza tej kategorii jest praktyczna, a nie teoretyczna: popyt na compute urósł szybciej niż zdolność rynku do budowy centrów danych, zabezpieczenia energii i dostarczania najnowszych akceleratorów.
Zainteresowanie klasycznych dostawców chmurowych neocloudami rozpaliły dwa czynniki: głód mocy obliczeniowej i finansowa wygoda tego modelu. Zamiast pompować kolejne miliardy we własny CAPEX, najwięksi gracze mogą zakontraktować capacity u zewnętrznego dostawcy i rozłożyć koszt w czasie jako OPEX. To, co dla hyperscalera jest elastycznością kosztową, dla neocloudu jest zobowiązaniem bilansowym. CAPEX nie znika, tylko trafia na bilanse neocloudów, które finansują z góry GPU, energię, data center i sieć, zanim backlog zamieni się w przychody. W tym sensie neocloud to wehikuł finansowania infrastruktury AI: lewarowany zakład o to, że popyt na compute będzie przez lata wyprzedzał podaż gotowych klastrów GPU.
Rajd spółek takich jak CoreWeave czy Nebius pokazuje, jak wysoko rynek potrafi wyceniać ten model, przynajmniej tak długo, jak najwięksi klienci potrzebują mocy szybciej, niż są w stanie zapewnić ją wewnętrznie. Ryzyko zaczyna się wtedy, gdy dostawcy modeli, tacy jak OpenAI czy Anthropic, uznają, że przy ich skali bardziej opłaca się posiadać compute wewnętrznie niż go wynajmować. Wówczas neocloud może zacząć zjadać własny ogon: finansować rozwój rynku, który najwięksi odbiorcy z czasem przeniosą do siebie. Jeśli warstwa modeli pozostanie silnie skoncentrowana, czyli popyt będzie skupiony wokół kilku dużych odbiorców compute, aktywa stanowiące dziś przewagę, czyli GPU, energia i zakontraktowana moc data center, mogą zmienić się w dług, amortyzację i presję na marże neocloudów. Pytanie nie brzmi więc, czy neocloudy korzystają dziś na boomie AI, lecz czy są trwałą warstwą infrastruktury, czy tylko przejściowym arbitrażem na niedoborze mocy obliczeniowej.
Michał Poleszczuk, Analityk DI Xelion