Оригинальное название: An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day
Автор оригинала: Tae Kim
Перевод оригинала: Peggy, BlockBeats
Примечание редактора: Это интервью даёт возможность взглянуть на цикл вычислительных мощностей для ИИ: спрос не снизился после предыдущей волны покупки GPU, а, напротив, продолжает расти благодаря агентам, выводу (inference) и корпоративным ИИ-приложениям.
В этой статье мы беседуем с Брэннином Макби (Brannin McBee), сооснователем и главным директором по развитию CoreWeave, и Ником Роббинсом (Nick Robbins), вице-президентом по корпоративному развитию и отношениям с инвесторами, обсуждая текущее состояние спроса на ИИ и рынка neocloud (новых облачных сервисов). Главный тезис руководителей CoreWeave прямолинеен — спрос на ИИ, кажется, обостряется с каждым днём по-новому, а реальное узкое место смещается от вопроса «есть ли GPU» к более сложным проблемам инфраструктуры: питание корпусов (shells) дата-центров, процессоры, хранение данных, электрики, способность выполнять обязательства по цепочке поставок и готовность клиентов платить за вычислительные мощности нового поколения.
Особенность CoreWeave заключается в том, что она занимает промежуточное положение в цепочке инфраструктуры ИИ: она обслуживает как ведущих клиентов, таких как OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, так и непосредственно ощущает изменения спроса со стороны исследовательских лабораторий, корпоративных клиентов и гиперскейлеров. Поэтому она видит не только «дефицит GPU», но и структурные изменения в самих рабочих нагрузках ИИ. С ростом агентного ИИ и моделей рассуждения (reasoning), спрос на вычислительные мощности больше не вращается только вокруг GPU — важность процессоров и систем хранения также растёт, и проекты дата-центров нового поколения должны предусматривать место для процессоров Vera CPU, серверов Vera Rubin и большего объёма памяти.
Это также объясняет, почему конкуренция в сфере инфраструктуры ИИ смещается от простой закупки чипов к более комплексным инженерным и эксплуатационным возможностям. Тот, кто может быстрее получить питаемые дата-центры, развернуть серверы, наладить цепочки поставок и оптимизировать стоимость за токен, оказывается ближе к ядру текущего цикла капитальных затрат на ИИ. CoreWeave неоднократно подчёркивает «клиентоориентированность», за которой стоит более масштабное суждение: поставщики облачных услуг для ИИ больше не просто продают вычислительные мощности, а перестраивают фабрики ИИ следующего поколения заранее, опираясь на дорожные карты самых передовых клиентов.
Для инвесторов и отраслевых наблюдателей в этом интервью наиболее интересна не какая-то отдельная цифра, а направление изменений спроса на инфраструктуру ИИ: GPU по-прежнему важны, но узкие места расширяются; Nvidia остаётся ключевым игроком, но процессоры, HBM, системы хранения и энергообеспечение дата-центров становятся новыми переменными; спрос на ИИ продолжает расти, но будущий успех, возможно, будет зависеть от того, кто сможет устойчиво, стабильно и в масштабе поставлять эту сложную инфраструктуру.
Далее следует оригинальный текст:
CoreWeave считается новаторским лидером раннего рынка в области neocloud (новых облачных сервисов).
Это единственный облачный провайдер, получивший высший рейтинг «Platinum» от исследовательской компании SemiAnalysis в области ИИ. CoreWeave, основанная в 2017 году, предоставляет масштабируемые вычислительные мощности на GPU для стартапов и крупных предприятий.
Key Context недавно взял интервью у Брэннина Макби (Brannin McBee), сооснователя и главного директора по развитию CoreWeave, и Ника Роббинса (Nick Robbins), вице-президента по корпоративному развитию и отношениям с инвесторами, чтобы обсудить текущее состояние спроса на ИИ и рынка neocloud.
Ниже представлены ключевые моменты из отредактированной беседы:
Спрос на ИИ продолжает обостряться
Tae: Когда началась волна спроса на агентный ИИ (Agentic AI)?
Брэннин: Мы увидели реальное начало в четвёртом квартале прошлого года. В то время мы общались с клиентами на инженерном уровне, обсуждая продукты, которые они планировали вывести на рынок в первом квартале этого года.
Это всегда был очень важный ракурс для нашего понимания потребностей клиентов. У нас с клиентами существуют глубокие взаимосвязанные инженерные отношения. Именно эти отношения позволяют нам предвидеть тренды заранее, а не реагировать постфактум.
Если смотреть с точки зрения продуктов на рынке ИИ, я бы сказал, что первый квартал стал моментом огромного перелома в сфере вывода (inference) и потребления ИИ, и это ускорение продолжается до сих пор.
Tae: В каком состоянии сейчас находится спрос на ИИ? По сравнению с несколькими месяцами назад, наблюдается ли хоть малейшее замедление в последние недели?
Ник: Кажется, он обостряется с каждым днём по-новому.
Tae: Расскажите о растущей тенденции спроса на процессоры (CPU) относительно графических процессоров (GPU) в контексте волны агентного ИИ. Вы будете развёртывать ряды стоек с процессорами Vera CPU рядом с серверами на GPU от Nvidia?
Брэннин: CoreWeave использует процессоры с 2023 года. У нас всегда был полный набор облачных продуктов. Так что вопрос не в том, начали ли мы недавно добавлять процессоры, а в том, что именно нужно клиентам? Растёт ли этот спрос в относительном выражении? Ответ очень чёткий: да, определённо.
С подъёмом возможностей агентов и логического вывода в моделях, потребности в системах хранения также растут по сравнению с предыдущими поколениями. Я думаю, эта тенденция продолжится.
Ник: На ваш вопрос ответ положительный. Вы определённо увидите множество процессоров Vera CPU, развёрнутых рядом с множеством серверов Vera Rubin. В прошлом году мы фактически кардинально перепроектировали базовую концепцию наших дата-центров, оставив больше места для систем хранения и процессоров, чтобы их можно было размещать рядом с GPU.
Мы сделали это потому, что занимаем очень уникальное положение во всей экосистеме. Мы — единственный независимый облачный провайдер для ИИ, который обслуживает всех самых продвинутых технологических пользователей. Ни один другой независимый ИИ-облачный провайдер не может сказать, что его клиентами являются Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia и другие.
Это создаёт полезный маховик или цикл положительной обратной связи для нашего бизнеса: мы понимаем, куда клиенты ведут технологии, и строим планы соответственно.
Узким местом больше не являются только GPU
Tae: В будущем вы будете в основном использовать процессоры Nvidia Vera CPU?
Ник: Это зависит от конкретной рабочей нагрузки. Мы руководствуемся потребностями клиентов. Мы действительно ожидаем стать ранними и значительными пользователями процессоров Vera CPU, что мы уже анонсировали. В настоящее время наш парк в основном состоит из AMD, но со временем это может измениться в зависимости от запросов клиентов. Интерес клиентов к процессорам Vera CPU очень высок.
Брэннин: Это также хороший повод рассказать о том, как работают наши контракты. Как вы знаете, более 98% нашего дохода обусловлено контрактами. Мы не угадываем, какая инфраструктура нужна клиентам. Клиенты очень чётко говорят нам, какие конфигурации им требуются. Всё определяется клиентами. Именно клиенты определяют, что мы строим.
Tae: Расскажите о конкурентном ландшафте. Как вы выходили на рынок и конкурируете с такими игроками в области neocloud, как SpaceX, Nebius, Oracle, а также с гиперскейлерами, такими как Azure, AWS, Google?
Брэннин: Что касается дифференциации, я предпочитаю смотреть с точки зрения сторонней валидации. Девять из десяти ведущих мировых лабораторий ИИ (за исключением Китая) используют нашу платформу. SemiAnalysis постоянно ставит нас на самый высокий уровень по производительности. Я не думаю, что мы получаем такое распределение GPU благодаря личной дружбе с Дженсеном [Хуангом, CEO Nvidia].
Это говорит о том, что поставщики глубоко уверены в нашей репутации исполнения и инженерных возможностях, веря, что мы можем наилучшим образом представить возможности их продуктов в мировом масштабе.
Ник: Мы можем привлекать клиентов-гиперскейлеров, потому что мы очень хорошо умеем исполнять. Мы можем очень быстро строить эти системы, и они работают превосходно. Мы привлекаем клиентов из исследовательских лабораторий, потому что предоставляем самые производительные версии технологий и обладаем лучшей эффективностью на токен.
Мы привлекаем корпоративных клиентов, потому что инфраструктура действительно хорошо работает, и мы создали отличный, лучший в своём классе оркестрационный слой, что также подтверждается рейтингом Platinum и другими оценками.
Но всё более важным становится то, что среди ИИ-облачных провайдеров мы построили самый зрелый набор возможностей, охватывающих инструменты для вывода (inference) и разработки, которые помогают предприятиям реально внедрять ИИ в производство.
Это означает, что мы создаём и поставляем продукты, которые в конечном итоге помогают предприятиям с относительно низкой технологической зрелостью превращать данные в модели, а модели — в агентов, которых можно запускать внутри компании, и в этом процессе мы также можем перекрёстно продавать облачные услуги CoreWeave.
Tae: Что сейчас является основным узким местом? Готовые к питанию корпуса (shells) дата-центров? GPU? Или электрики?
Брэннин: Powered shells, то есть готовые к питанию корпуса дата-центров. Если точнее, то компоненты внутри этих корпусов. Вы упомянули электриков — это абсолютно верно. Это сложная область.
Но важно то, что у нас уже есть 49 таких площадок, которые запущены и работают. Мы не делаем ставку на одну-две площадки. Мы сделали это 49 раз.
Это очень серьёзный послужной список исполнения.
Это также означает, что мы накопили огромный объём знаний о том, как работать с проблемами цепочек поставок, с какими поставщиками в этой цепочке стоит сотрудничать, а с какими — нет.
Примечание редактора: powered shells — это сами здания дата-центров, не включающие фактическое серверное оборудование.
Tae: Что вы можете рассказать о стоимости и дефиците памяти HBM? Как вы с этим справляетесь? Несут ли клиенты возросшие затраты?
Ник: Ответ — да. Наша бизнес-модель построена таким образом, что при подписании заказа на закупку GPU и определении нашей стоимости мы фиксируем цену на GPU, которую будем взимать с клиента. В более широком смысле — цену на серверы, которая, очевидно, включает стоимость HBM.
Так мы изолируем себя от влияния ежедневных колебаний цен.
Если стоимость наших компонентов в следующей сделке вырастет, мы отразим это в цене, которую, по нашему мнению, можем запросить с клиента, чтобы защитить свою маржу. Мы хорошо защищены в плане передачи этих затрат клиентам. Это то, за чем мы очень внимательно следим.
В настоящее время получение компонентов не является самым большим узким местом. Самое большое узкое место — это powered shell. Но в какой-то момент в будущем этот ответ может измениться.
Tae: Как, по вашим ожиданиям, будет разворачиваться развёртывание Vera Rubin? Что ожидается во второй половине этого года?
Ник: Мы, очевидно, являемся первой компанией в мире, которая запустила и всесторонне протестировала VR, то есть стойки Vera Rubin. То же самое мы делали в прошлом году с GB200, GB300. Я ожидаю, что VR начнёт появляться позднее в этом году.
Я ожидаю, что действительно масштабное, очень сильное развёртывание будет происходить на протяжении всего 2027 года. Этот график аналогичен GB: GB начал появляться в 2025 году, но действительно массовое развёртывание фактически происходило на протяжении всего 2026 года. То есть к концу прошлого года уже было развёрнуто немало, но именно этот год станет годом по-настоящему массового развёртывания GB.
Я ожидаю, что в следующие 12–18 месяцев VR покажет очень похожий ритм.





