Примечание редактора: Это интервью даёт окно для наблюдения за циклом спроса на вычислительные мощности для ИИ: спрос не охладевает после предыдущей волны скупки GPU, а, напротив, продолжает подогреваться интеллектуальными агентами, инференсом и корпоративными ИИ-приложениями.
В этой статье мы взяли интервью у сооснователя и главного директора по развитию CoreWeave Браннина Макби, а также у вице-президента по корпоративному развитию и инвесторским отношениям Ника Роббинса, чтобы обсудить текущее состояние спроса на ИИ и рынка neocloud. Ключевое утверждение руководства CoreWeave прямое — спрос на ИИ, кажется, обостряется с каждым днём по-новому, а реальное узкое место смещается от «есть ли GPU» к более сложным инфраструктурным вопросам: дата-центрам с готовым энергоснабжением (powered shells), CPU, системам хранения данных, электрикам, способности выполнять поставки по цепочке и готовности клиентов платить более высокую цену за вычислительные мощности нового поколения.
Особенность CoreWeave заключается в том, что она занимает срединное положение в цепочке инфраструктуры ИИ: она обслуживает как ведущих клиентов, таких как OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, так и непосредственно ощущает изменения в спросе со стороны исследовательских лабораторий, корпоративных клиентов и гипермасштабных облачных провайдеров. Поэтому она видит не только «дефицит GPU», но и структурные изменения самих ИИ-нагрузок. С появлением агентского ИИ (agentic AI) и моделей рассуждений (reasoning) спрос на вычислительные мощности больше не вращается только вокруг GPU — важность CPU и систем хранения также растёт, и проектирование дата-центров нового поколения должно предусматривать место для CPU Vera, серверов Vera Rubin и большего объёма памяти.
Это также объясняет, почему конкуренция в области инфраструктуры ИИ смещается от простых закупок чипов к более комплексным инженерным и производственным возможностям. Тот, кто быстрее получит дата-центры с питанием, развернёт серверы, наладит цепочки поставок и оптимизирует стоимость за токен, окажется ближе к ядру текущего цикла капитальных затрат на ИИ. CoreWeave постоянно подчёркивает подход «от клиента» (customer-driven), за которым на самом деле стоит более крупное суждение: ИИ-облачные провайдеры больше не просто продают вычислительные мощности, а заранее перестраивают фабрики ИИ следующего поколения, исходя из дорожных карт самых передовых клиентов.
Для инвесторов и отраслевых наблюдателей в этом интервью наиболее важна не какая-то конкретная цифра, а направление изменения спроса на инфраструктуру ИИ: GPU по-прежнему важны, но узкие места распространяются; Nvidia остаётся ядром, но CPU, HBM-память, системы хранения и энергетические возможности дата-центров становятся новыми переменными; спрос на ИИ продолжает расти, но будущий успех, возможно, будет зависеть от того, кто сможет стабильно, надёжно и в масштабе поставлять эту сложную инфраструктуру.
Ниже приведён оригинальный текст:
CoreWeave считается инновационным лидером раннего рынка в сфере neocloud (новых облачных услуг).
Это единственный облачный провайдер, получивший высший рейтинг «Платина» от исследовательской организации SemiAnalysis в области ИИ. CoreWeave была основана в 2017 году и предоставляет крупномасштабные GPU-вычисления как стартапам, так и крупным предприятиям.
Недавно Key Context взял интервью у сооснователя и главного директора по развитию CoreWeave Браннина Макби и вице-президента по корпоративному развитию и инвесторским отношениям Ника Роббинса, чтобы обсудить текущее состояние спроса на ИИ и рынка neocloud.
Ниже приведены основные тезисы из отредактированной беседы:
Спрос на ИИ продолжает обостряться
Tae: Когда началась волна спроса на интеллектуальные агенты (AI agents)?
Браннин: Мы увидели реальное начало ещё в четвёртом квартале прошлого года. Тогда мы общались с клиентами на инженерном уровне, обсуждая продукты, которые они планировали вывести на рынок в первом квартале этого года.
Это всегда был очень важный ракурс для нас при рассмотрении потребностей клиентов. Между нами и клиентами существует глубокая взаимосвязанность на инженерном уровне. Именно эти отношения позволяют нам заранее видеть тенденции, а не пассивно реагировать на изменения после того, как они произошли.
Если смотреть на продукты на рынке ИИ, я бы сказал, что первый квартал стал моментом огромного переломного момента в инференсе (reasoning) и потреблении ИИ, и это ускорение продолжается до сих пор.
Tae: В каком состоянии находится спрос на ИИ сейчас? По сравнению с несколькими месяцами назад, нет ли в последние недели никаких признаков замедления?
Ник: Кажется, он обостряется с каждым днём по-новому.
Tae: Расскажите о тенденции роста спроса на CPU относительно GPU на волне интеллектуальных агентов. Вы будете развёртывать ряды стоек с CPU Vera рядом с серверами на GPU Nvidia?
Браннин: CoreWeave работает с CPU с 2023 года. У нас всегда был полный набор облачных продуктов. Так что вопрос не в том, начали ли мы добавлять CPU, а в том, что именно нужно клиентам? Растёт ли этот спрос в относительном выражении? Ответ очень чёткий: да, определённо.
С подъёмом возможностей интеллектуальных агентов и инференса в моделях растут и потребности в системах хранения данных по сравнению с предыдущими поколениями. Я считаю, эта тенденция продолжится.
Ник: Ответ на ваш вопрос — да. Вы определённо увидите множество CPU Vera, развёрнутых рядом с множеством серверов Vera Rubin. В прошлом году мы фактически коренным образом перепроектировали базовую схему дата-центра, оставив место для большего объёма памяти и большего количества CPU, чтобы их можно было развернуть рядом с GPU.
Мы сделали это, потому что занимаем очень уникальное положение во всей экосистеме. Мы — единственный независимый облачный провайдер, который обслуживает всех самых передовых пользователей технологий. Ни один другой независимый ИИ-облачный провайдер не может сказать, что Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia и другие являются его клиентами.
Это создаёт для нашего бизнеса полезный маховик или цикл положительной обратной связи: мы понимаем, куда клиенты ведут технологии, и планируем исходя из этого.
Узкое место больше не только GPU
Tae: В будущем вы будете в основном использовать CPU Nvidia Vera?
Ник: Это зависит от конкретной рабочей нагрузки. Нашими действиями движут потребности клиентов. Мы действительно ожидаем стать ранними и значительными пользователями CPU Vera, что мы уже и анонсировали. В настоящее время наш парк в основном состоит из AMD, но со временем это может измениться в зависимости от потребностей клиентов. Интерес клиентов к CPU Vera очень высок.
Браннин: Это также хороший повод рассказать, как работают наши контракты. Как вы знаете, более 98% наших доходов формируются по контрактам. Мы не гадаем, какую инфраструктуру хотят клиенты. Клиенты очень чётко говорят нам, какие конфигурации им нужны. Всё определяется клиентами. Именно клиенты определяют, что мы будем строить.
Tae: Расскажите о конкурентном ландшафте. Как вы выходите на рынок и конкурируете с такими neocloud, как SpaceX, Nebius, Oracle, и гипермасштабными облачными провайдерами, такими как Azure, AWS, Google?
Браннин: Что касается отличий, я предпочитаю смотреть с точки зрения сторонней валидации. За пределами Китая девять из десяти ведущих мировых ИИ-лабораторий используют нашу платформу. SemiAnalysis всегда ставит нас отдельно на высший уровень по производительности. Не думаю, что мы получаем такое распределение GPU из-за личной дружбы с Дженсеном (Хуангом, CEO Nvidia).
Это говорит о глубоком доверии поставщиков к нашему опыту исполнения и инженерным возможностям, уверенности в том, что мы можем наилучшим образом представить возможности их продуктов по всему миру.
Ник: Мы можем завоевать клиентов среди гипермасштабных облачных провайдеров, потому что мы очень хорошо справляемся с исполнением. Мы можем строить эти системы чрезвычайно быстро, и они отлично работают. Мы можем завоевать клиентов среди исследовательских лабораторий, потому что предоставляем самые производительные версии технологий и демонстрируем наилучшую эффективность на токен.
Мы можем завоевать корпоративных клиентов, потому что инфраструктура действительно хорошо работает, и мы создали отличный, лучший в своём классе оркестрационный слой, что также подтверждается рейтингом «Платина».
Но всё более важным становится то, что среди ИИ-облачных провайдеров мы создали самый зрелый слой возможностей, охватывающий инструменты для инференса и разработки, помогающий предприятиям действительно внедрять ИИ в производство.
Это означает, что мы создаём и поставляем продукты, которые в конечном итоге помогают предприятиям с относительно низким уровнем технической зрелости преобразовывать данные в модели, а модели — в интеллектуальных агентов, которые можно запускать внутри компании, и в этом процессе мы также можем перекрёстно продавать облачные услуги CoreWeave.
Tae: Что сейчас является узким местом? Готовые дата-центры с питанием (powered shells)? GPU? Или электрики?
Браннин: Powered shells, то есть дата-центры с готовым энергоснабжением. Если точнее, то компоненты внутри этих корпусов. Вы правильно упомянули электриков — это сложная область.
Но важно то, что у нас уже работает 49 таких площадок. Мы не возлагаем надежды на одну-две площадки. Мы сделали это 49 раз.
Это очень богатый опыт исполнения.
Это также означает, что мы накопили огромный объём знаний о том, как справляться с проблемами цепочки поставок, знаем, с какими поставщиками в этой цепочке стоит сотрудничать, а с какими — нет.
Tae: Что вы можете рассказать о стоимости и дефиците памяти HBM? Как вы с этим справляетесь? Приходится ли клиентам нести повышенные расходы?
Ник: Ответ — да. Наша бизнес-модель построена так, что, подписывая заказ на закупку GPU и определяя, сколько мы за них заплатим, мы одновременно фиксируем цену, по которой будем взимать плату с клиентов за GPU. В более широком смысле — это цена за сервер, которая, очевидно, включает стоимость HBM.
Так мы изолируем себя от влияния ежедневных колебаний цен.
Если в следующей сделке стоимость наших компонентов возрастёт, мы отразим это в цене, которую, по нашему мнению, можем взимать с клиентов, защищая тем самым свою маржу. Мы хорошо защищены в плане передачи этих затрат клиентам. Это то, за чем мы очень внимательно следим.
На данный момент получение компонентов — не самое большое узкое место. Самое большое узкое место — это powered shells. Но в будущем этот ответ может меняться.
Tae: Как, по вашим ожиданиям, будет происходить наращивание развёртывания Vera Rubin? Что будет во второй половине этого года?
Ник: Мы, очевидно, стали первой компанией в мире, которая запустила и полностью валидировала VR, то есть стойку Vera Rubin. В прошлом году мы сделали то же самое с GB200, GB300. Я ожидаю, что VR начнёт появляться позднее в этом году.
Я ожидаю, что действительно масштабное, очень сильное наращивание развёртывания будет происходить на протяжении всего 2027 года. Этот темп аналогичен GB: GB начал появляться в 2025 году, но действительно массовое наращивание фактически происходило на протяжении всего 2026 года. То есть, к концу прошлого года было развёрнуто немало, но именно этот год — год действительно массового развёртывания GB.
Я ожидаю, что в ближайшие 12–18 месяцев VR будет демонстрировать очень похожий темп.








