1 июня, на выставке COMPUTEX, NVIDIA на конференции GTC Taipei 2026 представила процессор Vera CPU и новое поколение AI-суперкомпьютерной платформы Vera Rubin. Первыми клиентами стали OpenAI и Anthropic.
Это первый в истории NVIDIA отдельный продукт в линейке CPU. Рост компании за последние 20 лет почти полностью строился на GPU. Генеральный директор NVIDIA Дженсен Хуанг на презентации заявил, что в эпоху AI-агентов CPU стал ключевым узким местом в производительности дата-центров, и нельзя позволить процессору замедлять скорость производства токенов на «AI-фабрике».
Ранее, в мае, генеральный директор AMD Лиза Су на конференц-звонке по финансовым результатам объявила об увеличении прогноза размера рынка серверных CPU с 60 миллиардов долларов до более чем 120 миллиардов долларов, что соответствует повышению среднегодового темпа роста (CAGR) с 18% до 35% в период с 2025 по 2030 годы.
Согласно данным IDC, в 2025 году глобальный рынок серверов достиг 444,1 миллиарда долларов, что на 80,4% больше, чем в предыдущем году, причем большая часть роста пришлась на AI-серверы. В недавнем отчете о полупроводниковой отрасли UBS прогнозируется, что потенциальный размер рынка серверных CPU вырастет примерно с 30 миллиардов долларов в 2025 году до примерно 170 миллиардов долларов в 2030 году, увеличившись почти в 5 раз за 5 лет.
Данные исследовательской компании Mercury Research показывают, что в первом квартале 2026 года доля AMD в доходах от серверных CPU достигла 46,2%, а Intel — 53,8%. Однако доля AMD в объемах поставок составила лишь 33,2%, в то время как Intel сохранила 66,8%. Это означает, что AMD создала более высокие доходы, используя меньшее количество чипов, а премиальность продуктов с большим числом ядер ярко проявилась в этом квартале.
Ведущий аналитик ChipSays ICTIME Линь Мэйбин рассказал Economic Observer, что CPU стал самой неожиданной переменной в текущем цикле AI. По мере перехода AI от диалога к агентам (Agent), спрос на CPU для инференса уже превысил спрос для обучения.
GPU «ждет» CPU
В ноябре 2025 года Intel совместно с Технологическим институтом Джорджии опубликовала статью под названием «Взгляд на агентный AI с точки зрения CPU (A CPU-Centric Perspective on Agentic AI)». В этом исследовании команда провела тестирование пяти типичных рабочих нагрузок агентов, и результаты показали, что время, затрачиваемое на обработку инструментов на стороне CPU, составляет от 43,8% до 90,6% от общей задержки.
Аналитик одного из брокерских агентств, долгое время отслеживающий полупроводниковый сектор, заявил, что на этапе обучения больших моделей доля рабочей нагрузки CPU составляет всего около 10-30%, а для некоторых рабочих нагрузок может достигать почти 40%, при этом подавляющая часть вычислений выполняется GPU. Это связано с тем, что вычислительный процесс обучения больших AI-моделей высоко структурирован: миллиарды параметров многократно выполняют матричные умножения на огромных объемах данных. Параллельная архитектура GPU как раз предназначена для таких задач. CPU в этом процессе отвечает за загрузку данных, коммуникацию и копирование результатов, не затрагивая основные матричные операции.
Однако на этапе инференса эта пропорция меняется. Доля рабочей нагрузки CPU возрастает до более чем 70%, а в сценариях с агентами — еще выше. Это связано с тем, что задачи агентов требуют многошагового логического вывода, вызова внешних инструментов, выполнения кода, чтения/записи баз данных, поиска в интернете, а затем составления промежуточных результатов в окончательный вывод.
Помощники по программированию, инструменты анализа данных, автоматизированные исследовательские агенты — все они относятся к этой категории и в настоящее время являются наиболее быстрорастущими сценариями применения больших моделей. Общей характеристикой этих работ является высокая интенсивность потока управления, сложное ветвление, частые операции ввода-вывода. Эффективность использования GPU при выполнении таких последовательных, фрагментированных задач заметно снижается.
Несколько представителей отрасли отметили, что в задачах агентов общая утилизация GPU обычно составляет менее 50%, что значительно ниже 70-85% в традиционных сервисах инференса. Потребление токенов при развертывании AI в виде агента обычно в 20-30 раз выше, чем при обычном диалоге, потому что за одним взаимодействием с пользователем часто скрываются десятки вызовов инструментов и промежуточных логических выводов.
Согласно прогнозам IDC, глобальное количество задач, выполняемых агентами в год, вырастет с примерно 44 миллиардов в 2025 году до более 400 триллионов в 2030 году.
Руководство Intel на телеконференции по итогам первого квартала 2026 года заявило, что в эпоху AI-агентов количество ядер CPU, необходимых на гигаватт мощности, может вырасти с текущих примерно 30 миллионов до 120 миллионов. Исследовательская компания Gartner также прогнозирует, что к 2027 году 40% проектов, связанных с агентами, будут сокращены или отменены из-за превышения затрат на инфраструктуру, причем значительная часть перерасхода связана с постоянными затратами на стороне CPU, вызванными вызовами инструментов и управлением контекстом.
Агенты генерируют большой объем промежуточных данных при обработке длинных диалогов и сложных задач. AI-системе необходимо запоминать все предыдущее содержание диалога и результаты вызовов инструментов в процессе логического вывода. На профессиональном жаргоне это называется KV Cache (кэш ключ-значение). Он постоянно растет с каждым раундом диалога, но объем собственной памяти GPU очень ограничен: у NVIDIA H100 всего 80 ГБ, у следующего поколения B200 — 192 ГБ. Промежуточные данные, создаваемые сложной задачей агента, могут легко превысить этот предел.
В настоящее время общепринятым в отрасли решением является перенос этих промежуточных данных с GPU на сторону CPU. К CPU можно подключить память DDR5 объемом в несколько терабайт на один чип, что на один-два порядка больше, чем память GPU.
Альянс CXL (Compute Express Link), в который входят Intel, AMD, ARM и другие производители чипов, в ноябре 2025 года выпустил протокол CXL 4.0 (открытый стандарт для высокоскоростного межсоединения между чипами), позволяющий нескольким процессорам CPU совместно использовать один общий пул памяти большой емкости, уменьшая затраты на перемещение данных между чипами.
Таким образом, CPU теперь отвечает не только за планирование задач, но и за хранение данных и управление памятью в процессе AI-инференса.
Кроме того, сам CPU за последние годы претерпел интенсивные технологические обновления. Количество ядер в серверных CPU увеличилось с 28 в 2017 году до 288 в 2026 году (Intel Clearwater Forest) и 256 (AMD Venice), что означает рост плотности почти в 10 раз.
Intel в 2023 году представила набор инструкций AMX (Advanced Matrix Extensions), благодаря которому CPU впервые получил специализированный блок для матричных вычислений. Согласно тестовым данным Intel, в сценариях инференса глубокого обучения производительность AI процессоров Xeon 4-го поколения с AMX увеличилась почти в 10 раз по сравнению с предыдущим поколением. Подсистема памяти также обновилась с DDR4 до DDR5, обеспечив удвоение пропускной способности и емкости на одной платформе.
Увеличение количества ядер и обновление наборов инструкций также соответствуют изменению соотношения CPU и GPU. Генеральный директор Intel Чан Лиу на телеконференции по итогам первого квартала 2026 года заявил, что в сценариях обучения обычно используется 7-8 GPU на 1 CPU, в сценариях инференса это соотношение сокращается до 3-4 GPU на 1 CPU, а в сценариях с агентами有望有望有望 (ожидается) дальнейшее сближение до 1:1.
Финансовый директор Intel Дэвид Зинснер (David Zinsner) на той же телеконференции добавил, что общее соотношение CPU и GPU в отрасли уже сократилось с прежнего 1:8 до примерно 1:4.
Первое значительное повышение цен за более чем десятилетие
Эти изменения в соотношении уже повлияли на ценообразование продуктов.
Ответственный за рынок одного из дистрибьюторов CPU в Шэньчжэне Цзя Бинь рассказал журналистам, что с февраля 2026 года Intel и AMD начали постепенно повышать цены на всю линейку серверных CPU. Общий рост составил от 10% до 15%, при этом премии на наличные поставки некоторых высококлассных AI-серверных CPU были еще выше. Во второй половине года может последовать новый раунд повышения цен.
Цзя Бинь сказал, что за последние десять с лишним лет серверные CPU в основном «добавляли производительность без повышения цены»: производительность росла с развитием техпроцесса, но цена оставалась неизменной. Повышение цен в этом году — редкое явление в отрасли. Коэффициент загрузки основных производственных линий Intel вырос с прежних менее 80% до 100%, многие модели отсутствуют в наличии, сроки поставки составляют 3-4 месяца.
AMD также сталкивается с напряженной ситуацией с производственными мощностями. Цзя Бинь отметил, что 2026 год стал первым за время его работы в отрасли, когда производственные мощности серверных CPU и Intel, и AMD были практически полностью загружены заказами. «Раньше поставки CPU всегда были достаточными, в этом году все наоборот».
Цзя Бинь также обратил внимание на то, что спрос клиентов на CPU при закупке AI-серверов сейчас делится на два типа. Первый тип — это CPU внутри серверных шкафов, работающие совместно с GPU для вычислений. Они ориентированы на максимальное количество ядер — более 128, средняя цена составляет более 4000 долларов, тогда как средняя цена традиционных серверных CPU составляет лишь чуть более 2000 долларов. Второй тип — это CPU, развернутые независимо вне серверных шкафов, для выполнения инструментов агентами, запуска песочниц и оркестрации задач. Им не нужна максимальная производительность, достаточно около 64 ядер, но их количество должно быть намного больше.
Цзя Бинь сказал, что в идеале каждая задача агента использует выделенный CPU. Независимое развертывание более эффективно, чем виртуализация с разделением. Средняя цена CPU вне шкафа составляет около 3000 долларов. «Чем выше количество ядер, тем больше рост цены, и он не пропорционален. Поэтому текущая распространенная практика клиентов — использовать среднеуровневые продукты для массового развертывания вне шкафов и флагманские продукты для обеспечения производительности внутри шкафов».
В отчете о полупроводниковой отрасли под названием «Восход агентов (Rise of the Agents)», опубликованном Bank of America Securities 11 июня, прогноз общего потенциального размера рынка (TAM) серверных CPU к 2030 году был повышен до более чем 170 миллиардов долларов. Впервые этот рынок был разделен на три части: традиционные облачные CPU — около 30 миллиардов долларов, CPU головных узлов AI-кластеров — около 70 миллиардов долларов, CPU независимых узлов для AI-агентов — около 70 миллиардов долларов. Третья часть в 2025 году имела размер, близкий к нулю, и представляет собой совершенно новый рынок, начавший формироваться только в 2026 году.
Morgan Stanley в отчете от 4 июня также прогнозирует, что агентный AI к 2030 году принесет от 32,5 до 60 миллиардов долларов нового спроса на рынок серверных CPU. Zhongtai Securities в углубленном отчете о CPU от 7 июня назвала 2026 год «первым годом, когда CPU получает выгоду от экспансии AI».
В вышеупомянутом отчете Bank of America Securities также приведено историческое сравнение объемов поставок: в 2022 году объемы поставок AI CPU составляли 19% от объемов поставок AI-ускорителей (GPU и др.), к 2025 году этот показатель вырос до 51%, а к 2030 году, как ожидается, достигнет 127%. Согласно этому прогнозу, количество CPU в AI-серверах превысит количество GPU в течение 5 лет.
Новый спрос на отечественные CPU
Информация, опубликованная NVIDIA во время выставки COMPUTEX, показывает, что ее новейший Vera CPU основан на архитектуре ARM (набор инструкций CPU, известный низким энергопотреблением и высокой энергоэффективностью, наряду с x86 является одной из двух основных архитектур). В один серверный шкаф можно установить 256 таких процессоров, используется жидкостное охлаждение.
В сценариях песочниц для агентов производительность Vera в 1,8 раза выше, чем у процессоров x86. В новейшем суперкомпьютерном кластере Vera Rubin, представленном NVIDIA (платформа дата-центров следующего поколения для AI), один POD (минимальная полная вычислительная единица, состоящая из нескольких серверных шкафов) из 40 стоек содержит 1152 GPU Rubin и до 1088 CPU Vera, что дает соотношение, близкое к 1:1.
В NVIDIA также отметили, что ранее выпущенный Grace CPU был отгружен в количестве почти 2,5 миллиона штук, а доходы, связанные с CPU в 2026 году,有望有望有望 (могут) приблизиться к 20 миллиардам долларов.
Цзя Бинь считает, что упомянутые 20 миллиардов долларов представляют собой широкую статистическую выборку, включающую доходы от CPU в различных форм-факторах продуктов, что не полностью совпадает с доходом от продажи отдельных чипов CPU в традиционном понимании. Но даже с учетом различий в методологии, для компании, у которой в 2024 году еще не было самостоятельного бизнеса по CPU, этот объем уже значителен.
Линь Мэйбин считает, что сигнальное значение входа NVIDIA в производство CPU важнее самого продукта. Раньше AI-серверы были сосредоточены на GPU, а CPU был лишь вспомогательным компонентом. Когда крупнейшая в мире компания по производству GPU сама начала делать CPU и определила OpenAI и Anthropic в качестве своих первых клиентов, рыночная позиция CPU стала совершенно иной по сравнению с ситуацией двухлетней давности.
data-check-id="840005">Согласно финансовому отчету AMD за первый квартал 2026 года, доходы подразделения центра обработки данных компании достигли 5,775 миллиарда долларов, впервые превысив 5,1 миллиарда долларов у Intel за тот же период. Более того, Лиза Су на телеконференции по финансовым результатам обозначила пятилетнюю цель: выход годовой выручки подразделения центра обработки данных на уровень в 100 миллиардов долларов.Генеральный директор Intel Чан Лиу также в нескольких публичных выступлениях выразил твердую уверенность в ключевой роли CPU в эпоху AI.
Это также представляет возможность для китайских предприятий цепочки поставок CPU. Цзя Бинь заявил, что ведущие китайские облачные провайдеры в этом году увеличивают закупки серверных CPU. С одной стороны, это связано с закупкой CPU для новых AI-дата-центров в комплекте с GPU, с другой стороны, потому что соотношение CPU к GPU сократилось с прежнего 1:8 до 1:4 или даже больше, а значит, для одного и того же дата-центра требуется более чем в два раза больше CPU по сравнению с прошлым годом.
Фактически, в Китае вокруг серверных CPU сформировалась относительно полная цепочка поставок.
Hygon Information (688041.SH) в настоящее время является одним из крупнейших китайских производителей серверных CPU на архитектуре x86 по объемам поставок. Согласно соответствующим финансовым отчетам, выручка Hygon Information в 2025 году составила 14,377 миллиарда юаней, что на 56,92% больше, чем в предыдущем году. В первом квартале 2026 года выручка составила 4,034 миллиарда юаней, а темпы роста ускорились до 68,06%.
Согласно открытой информации, Huawei Kunpeng следует пути полной самостоятельной разработки на архитектуре ARM. Процессоры Kunpeng 920/950 тесно интегрированы с AI-чипами Ascend и в основном обслуживают собственную экосистему Huawei и рынок информационной инновации (信创).
Что касается вспомогательных чипов, то основным продуктом Montage Technology (688008.SH) являются чипы интерфейса памяти (чипы ретрансляции сигналов между серверным CPU и модулями памяти). Согласно открытой информации, в 2024 году ее доля на рынке чипов интерфейса памяти составила 36,8%, что вывело компанию на первое место в мире. Другая линейка продуктов — чипы PCIe Retimer (для усиления и восстановления сигналов при высокоскоростной передаче данных) — в 2024 году заняла 10,9% мирового рынка, заняв второе место.
В сегменте сборки, тестирования и производства, согласно открытой информации, Tongfu Microelectronics (002156.SZ) является одним из самых важных партнеров AMD в мире по упаковке и тестированию.
Ли Бинь (Li Bin) рассказал журналистам, что программная экосистема отечественных чипов приближается к переломному моменту. Он привел пример: в день выпуска DeepSeek V4 несколько отечественных производителей чипов завершили адаптацию в тот же день, тогда как ранее для адаптации DeepSeek R1 требовался период от 1 до 2 месяцев. Значительное ускорение адаптации свидетельствует о быстром созревании инструментальных цепочек и драйверного уровня программного обеспечения отечественных чипов, что является благоприятным фактором для всей цепочки поставок отечественных CPU и ускорителей.
По мнению Линь Мэйбина, логика выгоды для отечественных CPU делится на два уровня: первый — рост отрасли, вызванный увеличением мирового спроса на серверные CPU; второй — импортозамещение, стимулируемое политикой информационных инноваций (信创).
Согласно соответствующим требованиям документа, выпущенного Государственным комитетом по делам государственной собственности (SASAC) в 2022 году, государственные предприятия и предприятия, контролируемые государством, должны завершить локализацию своих информационных систем к концу 2027 года. В процессе интервью журналисты также выяснили, что уровень локализации высококлассных серверных CPU в Китае в настоящее время все еще относительно низок, а пространство для замещения обширно. До установленного политикой срока остается менее 2 лет, временное окно для поставок CPU в рамках «信创» сужается, что представляет собой серьезную проверку зрелости продуктов и способности к поставкам для таких отечественных производителей CPU, как Hygon Information, Loongson Technology (688047.SH) и других.
Линь Мэйбин считает, что текущий цикл повышения цен на CPU отличается от предыдущих: рост вызван совершенно новым спросом на CPU со стороны AI-агентов, а не спросом на обновление, обусловленным переходом на новые техпроцессы.
Суждение Ин Чживэя (Ying Zhiwei) аналогично. Он сказал, что в последние годы внимание рынка было почти полностью сосредоточено на GPU. Но когда приложения AI действительно вступают в фазу массового внедрения, функции планирования и управления, выполняемые CPU, будут только возрастать. По его мнению, речь идет не о том, что CPU заменит GPU — GPU по-прежнему важен. Однако в дальнейшем реальное различие будет заключаться в способности к взаимодействию между CPU и GPU, а не в параметрах производительности отдельного чипа.
Эта статья взята с официального аккаунта WeChat: Economic Observer , автор: Чжэн Чэнье








