Не зацикливайтесь на GPU: процессор становится «новым узким местом» эпохи ИИ

marsbitОпубликовано 2026-04-13Обновлено 2026-04-13

Введение

За последние годы в индустрии ИИ доминировала идея, что вычислительная мощность определяет пределы возможного, а GPU — её ядро. Однако к 2026 году ситуация изменилась: производительность систем всё больше зависит от возможностей выполнения и планирования задач. GPU по-прежнему важны, но ключевым элементом, определяющим, «заработает ли ИИ», становится CPU. Заключение многолетнего соглашения между Google и Intel о развёртывании процессоров Xeon в дата-центрах для ИИ подтверждает этот сдвиг. Гендиректор Intel Пат Гелсингер подчеркнул, что ИИ работает на всей системе, где CPU и IPU критичны для производительности, эффективности и гибкости. Внезапный дефицит CPU, вызванный ростом цен на 30% в 4 квартале 2025 года и увеличением сроков поставок, усугубляется «вторичным эффектом»: производители полупроводников, такие как TSMC, отдают приоритет более прибыльным заказам на GPU, сокращая выпуск CPU. Основная причина — изменение роли CPU в эпоху ИИ-агентов. Если в чат-ботах CPU лишь управлял данными, а GPU выполнял вычисления, то теперь CPU должен координировать сложные многоэтапные задачи, вызовы API, работу с базами данных и интеграцию результатов. Исследование показало, что на обработку инструментов CPU приходится 50–90,6% задержки. Расширение контекстного окна до 1 млн токенов также увеличивает нагрузку на CPU, который теперь управляет кэшем данных, не помещающимся в память GPU. Крупные игроки реагируют по-разному: Intel делает ставку на Xeon и партнёрства, AMD наращивает долю на...

В годы бурного развития ИИ отраслью практически управляла одна логика: вычислительная мощность определяет потолок возможностей, а GPU — это ядро вычислительной мощности.

Однако к 2026 году эта логика начала меняться: вывод моделей больше не является единственным узким местом, производительность системы все больше зависит от возможностей выполнения и планирования. GPU по-прежнему важен, но ключ к тому, «заработает ли ИИ», постепенно смещается в сторону долгое время игнорируемого CPU.

9 апреля по местному времени США Google и Intel заключили многолетнее соглашение о масштабном развертывании «процессоров Intel Xeon» в глобальных дата-центрах ИИ именно для решения этой проблемы. Генеральный директор Intel Чен Лиу прямо заявил, что ИИ работает на всей системе, и именно CPU и IPU являются ключом к производительности, эффективности и гибкости. Другими словами, CPU, который последние два года считался «второстепенным игроком», теперь «душит» расширение возможностей ИИ.

Генеральный директор Intel Чен Лиу в социальных сетях заявил: Intel углубляет сотрудничество с Google, распространяя его с традиционных CPU на инфраструктуру ИИ (такую как IPU), чтобы совместно продвигать возможности ИИ и облачных вычислений.

CPU больше не является просто пассивным вспомогательным компонентом, а становится одной из ключевых переменных в инфраструктуре ИИ.

01 «Тихий» кризис поставок

Пока все следили за сроками поставок GPU, напряженность на рынке CPU уже достигла пика.

Согласно последним отчетам нескольких ИТ-дистрибьюторов, в четвертом квартале 2025 года средняя цена серверных CPU выросла примерно на 30%. Такой рост на относительно зрелом рынке CPU является весьма редким.

Глава подразделения центров обработки данных AMD Форрест Норрод (Forrest Norrod) сообщил, что за последние три квартала спрос на CPU рос быстрее, чем можно было представить. В настоящее время цикл поставок AMD увеличился с первоначальных восьми недель до более чем десяти недель, а некоторые модели сталкиваются с задержками до шести месяцев.

Этот дефицит в основном вызван «вторичным эффектом», приводящим к вытеснению ресурсов. По словам некоторых представителей отрасли, из-за крайней загруженности 3-нм производственной линии TSMC, мощности пластин, первоначально выделенные для CPU, постоянно вытесняются более прибыльными заказами на GPU. Это привело к крайне ироничной ситуации: лаборатории ИИ получили достаточно GPU, но обнаружили, что на рынке невозможно купить достаточно мощных CPU, чтобы «запустить» эти видеокарты.

В этой волне скупки CPU поучаствовал и Илон Маск (Elon Musk).

Генеральный директор Intel Чен Лиу подтвердил на платформе социальных сетей, что Маск поручил Intel разработать и произвести定制ные чипы для своего проекта «Terafab» в Техасе. Этот масштабный проект旨在 создать единую вычислительную базу для xAI, SpaceX и Tesla.

Доверие Маска к Intel во многом объясняется тем, что Intel пытается внедриться на каждый уровень — от наземных центров обработки данных до орбитальных вычислений в космосе.

Для Intel это, несомненно, долгожданная поддержка. Некоторые отраслевые аналитики预测, что доля доходов AMD на рынке серверных CPU превысит долю Intel в 2026 году, но глубокая инерция и производственные возможности Intel в экосистеме x86 по-прежнему являются козырем, который крупные клиенты, подобные Маску, не могут игнорировать.

Такое глубокое межотраслевое взаимодействие превращает конкуренцию на рынке CPU из простого соревнования параметров в игру экосистем и стабильности цепочек поставок.

02 Почему CPU стал «слабым звеном»?

Внезапное превращение CPU в узкое место связано с fundamentalным изменением характера работы, которую ему приходится выполнять в эпоху агентов.

В традиционной модели чат-ботов CPU в основном отвечает за планирование и обработку данных, а GPU承担核心推理计算. Поскольку вычислительно-емкие этапы сосредоточены на стороне GPU, общая задержка обычно определяется GPU, и CPU редко становится узким местом производительности.

Но рабочая нагрузка агентов совершенно иная. Агенту необходимо выполнять многошаговые рассуждения, вызывать API, читать и записывать базы данных, orcheстрировать сложные бизнес-процессы и интегрировать промежуточные результаты в окончательный вывод. Такие задачи, как поиск, вызов API, выполнение кода, файловый ввод-вывод и orchestration результатов, в основном ложатся на CPU и主机系统. GPU отвечает за генерацию токенов (т.е. «мышление»), а CPU负责 преобразование результатов «мышления» в конкретные действия.

В статье «Взгляд на агентный ИИ с процессоро-центричной точки зрения» (A CPU-Centric Perspective on Agentic AI), опубликованной учеными Технологического института Джорджии в ноябре 2025 года, был проведен количественный анализ распределения задержек в рабочей нагрузке агентов. Исследование показало, что время, затрачиваемое на обработку инструментов на стороне CPU, составляет от 50% до 90,6% общей задержки. В некоторых сценариях GPU был готов обработать следующую партию задач, а CPU все еще ждал возврата от вызова инструмента.

Другим ключевым фактором является быстрое расширение контекстного окна. В 2024 году большинство主流 моделей поддерживали 128–200 тыс. токенов. К 2025 году такие модели, как Gemini 2.5 Pro, GPT-4.1, Llama 4 Maverick, начали поддерживать 1 млн+ токенов. Кэш KV (Key-Value Cache, используемый для ускорения процесса вывода моделей Transformers) растет линейно с количеством токенов, составляя около 200 ГБ при 1 млн токенов, что значительно превышает объем памяти одной видеокарты H100 (80 ГБ).

Одним из решений этой проблемы является частичная выгрузка кэша KV в оперативную память CPU. Это означает, что CPU должен управлять не только orchestration и вызовами инструментов, но и помогать обрабатывать данные, которые не помещаются в видеопамять. Таким образом, объем оперативной памяти CPU, пропускная способность памяти и скорость соединения между CPU и GPU становятся ключевыми для производительности системы.

Следовательно, CPU, подходящий для эпохи агентов,更需要 низкую задержку, согласованную способность доступа к памяти и более сильные возможности системного уровня, а не простое наращивание ядер.

03 Что делают производители? Кто-то захватывает территории, кто-то меняет设计

Столкнувшись с этим внезапным всплеском спроса на CPU, крупные производители выбрали совершенно разные стратегии.

Intel — традиционный лидер на рынке серверных CPU. По данным Mercury Research, в четвертом квартале 2025 года доля Intel на рынке серверных CPU仍然 составляла 60%, AMD — 24,3%, NVIDIA — 6,2%. Но все эти годы Intel一直在追赶新技术, и этот всплеск спроса на CPU является как возможностью, так и испытанием для них.

Текущая стратегия Intel — идти двумя путями. С одной стороны, продолжать продавать процессоры Xeon, тесно связываясь с крупномасштабными клиентами, такими как Google; с другой стороны, сотрудничать с SambaNova, предлагая комбинированные решения на основе процессоров Xeon и их собственных акселераторов RDU, с主打卖点 «возможность запуска推理 агентов без GPU». Дорожные карты Xeon 6 Granite Rapids и технологии 18A станут ключевым испытанием способности Intel переломить ситуацию.

AMD является одним из крупнейших бенефициаров этого всплеска спроса на CPU. В четвертом квартале 2025 года выручка центра обработки данных AMD составила 5,4 млрд долларов, увеличившись на 39% год к году. Пятое поколение EPYC Turin占了 более половины доходов от серверных CPU, развертывание облачных инстансов на EPYC выросло более чем на 50% год к году. Доля доходов AMD от серверных CPU впервые превысила 40%.

Генеральный директор AMD Лиза Су (Lisa Su)直接 связала причину роста с развитием «агентов» — рабочая нагрузка агентов «вернула» задачи к традиционным задачам CPU.

В феврале 2026 года AMD также объявила о потенциальной сделке с Meta стоимостью более 100 млрд долларов на поставку GPU MI450 и CPU Venice EPYC.

Однако у AMD все еще есть возможности для улучшения на системном уровне协同, не хватает зрелых возможностей高速 соединения CPU-GPU, подобных NVLink C2C. По мере того, как системы агентов предъявляют все более высокие требования к эффективности взаимодействия и协同 данных, важность этого аспекта также постепенно возрастает.

Подход NVIDIA к проектированию CPU полностью отличается от подходов Intel и AMD.

Процессор NVIDIA Grace имеет всего 72 ядра, в то время как AMD EPYC и Intel Xeon обычно имеют 128. Глава подразделения инфраструктуры ИИ NVIDIA Дион Харрис (Dion Harris) объяснил: «Если вы — крупномасштабный企业, вы хотите максимизировать количество ядер на каждый CPU, что基本上 снизит стоимость, то есть стоимость в долларах за ядро. Так что это бизнес-модель.»

Другими словами, в системе вычислений ИИ роль CPU больше не является основной для универсальных вычислений, а представляет собой «центр планирования», обслуживающий GPU. Если CPU не успевает, дорогостоящие GPU вынуждены ждать, и общая эффективность反而 падает.

Поэтому при проектировании NVIDIA优先 обеспечивает高效协同 между CPU и GPU. Например, с помощью соединения NVLink C2C пропускная способность между CPU и GPU увеличивается до примерно 1,8 ТБ/с, что значительно выше традиционного PCIe, CPU может напрямую обращаться к памяти GPU, что значительно упрощает управление кэшем KV.

В настоящее время NVIDIA уже продает процессор Vera как独立ный продукт. CoreWeave стал первым клиентом. Сделка с Meta еще более масштабна: это第一次大规模「чистого развертывания Grace», то есть大规模独立ного развертывания CPU без配对 GPU.

Главный аналитик Creative Strategies Бен Баджарин (Ben Bajarin) отметил, что в условиях высокой интенсивности системного взаимодействия вычислительная мощность CPU должна соответствовать скорости итерации акселераторов. Если в канале передачи данных возникает даже однопроцентная задержка, экономическая эффективность всего кластера ИИ значительно снижается. Это стремление к максимальной системной эффективности заставляет всех крупных производителей重新评估 показатели производительности CPU.

Вице-президент и главный аналитик Constellation Research Хольгер Мюллер (Holger Mueller) заявил, что по мере перехода рабочих нагрузок ИИ на агентно-ориентированную архитектуру роль CPU становится все более центральной. Он отметил: «В мире агентов агентам необходимо вызывать API и различные бизнес-приложения, эти задачи最适合 для выполнения на CPU.»

Он также добавил: «В настоящее время нет единого мнения о том, что更适合 для处理 задач вывода — GPU или CPU. GPU имеют преимущество в обучении моделей, а定制ные ASIC, такие как TPU, также имеют свою специализацию. Но одно ясно: Google необходимо采用 гибридную процессорную архитектуру. Поэтому выбор Google в пользу сотрудничества с Intel является обоснованным».

04 Заключение: В эпоху агентов天平 вычислительной мощности качнулась обратно

В последних отраслевых наблюдениях следует обратить внимание на одни данные. В рамках соглашения о сотрудничестве между Amazon AWS и OpenAI на сумму 38 млрд долларов в官方ном заявлении также четко упоминается масштаб расширения в «десятки миллионов CPU».

В последние годы внимание отрасли обычно было приковано к «сотням тысяч GPU». Однако то, что передовые лаборатории, такие как OpenAI,主动 рассматривают масштаб CPU как важную переменную планирования, посылает четкий сигнал: расширение рабочей нагрузки агентов должно основываться на огромной инфраструктуре CPU.

Bank of America预测, что к 2030 году мировой рынок CPU может удвоиться с текущих 27 млрд долларов до 60 млрд долларов.几乎 вся эта доля будет обусловлена ИИ.

Мы являемся свидетелями начала расширения全新的 инфраструктуры: крупные производители больше не просто наращивают GPU, а同步 расширяют целый уровень «инфраструктуры планирования CPU», специально предназначенной для поддержки работы агентов ИИ.

Объединение усилий Intel и Google, а также крупные инвестиции Маска в定制ные чипы доказывают один факт: точка превосходства в гонке ИИ смещается. Когда вычислительная мощность перестает быть дефицитом, победит в этой игре на триллионы долларов тот, кто最先 решит проблему системного «узкого места».

*Приглашенный编译 Цзинь Лу также внес вклад в эту статью.

Эта статья来自微信公众号「Tencent Technology», автор: Ли Хайлунь, редактор: Сюй Цинъян

Трендовые криптовалюты

CitreaCTR

wrapped stUSDTWSTUSDT

Velodrome FinanceVELODROME

BrevisBREV

PancakeSwapCAKE

JUSTJST

Связанные с этим вопросы

QПочему CPU становится новым узким местом в эпоху ИИ, согласно статье?

ACPU становится узким местом, потому что в эпоху агентного ИИ нагрузка сместилась: CPU теперь отвечает за выполнение многошаговых рассуждений, вызовы API, работу с базами данных и оркестрацию сложных рабочих процессов, что занимает 50-90,6% общей задержки, в то время как GPU в основном генерирует токены.

QКакое соглашение заключили Google и Intel, и как оно связано с проблемой CPU?

AGoogle и Intel заключили многолетнее соглашение о крупномасштабном развертывании процессоров Intel Xeon в дата-центрах Google для ИИ, чтобы решить проблему нехватки производительности CPU, которая стала ограничивать масштабирование ИИ-систем.

QКак расширение контекстного окна моделей ИИ влияет на нагрузку CPU?

AРасширение контекстного окна до 1 млн+ токенов увеличивает объем KV-кэша примерно до 200 ГБ, что превышает объем памяти отдельных GPU (например, H100). Это вынуждает перемещать часть KV-кэша в память CPU, увеличивая нагрузку на CPU, его память и пропускную способность соединения с GPU.

QКаковы стратегии основных производителей (Intel, AMD, NVIDIA) в ответ на возросшую важность CPU для ИИ?

AIntel: углубляет сотрудничество с крупными клиентами (Google) и предлагает гибридные решения (Xeon + RDU-ускоритель). AMD: извлекает выгоду от роста спроса, его EPYC Turin доминирует в продажах, но не хватает высокоскоростного соединения CPU-GPU. NVIDIA: разрабатывает специализированные CPU (Grace) с упором на эффективное взаимодействие с GPU через NVLink C2C, рассматривая CPU как "центральный планировщик" для GPU.

QКакой прогноз относительно рынка CPU в контексте развития ИИ представлен в статье?

AАналитики из Bank of America прогнозируют, что к 2030 году мировой рынок CPU вырастет с текущих 27 миллиардов долларов до 60 миллиардов долларов, и этот рост почти полностью будет driven by спросом со стороны технологий искусственного интеллекта.

Похожее

Внимание: на этой неделе произойдёт масштабное разблокирование токенов в 10 альткоинах! Вот список по дням и часам

В последнюю неделю рынок криптовалют испытал спад из-за хакерской атаки на аппаратный кошелек ColdCard и влияния геополитических событий. Однако на текущей неделе ожидается масштабное разблокирование токенов в 10 альткоинах, что может оказать значительное влияние на их рынки. Все время указано по UTC+3. Основные события разблокировки: * **4 августа, 03:00:** Lagrange (LGN) – разблокируется токенов на $1,38 млн (15.04% от рыночной стоимости). * **5 августа, 03:00:** Proof (PROOF) – разблокируется на $39,11 млн (119.59%), Power Protocol (POWER) – на $1,62 млн (8.93%), Verona (VERONA) – на $1,37 млн (12.61%). * **5 августа, 11:00:** Ethereum (ENA) – разблокируется на $15,28 млн (1.80%). * **6 августа, 03:00:** Goldfinger (GF) – на $11,52 млн (5.05%). * **7 августа, 03:00:** Infinity (INF) – на $2,31 млн (20.30%). * **8 августа, 03:00:** Stable (STBL) – на $28,75 млн (3.55%). * **9 августа, 03:00:** Name (NAME) – на $48,47 млн (74.54%), Move (MOVE) – на $1,22 млн (3.90%). Особое внимание стоит обратить на проекты Proof и Name, где объем разблокировки существенно превышает текущую рыночную капитализацию. Это не является инвестиционной рекомендацией.

cryptonews.ru51 мин. назад

Внимание: на этой неделе произойдёт масштабное разблокирование токенов в 10 альткоинах! Вот список по дням и часам

cryptonews.ru51 мин. назад

Опубликован список самых популярных альткоинов по запросам за последние часы!

Платформа CoinGecko опубликовала список самых популярных криптовалют по запросам пользователей за последние три часа. Возглавила тренды монета Pudgy Penguins ($PENGU) с рыночной капитализацией $389,13 млн. Второе и третье места заняли Catecoin (CATE, $19,62 млн) и Bless ($BLESS, $32,72 млн) соответственно. За последние 24 часа $PENGU вырос на 3,9%, тогда как CATE показал впечатляющий рост в 126,2%, а $BLESS — 86,1%. Также отмечен значительный прирост у What IF (IF) — 41,9%. В список наиболее запрашиваемых активов также вошли Ethereum (ETH, $224,17 млрд), Bitcoin (BTC, $1,27 трлн), Solana (SOL, $42,38 млрд), а также Hyperliquid (HYPE, $11,43 млрд) и другие. Полный перечень включает 15 позиций с указанием их рыночной капитализации. Материал не является инвестиционной рекомендацией.

cryptonews.ru2 ч. назад

Опубликован список самых популярных альткоинов по запросам за последние часы!

cryptonews.ru2 ч. назад

За $100 000 в месяц: Truth Social продает доступ к постам Трампа инвестиционным фирмам

Корпорация Trump Media and Technology Group (TMTG) запустила платный сервис Truth API, предоставляющий институциональным инвесторам и фирмам, занимающимся высокочастотной торговлей, мгновенный доступ к постам самых влиятельных аккаунтов в Truth Social, включая аккаунт экс-президента Дональда Трампа. Стоимость подписки, по данным источников, может достигать $100 000 в месяц. Компания позиционирует это как стратегию по извлечению прибыли из собственных активов. Инициатива вызвала критику со стороны ряда сенаторов-демократов и республиканцев, которые обвинили TMTG в продаже привилегированного доступа к постам президента и потребовали проверки со стороны SEC. В ответ компания заявила о скоординированной кампании по нанесению вреда её бизнесу. Анализ отмечает, что подобный сервис создает архитектуру риска, аналогичную случаям, когда торговые алгоритмы в прошлом вызывали обвал рынков, реагируя на фейковые сообщения в соцсетях. Отсутствие встроенного механизма верификации постов в реальном времени делает платформу потенциальной целью для манипуляций.

cryptonews.ru3 ч. назад

За $100 000 в месяц: Truth Social продает доступ к постам Трампа инвестиционным фирмам

cryptonews.ru3 ч. назад

Дивиденды по привилегированным акциям STRC остаются на уровне 12% несмотря на цену ниже номинала

Хотя привилегированные акции STRC компании Strategy завершили июль значительно ниже номинальной стоимости в $100, инвесторам сообщили, что дивиденд за август останется на уровне 12% и не будет увеличен. Акции закрылись 2 августа на уровне $89.46. Генеральный директор Фонг Ле подтвердил, что корпоративная цель — достичь торговли акциями в диапазоне $99-$100, но не уточнил сроки. В июле компания сообщила о чистом убытке в $8.22 млрд за второй квартал, в основном из-за нереализованных потерь на хранении биткоина. Для обеспечения выплат по привилегированным акциям Strategy создала денежный резерв в $3.75 млрд, которого хватит более чем на два года. Компания также выкупила часть своих привилегированных акций со скидкой и намерена продолжать покупки, пока они торгуются ниже номинала.

cointelegraph4 ч. назад

Дивиденды по привилегированным акциям STRC остаются на уровне 12% несмотря на цену ниже номинала

cointelegraph4 ч. назад

Вывод биткоинов продолжается: 8 лет хранения в холодном кошельке Coldcard закончились нулем

Аппаратный кошелек Coldcard оказался уязвимым, что привело к масштабному выводу средств. По данным Galaxy Research на 2 августа 2026 года, похищено уже более 1367 BTC (около $88.6 млн) с 4585 адресов. Проблема связана не с прошивкой, а с seed-фразами, сгенерированными на уязвимых устройствах в определенный период (Mk2/Mk3 с прошивкой 4.0.1–4.1.9; Mk4/Mk5 до версии 5.6.0; Q до версии 1.5.0Q). Причина — ошибка в интеграции библиотеки libNgU, из-за которой устройство перестало использовать аппаратный генератор случайных чисел, перейдя на предсказуемый программный. Обновление прошивки не меняет существующую seed-фразу, поэтому владельцам необходимо сгенерировать новую на исправленной версии и перевести активы. Статья приводит трагичный пример 39-летнего инвестора, который за 8 лет накопил 2 BTC тяжелым трудом, храня их в Coldcard как защиту от гиперинфляции в своей стране, но потерял все за минуты из-за этой уязвимости. Этот случай показывает, что даже стратегия холодного хранения не является абсолютно надежной, особенно когда уязвимость кроется в самом генераторе случайных чисел внутри изолированного устройства.

cryptonews.ru5 ч. назад

Вывод биткоинов продолжается: 8 лет хранения в холодном кошельке Coldcard закончились нулем

cryptonews.ru5 ч. назад

Торговля

Спот

Обсуждения

Добро пожаловать в Сообщество HTX. Здесь вы сможете быть в курсе последних новостей о развитии платформы и получить доступ к профессиональной аналитической информации о рынке. Мнения пользователей о цене на ERA (ERA) представлены ниже.

Не зацикливайтесь на GPU: процессор становится «новым узким местом» эпохи ИИ

Введение

01

«Тихий» кризис поставок

02

Почему CPU стал «слабым звеном»?

03

Что делают производители? Кто-то захватывает территории, кто-то меняет设计

04

Заключение: В эпоху агентов天平 вычислительной мощности качнулась обратно

Трендовые криптовалюты

Связанные с этим вопросы

Похожее

Внимание: на этой неделе произойдёт масштабное разблокирование токенов в 10 альткоинах! Вот список по дням и часам

Опубликован список самых популярных альткоинов по запросам за последние часы!

За $100 000 в месяц: Truth Social продает доступ к постам Трампа инвестиционным фирмам

Дивиденды по привилегированным акциям STRC остаются на уровне 12% несмотря на цену ниже номинала

Вывод биткоинов продолжается: 8 лет хранения в холодном кошельке Coldcard закончились нулем

Торговля

Популярные статьи

Как купить ERA

Обсуждения

Топ вопросы

Популярные категории

Популярные теги