CPU杀回牌桌，一场1700亿美元的“上位”大戏开启

marsbit发布于2026-06-19更新于2026-06-19

文章摘要

英伟达在2026年台北电脑展上首次发布独立CPU产品线Vera CPU，标志着其业务重心从GPU向更广阔的计算领域扩展。CEO黄仁勋指出，在AI智能体时代，CPU已成为数据中心性能的关键瓶颈。与此同时，AMD将服务器CPU市场规模预测大幅上调至1200亿美元以上，行业预测其潜在市场规模将在2030年达到约1700亿美元。市场格局正在发生变化。2026年一季度，AMD在服务器CPU收入份额上逼近英特尔，显示出高核数产品的强大溢价能力。分析指出，AI发展正从训练转向推理和智能体阶段，后者需要频繁进行复杂控制流、工具调用和数据处理，这些任务严重依赖CPU而非GPU。在智能体任务中，GPU利用率可能低于50%，而CPU工作量占比可达七成以上。这导致CPU与GPU的配比从过去的1:8显著收敛至1:4甚至1:1。需求变化直接推动了十多年来首次大规模涨价，英特尔和AMD服务器CPU价格普遍上涨10%-15%，且出现产能紧张。市场分化为配合GPU的高核数CPU和用于智能体任务编排的中核数批量CPU两类需求。英伟达基于ARM架构的Vera CPU入局，进一步凸显了CPU的战略地位。这对中国CPU产业链既是机遇也是挑战。国产CPU厂商如海光信息、华为鲲鹏等，既受益于全球AI需求增长，也面临信创政策带来的国产替代窗口期。行业共识是，AI大规模落地的关键已从单芯片性能转向CPU与GPU的协同能力。

6月1日,英伟达在台北电脑展期间举办的GTC Taipei 2026大会上发布了Vera CPU,其同期发布的新一代AI超算平台Vera Rubin,首批客户包括OpenAI和Anthropic。

这是英伟达第一次推出独立的CPU产品线,英伟达过去20年的增长几乎完全建立在GPU之上。英伟达CEO黄仁勋在发布会上表示,在AI智能体时代,CPU已经成为数据中心性能的关键瓶颈,不能让CPU拖慢AI工厂的token(词元)生产速度。

此前的5月份,AMD CEO苏姿丰在财报电话会上宣布,将服务器CPU的市场规模预测从600亿美元翻倍上调至1200亿美元以上,对应2025至2030年的复合年增长率从18%提高到35%。

根据IDC统计,2025年全球服务器市场规模达到4441亿美元,同比增长80.4%,其中AI服务器贡献了大部分增量。瑞银在近期的半导体行业研报中预测,服务器CPU的潜在市场规模将从2025年的约300亿美元增长到2030年的约1700亿美元,5年增长近5倍。

市场调研机构Mercury Research的数据显示,2026年一季度AMD的服务器CPU收入份额达到46.2%,英特尔为53.8%。但AMD的出货量份额只有33.2%,英特尔仍占到66.8%。也就是说,AMD用更少的芯片创造了更高的收入,高核数产品的溢价能力在这一个季度得到集中体现。

芯片说ICTIME首席分析师林美炳告诉经济观察报,CPU是当前这一轮AI周期里最超预期的变量。AI从对话走向Agent(智能体),推理对CPU的需求量已经超过训练。

GPU在“等”CPU

英特尔与佐治亚理工学院在2025年11月联合发表了题为《以CPU为中心的智能体AI视角(A CPU-Centric Perspective on Agentic AI)》的论文。在这篇论文中,研究团队对五类典型的Agent工作负载进行了实测,结果显示CPU端工具处理所占用的时间,达到总延迟的43.8%到90.6%。

一位长期跟踪半导体板块的券商分析师称,在大模型训练阶段,CPU的工作量占比大约只有一到三成,某些工作负载可能达到近四成,绝大部分计算由GPU承担。这是因为AI大模型训练的计算过程高度规整,数以亿计的参数在海量数据上反复做矩阵乘法,GPU的并行架构就是为这类任务设计的,CPU在其中负责数据加载、通信调度和结果拷贝,不涉及核心的矩阵运算。

但到了推理阶段,这个比例开始翻转。CPU承担的工作量占比上升到七成以上,Agent场景下会更高。因为Agent任务需要多步推理、调用外部工具、执行代码、读写数据库、搜索网页,然后将中间结果编排成最终输出。

编程助手、数据分析工具、自动化研究Agent都属于这一类,也是目前大模型应用中增长最快的场景。这些工作的共同特征是控制流密集、分支复杂、输入输出频繁,GPU面对这类串行、碎片化的任务利用率会明显下降。

多位业内人士表示,在Agent任务中,GPU的整体利用率普遍不到50%,远低于传统推理服务的70%到85%。Agent方式下AI部署的token消耗量通常是普通对话的20到30倍,因为一次用户交互背后往往包含数十次工具调用和中间推理。

据IDC预计,全球Agent年执行任务数将从2025年的约440亿次增长到2030年的超过400万亿次。

英特尔管理层在2026年一季度财报电话会上表示,AI智能体时代每吉瓦功耗所需的CPU核心数可能从当前的约3000万增长到1.2亿。市场研究机构Gartner也预测,到2027年将有40%的Agent项目因基础设施成本超支而被收缩或取消,其中相当一部分超支来自CPU端持续产生的工具调用和上下文管理开销。

Agent在处理长对话和复杂任务时会产生大量中间数据。AI系统在推理过程中需要记住之前所有的对话内容和工具调用结果,行业术语叫KV Cache(键值缓存),它会随着对话轮次不断膨胀,但GPU自带的存储容量非常有限,英伟达H100只有80GB,下一代B200也只有192GB,一个复杂的Agent任务产生的中间数据很容易就超过这个上限。

目前,业界普遍采用的办法是把这些中间数据从GPU转移到CPU一侧。CPU可以外挂DDR5内存,单颗容量达到数TB,比GPU存储大出一到两个数量级。

由英特尔、AMD、ARM等芯片厂商组成的CXL行业联盟在2025年11月发布了CXL 4.0协议(Compute Express Link,一种用于芯片之间高速互联的开放标准),允许多颗CPU共享同一个大容量内存池,减少数据在芯片之间搬运的开销。

由此,CPU不再只负责任务调度,还要负责AI推理过程中的数据存储和内存管理。

另外,CPU本身在过去几年也经历了密集的技术升级。服务器CPU的核心数从2017年的28核,攀升到2026年的288核(英特尔Clearwater Forest)和256核(AMD Venice),密度提升接近10倍。

英特尔在2023年引入了AMX(高级矩阵扩展)指令集,让CPU第一次具备专用矩阵计算单元。根据英特尔方面的测试数据,在深度学习推理场景下,搭载AMX的第四代至强处理器AI性能较前一代最高提升近10倍。内存子系统也从DDR4升级到DDR5,单平台带宽和容量均实现翻倍。

核心数和指令集的升级,也对应着CPU与GPU配比的变化。英特尔CEO陈立武在2026年一季度财报电话会上说,训练场景下通常是7到8颗GPU配1颗CPU,推理场景下收敛到3到4颗GPU配1颗CPU,Agent场景下有望进一步收敛至1:1。

英特尔CFO大卫·辛斯纳(David Zinsner)在同一场电话会上补充表示,行业整体的CPU与GPU配比已从过去的1:8收敛至约1:4。

十多年来首次大涨价

上述配比变化已经传导到产品定价上。

深圳一家CPU经销商的市场负责人贾彬告诉记者,从2026年2月起,英特尔和AMD陆续上调了全系列服务器CPU价格,整体涨幅在10%到15%之间,部分高端AI服务器CPU的现货溢价更高,下半年可能会有新一轮价格上调。

贾彬说,过去十多年,服务器CPU基本是“加量不加价”,性能随制程提升,但单价维持不变,今年的涨价幅度在行业里很少见。英特尔主力产线的产能利用率已经从此前不足80%上升到100%,多个型号处于缺货状态,交货周期在3到4个月。

AMD同样面临产能紧张。贾彬说,2026年是他入行以来第一次看到英特尔和AMD的服务器CPU产能基本被全部订满,“过去CPU的供给一直是充足的,今年反过来了”。

贾彬还注意到,客户在采购AI服务器时对CPU的需求正在分化成两类。一类是机柜内部配合GPU运算的CPU,追求极限核数,128核以上,均价在4000美元以上,传统服务器CPU均价只有2000多美元。另一类是机柜外部独立部署的CPU,用于Agent的工具执行、沙箱运行和任务编排,不需要极限性能,64核左右就够,但数量要大得多。

贾彬说,每个Agent任务在理想状态下独占一颗CPU,独立部署比虚拟化分区效率更高,柜外CPU均价约3000美元,“核数越高单价涨幅越大,不是按比例增长的。所以,柜外用中档产品铺量,柜内用旗舰产品保性能,是目前客户的普遍做法”。

美银证券在6月11日发布的一份题为《智能体崛起(Rise of the Agents)》的半导体行业研报中,将2030年服务器CPU的总潜在市场规模(TAM)预测上调至1700亿美元以上,并首次将这个市场拆成三个部分:传统云计算CPU约300亿美元,AI集群头节点CPU约700亿美元,AI智能体独立节点CPU约700亿美元。其中,第三个部分在2025年的规模接近于零,是2026年才开始出现的全新市场。

摩根士丹利在6月4日的一份研报中也预测,智能体AI将在2030年前为服务器CPU市场带来325亿至600亿美元的新增需求。中泰证券在6月7日发布的CPU深度研报中将2026年定义为“CPU受益AI放量的元年”。

上述美银证券研报还列出了一组出货量的历史对比:2022年AI CPU的出货量相当于AI加速器(GPU等)出货量的19%,到2025年这个比例升至51%,预计2030年将达到127%。按照这个预测,AI服务器中CPU的数量将在5年内超过GPU。

国产CPU的新需求

英伟达在台北电脑展期间公布的信息显示,其最新发布的Vera CPU基于ARM架构(一种以低功耗和高能效著称的CPU指令集,与x86并列为两大主流架构),单机柜可部署256颗,采用液冷散热。

在Agent沙箱场景中,Vera的性能是x86处理器的1.8倍。在英伟达最新发布的Vera Rubin超级计算集群(英伟达下一代AI数据中心平台)中,一个40机架的POD(由多个机架组成的最小完整计算单元)包含1152颗Rubin GPU和最多1088颗Vera CPU,两者配比接近1:1。

英伟达方面还提到,此前发布的Grace CPU已累计出货近250万颗,2026年CPU相关收入有望接近200亿美元。

贾彬认为,上述200亿美元的统计口径较宽,涵盖了CPU在多种产品形态中的收入归属,与传统意义上单独销售CPU芯片的收入不完全相同。但即便考虑口径差异,对一个2024年还没有独立CPU业务的公司来说,这个体量已经不小。

林美炳认为,英伟达做CPU的信号意义大于产品本身,过去AI服务器以GPU为核心,CPU只是配套,当全球最大的GPU公司亲自做CPU并把首批客户锁定为OpenAI和Anthropic,CPU的市场地位已经和两年前完全不同。

根据AMD2026年一季度财报,该公司数据中心业务收入达到57.75亿美元,首次超过英特尔同期的51亿美元。并且,苏姿丰在财报电话会上提出了一个五年目标:数据中心年营收迈向1000亿美元。

英特尔CEO陈立武也在多个公开场合表示,他对CPU在AI时代的核心作用抱有坚定信心。

这对中国的CPU产业链企业也是一个机会。贾彬称,国内头部云厂商今年在加大服务器CPU的采购力度,一方面是为新建AI数据中心配套GPU采购CPU,另一方面是因为CPU与GPU的配比从过去的1:8收敛到1:4甚至更高,同一个数据中心需要的CPU数量比去年多出一倍以上。

事实上,在国内,围绕服务器CPU已经形成了相对完整的产业链。

海光信息(688041.SH)是目前国内x86架构服务器CPU出货量最大的厂商之一。根据相关财报,海光信息2025年的营收为143.77亿元,同比增长56.92%;2026年一季度营收为40.34亿元,同比增速进一步提高到68.06%。

根据公开信息,华为鲲鹏走ARM全栈自研路线,鲲鹏920/950与昇腾AI芯片深度协同,主要服务华为自有生态和信创市场。

在配套芯片方面,澜起科技(688008.SH)的主营产品是内存接口芯片(服务器CPU与内存条之间的信号中转芯片)。根据公开信息,其内存接口芯片在2024年以36.8%的市场份额位居全球第一;另一条产品线PCIe Retimer芯片(用于高速数据传输中的信号放大和修复),2024年全球市场份额为10.9%,排名第二。

在封测制造环节,根据公开信息,通富微电(002156.SZ)是AMD在全球范围内最重要的封测合作伙伴之一。

李彬告诉记者,国产芯片的软件生态正在接近一个临界点。他举了一个例子:DeepSeek V4发布当天,多家国产芯片厂商在同一天内完成了适配,而此前DeepSeek R1的适配周期需要1到2个月。适配速度的大幅加快说明国产芯片的软件工具链和驱动层正在快速成熟,这对整个国产CPU和加速器产业链都是利好。

在林美炳看来,国产CPU的受益逻辑分为两层:一层是全球服务器CPU需求增长带来的行业增长,另一层是信创政策驱动的国产替代。

根据国资委2022年下发的相关文件要求,央国企要在2027年底前完成信息化系统的国产化改造。记者在采访过程中也了解到,国内高端服务器CPU的国产化率目前仍较低,替代空间广阔。距离政策节点还有不到2年时间,信创CPU的交付窗口正在收窄,这对海光信息、龙芯中科(688047.SH)等国产CPU厂商的产品成熟度和出货能力都是一次集中检验。

林美炳认为,当前这一轮CPU涨价周期和过去不同,增量来自AI Agent对CPU的全新需求,而非制程升级带动的换代需求。

应志伟的判断类似。他说,过去几年市场的注意力几乎全部集中在GPU上,但当AI应用真正进入大规模落地阶段,CPU承担的调度和管理职能只会越来越重。在他看来,这不是CPU要取代GPU,GPU依然重要,但接下来真正拉开差距的是CPU和GPU之间的协同能力,而非单颗芯片的性能参数。

本文来自微信公众号: 经济观察报 ,作者:郑晨烨

你可能也喜欢

澳大利亚最高法院在Block Earner加密收益产品案中为ASIC赢得重大胜利

澳大利亚高等法院近日一致裁定，支持该国证券监管机构ASIC对加密公司Block Earner的上诉，认定其已停运的固定收益产品“Earner”属于金融产品及衍生品。该产品在2022年3月至11月期间运营，未持有必要的澳大利亚金融服务牌照。此判决为ASIC将传统金融法规应用于加密收益类产品确立了重要先例。法院强调，判断关键在于产品的经济实质而非其技术标签。这意味着，在澳大利亚，任何提供结构化回报或具有衍生品经济特征的加密产品都可能需要遵守相应的金融牌照规定。尽管本案涉及历史产品，但其确立的法律原则具有现实约束力，为ASIC未来监管类似加密投资产品提供了明确依据。案件现已发回联邦法院全庭审理以确定具体处罚。该裁决向加密行业发出明确信号：提供由他人资产部署产生收益的产品将面临严格的合规审查。对消费者而言，这也提醒了加密收益产品与单纯持有现货的风险差异。澳大利亚加密市场预计将迎来更清晰的监管界限，相关企业需评估现有及计划中产品的合规性。

bitcoinist18分钟前

澳大利亚最高法院在Block Earner加密收益产品案中为ASIC赢得重大胜利

bitcoinist18分钟前

Blockchain.com通过与Ondo Finance合作扩展代币化股票访问渠道

Blockchain.com通过与Ondo Finance的合作，将其钱包生态系统中的代币化美国股票和ETF访问权限扩展给符合条件的用户。这一合作为用户提供了在熟悉的加密钱包界面内接触受监管的现实世界资产的途径，而非依赖传统券商模式。 Ondo Finance在代币化现实资产（RWA）市场中已成为知名参与者，专注于将国债、收益产品和股票等传统金融产品上链。此次与Blockchain.com的整合为Ondo提供了一个面向大量钱包用户的分发渠道，解决了代币化资产的分发与可及性问题。该举措主要面向美国以外的全球用户，为其提供接触美国股市的加密原生替代方案，这些用户可能已在使用稳定币和加密钱包作为金融基础设施。随着RWA市场竞争日益激烈，股票和ETF因其易于理解和全球需求旺盛而成为焦点。然而，代币化股票仍需解决托管、赎回、法律权利和监管处理等问题。Blockchain.com和Ondo押注于钱包原生访问方式，旨在使这些资产像普通加密货币一样简单易用，同时确保底层资产的合法性。

bitcoinist2小时前

Blockchain.com通过与Ondo Finance合作扩展代币化股票访问渠道

bitcoinist2小时前

TechFlow 情报局：AMD AI 总监公开批评 Claude Code"变得更笨更懒"，特朗普称霍尔木兹将全面停火但海峡仍有 80 枚水雷待清

**科技与地缘动态摘要** **AI与芯片领域** * **技术竞争与审查**：韩国SK Telecom因与Anthropic的合作面临美国出口管制审查。与此同时，中国Z.AI发布了不依赖英伟达芯片、性能对标Claude Opus的GLM-5.2大模型，引发关于技术围堵效果的讨论。 * **安全与伦理问题**：Google Gemini被曝在诈骗场景中提供误导建议，引发AI安全担忧。GitHub上发现上万个分发木马的仓库，开源供应链安全敲响警钟。 * **行业动态**：亚马逊正洽谈对外出售其自研AI芯片，意图进军市场。苹果据悉将为特殊版iPhone独享台积电最新制程工艺。0G Labs宣布其链上AI推理总量突破重要里程碑。 * **争议与监管**：AMD AI总监公开批评Claude Code性能下降。多名亚马逊工程师因批评公司AI数据中心扩张的环境影响遭内部调查。微软、亚马逊云服务或面临欧盟严厉反垄断审查。 **加密/Web3动态** * 韩国交易所Bithumb上线ReProtocol (RE)交易对，而Upbit则移除了KernelDAO (KERNEL)交易对。 **地缘与财经** * **霍尔木兹海峡局势**：尽管美伊达成协议，但霍尔木兹海峡主航道仍有约80枚水雷未清除，导致近8000万桶满载石油的油轮滞留，等待“安全信号”。伊朗取消了赴瑞士外交行程，和谈前景不明。特朗普称协议是伊朗“无条件投降”，并宣称总统拥有无限权力。 * **美股表现**：美股半导体板块大涨，英特尔因与苹果合作传闻暴涨10.6%，而SpaceX股价下跌3.5%。 **核心观察** 当前局势呈现鲜明对比：地缘政治达成临时“和平”，但实际风险（水雷）与不确定性（伊朗行程取消）犹存，导致经济活动（油轮通航）停滞。与此同时，科技领域的竞争与重构却在加速进行，从芯片自主研发、AI模型突破到供应链安全，科技公司正以另一种方式重塑全球格局。

marsbit2小时前

TechFlow 情报局：AMD AI 总监公开批评 Claude Code"变得更笨更懒"，特朗普称霍尔木兹将全面停火但海峡仍有 80 枚水雷待清

marsbit2小时前

马特·达蒙将于瑞波Swell大会发表演讲 Water.org的RLUSD推广引关注

马特·达蒙将出席Ripple Swell 2026大会并发表主题演讲，其共同创立的慈善组织Water.org近期发起的“Get Blue”活动受到关注。该活动旨在扩大安全用水获取，而Ripple被列为独家数字资产与支付合作伙伴。关键点包括：达蒙的参与为Ripple连接了加密货币支付基础设施与主流慈善事业，拓宽了其支付叙事的受众面。Water.org的“Get Blue”活动将利用Ripple Payments及其稳定币RLUSD，以提高向微观金融合作伙伴转移资金的效率与降低成本。此举为RLUSD提供了一个超越交易和国库管理的人道主义支付用例，强调其在新兴市场快速、低成本转移资金的价值。对Ripple而言，此举有助于提升声誉，将稳定币定位为实用的支付基础设施，而非投机性资产，并向主流受众展示区块链支付在慈善等现实场景中的应用。不过，该合作的实际成效仍有待观察。

bitcoinist4小时前

马特·达蒙将于瑞波Swell大会发表演讲 Water.org的RLUSD推广引关注

bitcoinist4小时前

微软发现针对钱包地址和私钥的新型加密恶意软件

2026年2月，微软威胁情报与微软 Defender 专家发现了一种针对加密货币的“剪切板劫持器”恶意软件活动。该恶意软件通过USB驱动器中的恶意.lnk快捷方式文件传播，利用Windows Script Host和ActiveX技术激活，无需安装程序或控制服务器即可运行。一旦感染系统，该恶意软件会持续监控剪贴板内容，专门寻找12词或24词恢复短语、比特币及以太坊私钥和钱包地址。它会在用户完成交易前，将复制的收款地址替换为攻击者控制的地址。此外，恶意软件还能截图并通过Tor连接发送，使攻击者能窃取用户钱包余额和活动信息，并具备远程代码执行能力。微软将此威胁检测为Trojan/CryptoBandits.A，并建议组织禁用USB自动运行功能、限制从USB驱动器执行脚本和快捷方式，并监控相关的可疑活动，如本地9050端口代理活动、PowerShell截图行为等。

TheNewsCrypto4小时前

TheNewsCrypto4小时前

交易

现货

合约

CPU杀回牌桌，一场1700亿美元的“上位”大戏开启

文章摘要

热门币种推荐

相关问答

你可能也喜欢

澳大利亚最高法院在Block Earner加密收益产品案中为ASIC赢得重大胜利

Blockchain.com通过与Ondo Finance合作扩展代币化股票访问渠道

TechFlow 情报局：AMD AI 总监公开批评 Claude Code"变得更笨更懒"，特朗普称霍尔木兹将全面停火但海峡仍有 80 枚水雷待清

马特·达蒙将于瑞波Swell大会发表演讲 Water.org的RLUSD推广引关注

微软发现针对钱包地址和私钥的新型加密恶意软件

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签