AI算力产业链瓶颈传导的底层逻辑

marsbit发布于2026-05-22更新于2026-05-22

文章摘要

AI算力产业链的瓶颈呈现清晰且递进的传导路径:从GPU计算(2022-2024年主导,受限于先进制程晶圆和CoWoS封装产能),转移到存储(2024-2025年,HBM高带宽内存成为最紧缺环节),再演进到光互连(2025-2026年,铜缆物理极限倒逼向CPO/硅光子技术切换),目前正进入第四阶段,电力供应和液冷散热成为最终的物理约束(2026年起)。 这种演变遵循系统性的“Leontief式”互补逻辑——GPU、HBM、互连、电力与冷却必须按最低短板匹配。超大规模AI集群的扩展,每解决一个环节的瓶颈,立即会暴露下一个供应链或物理限制。当前行业正处于光互连加速落地与电力/液冷大规模商用的关键切换期。这一瓶颈的序列性转移,也在不断重塑产业链的价值分配,投资焦点已从最初的芯片制造商,转向存储、光学器件及能源基础设施等环节。

作者:qinbafrank

2月份在《这一场资本开支的战争意味着什么?》里有聊过算力产业链上关键环节依然能攫取最大的价值:芯片、封装测试、存储、光模块等,哪些产能不易快速扩张的,哪些是有极高护城河的,就会享受到庞大资本开支的红利;

效率优化空间仍然很大:推理端的蒸馏、量化、MoE、专用芯片、液体冷却、核聚变(远期)等可能把单位算力的能耗和成本再降10–100倍。要在这些环节上寻找机会。

最近多家投行大摩、摩根大通、美银、高盛、瑞银、花旗、伯恩斯坦、HSBC,发布AI/半导体/电力/存储相关更新报告,AI硬件的瓶颈已经从"GPU 供应"单一维度扩散到电力、芯片、存储、设备、材料五个维度的集体紧张,

AI 需求量级已经突破了传统电力规划、半导体设备产能、存储价格模型、机器人装机假设的所有预测区间

大摩的全球主题研究复盘指出,全球每周大语言模型 token 消耗量在 3 个月内从 6.4 万亿个飙升到 22.7 万亿个,增幅达到 2.5 倍,美国 2025-28 年数据中心电力缺口 55 吉瓦;摩根大通的数据中心高性能计算项目债首次覆盖直接给出"未来 5 年 122 吉瓦待融资"的缺口数字,美国 5 年电力规划从 101 吉瓦飙升到 230 吉瓦,44% 的新项目并网等待时间超过 4 年;美银给 Alphabet 的最新目标价报告里,2026 年资本支出被直接上修到 1815 亿美元、同比翻倍,自由现金流同比下降 62%。这三组数据不是同一套框架的输出,而是三家独立机构在不同研究路径上的独立画像。

半导体产业链(尤其是AI算力领域)的瓶颈演变,正是从“计算(GPU)→存储(HBM等)→光互连→电力/液冷”这一清晰的顺序递进的。 这是2025-2026年行业共识,随着AI训练/推理集群从单机柜(几十张GPU)向超大规模(数千至数十万张GPU)扩展,每解决一个环节的瓶颈,下一个物理/供应链限制就会立即暴露出来,形成“Leontief式”互补约束(缺一个都无法出货)。

有必要了解为什么会出现这种演变、当前现状以及背后的物理/工程原因:

1. 第一阶段瓶颈:GPU计算(2022-2024年主导)核心限制:

高端GPU(如NVIDIA Hopper H100 → Blackwell B200 → Rubin)本身的晶圆产能 + 先进封装。

为什么是瓶颈:AI大模型需要海量并行计算,TSMC 4nm/3nm/2nm逻辑工艺 + CoWoS(2.5D/3D封装)产能一度成为最大卡点。哪怕前端晶圆够,后端把逻辑芯片 + HBM堆叠封装的能力跟不上,整张GPU就出不来。

缓解情况:TSMC大力扩CoWoS(2024-2025年产能翻倍),NVIDIA Blackwell已大规模出货。但这只是“计算”环节解锁,后面立刻暴露新问题。

2. 第二阶段瓶颈:存储(HBM高带宽内存,2024-2025年成为最紧缺)

核心限制:HBM3/HBM3e/HBM4产能。

为什么接力成为瓶颈:GPU算力上去了,但模型参数爆炸式增长(万亿甚至十万亿参数),数据搬运(memory bandwidth)成了“内存墙”。HBM 每秒可传输数 TB 数据,比常规 DDR 内存快 20 倍以上。由于HBM紧邻逻辑芯片,数据无需传输太远,因此节省了能耗。

一张B200 GPU需要192GB+ HBM3e,单机柜(NVL72)HBM总量已达30-40TB,且带宽需求远超传统DRAM。

供应链现状:仅SK海力士、三星、美光三家能规模化生产HBM,工艺复杂(硅通孔TSV + 堆叠),2025年已全部卖光,2026年仍供不应求,价格同比暴涨246%。即使GPU芯片 ready,没有HBM就无法组装交付,导致整个AI集群部署延期。

结果:存储从“商品”变成战略级卡脖子环节,资本开支中存储占比可达30%。

3. 第三阶段瓶颈:光互连(2025-2026年正在切换)

核心限制:铜缆(NVLink/NVSwitch)在带宽、距离、功耗、重量上的物理极限。

为什么必然转向光:单机柜内(72张GPU)还能靠铜缆,但要扩展到多机柜、乃至数千张GPU互联时,铜缆衰减严重(1.8TB/s带宽下有效距离<1米)、重量爆炸(NVL72机柜铜缆超5,000根、总重1.36吨)、功耗高(可插拔光模块替代铜缆会额外吃2万瓦)。信号完整性、延迟、散热都无法支撑更大集群。

解决方案:转向光互连(CPO共封装光学 + 硅光子技术)。把光引擎直接封装在GPU/ASIC旁边,用光纤实现Scale-Out,带宽密度更高、每比特功耗更低、距离更远。

NVIDIA在2026年GTC大力押注,已投资光学公司,800G/1.6T光模块需求爆发式增长。lite、Broadcom、Coherent、Ayar Labs等成为新赢家。

当前进度:铜缆已到极限,光互连正从“可选”变成“必选项”,正突破AI数据中心性能天花板。

4. 第四阶段瓶颈(当前最前沿):电力 + 液冷(2026年起成为最终物理约束)核心限制:功耗墙 + 散热墙 + 电网接入。

为什么是终极瓶颈:每张GPU从300W→700-1200W,单机柜从10-20kW(CPU时代)飙升到120-200kW+甚至更高。传统风冷物理上限只有20-50kW,噪音、风量、能耗都不可接受。

电力侧:数据中心需GW级供电,电网并网排队可达数年,变压器、固态变压器等设备交付周期拉长至100周。微软CEO曾直言“有GPU但没电插”。

液冷侧:必须切换到Direct-to-Chip(直接芯片液冷)或浸没式液冷,结合微流控、冷板等技术。台积电已在CoWoS平台演示硅基液冷,支持>2.6kW TDP。Vertiv(VRT)等液冷/热管理厂商成为基础设施新核心。

连锁反应:PUE(电能利用效率)要求<1.2,余热回收、核电/新型能源并网都成为新话题。即使前面所有环节都解决,没有电和冷,机柜也无法上架运行。

AI算力产业链瓶颈转移的本质逻辑AI算力不是“单点”问题,而是系统级Leontief生产函数——GPU、HBM、互连、电力、冷却必须按最低短板匹配。 hyperscaler(谷歌、微软、Meta等)每解决一个,就立刻把资本和创新推向下个环节。

目前(2026年)正处于“光互连加速落地 + 电力/液冷大规模商用”的切换期,未来可能还会出现新瓶颈(如激光器、光纤材料或电网变压器),但这个“计算→存储→光→电/冷”的链条已成行业公认路径。

这也解释了为什么投资逻辑从NVIDIA/TSMC转向HBM三巨头(SK海力士等)、光学厂商(Lumentum、Coherent)、液冷/电力基础设施(Vertiv、相关电源公司)。

每一次瓶颈转移,都在重塑整个半导体+数据中心产业链的价值分配。

相关问答

Q根据文章,AI算力产业链的瓶颈演变顺序是什么?

AAI算力产业链的瓶颈演变遵循着从“计算(GPU)→存储(HBM等)→光互连→电力/液冷”的清晰顺序递进。每解决一个环节的瓶颈,下一个物理/供应链限制就会立即暴露出来,形成系统级的互补约束。

Q当前(文中指2026年)最前沿的瓶颈是什么?其核心限制是什么?

A当前最前沿的瓶颈是“电力 + 液冷”。核心限制包括:1. **功耗墙**:单张GPU功耗高达700-1200W,单机柜功耗飙升至120-200kW以上。2. **散热墙**:传统风冷已无法满足高功耗器件的散热需求。3. **电网接入**:数据中心需要吉瓦(GW)级供电,但电网并网排队时间可能长达数年,关键电力设备交付周期也被拉长。

Q为什么说存储(HBM)成为了AI算力产业链中新的战略级卡脖子环节?

A存储(HBM)成为战略级卡脖子环节的原因包括:1. **技术门槛高**:HBM制造工艺复杂(涉及硅通孔TSV和堆叠技术),目前全球仅SK海力士、三星、美光三家能规模化生产。2. **需求爆炸**:AI模型参数爆炸式增长,对内存带宽要求极高,HBM的带宽远超传统内存,每张高级GPU(如B200)就需要192GB以上的HBM。3. **供应链紧张**:产能已全部售罄,价格暴涨。4. **系统性约束**:即使GPU芯片就绪,若没有HBM也无法组装成整卡,会延误整个AI集群的部署,导致其在产业链资本开支中的占比高达30%。

Q文章提到AI硬件的瓶颈已从单一维度扩散到多个维度。具体是哪五个维度?

AAI硬件的瓶颈已经从“GPU供应”这一单一维度,扩散到电力、芯片、存储、设备、材料这五个维度的集体紧张。AI需求量级已经突破了传统电力规划、半导体设备产能、存储价格模型以及机器人装机假设的所有预测区间。

QAI算力从铜缆互联转向光互连(如CPO)的主要原因是什么?

A从铜缆转向光互连(如CPO,共封装光学)的主要原因包括:1. **物理极限**:铜缆在带宽、传输距离、功耗和重量上已达到物理极限。2. **性能制约**:在多机柜、超大规模(数千张GPU)集群扩展时,铜缆信号衰减严重、延迟高,无法保证信号完整性。3. **重量与散热**:一个NVL72机柜的铜缆就超过5000根,总重达1.36吨,且功耗巨大(可插拔光模块替代铜缆会增加额外2万瓦功耗)。4. **新方案优势**:光互连(特别是硅光子技术)能提供更高的带宽密度、更低的每比特功耗和更远的传输距离,是突破AI数据中心性能天花板的必由之路。

你可能也喜欢

SharpLink CEO:如何理解以太坊开发者刚刚突破 100 万?

作者Joseph Chalom从亚洲之行中感受到以太坊生态的活力与建设者的雄心。他指出,Electric Capital数据显示以太坊历史开发者总数已突破100万,其中约23.2万人在过去一年保持活跃,这是加密领域最大的技术人才库。 Chalom认为,加密领域的核心问题并非哪条链最快,而是顶尖建设者选择在哪里长期建设。以太坊的显著优势源于十年积累的制度、文化、经济和生态结构,使其成为可编程金融和互联网原生资本形成的默认操作系统。 这百万建设者正致力于解决行业最难的问题:核心协议的可扩展性、隐私、抗量子能力及智能体系统。例如,2026年预计进行的Glamsterdam升级将在不破坏核心原则下提升性能;同步可组合性技术让众多Rollup能像一条链般运作;以太坊在抗量子准备上也处于明显领先地位。 以太坊的深层护城河在于开发者聚集产生的复利效应,以及由此强化的可组合性、共享标准(如EVM和Solidity)和信任。其可信中立性(由超90万验证者保障)、模块化架构(如Base、Arbitrum等Rollup)以及吸引顶尖研究人员的文化,共同巩固了其作为大型机构首选互联网原生金融协调层的地位。Chalom坚信,以太坊的生态系统优势及其汇聚的人才,将持续推动下一代金融基础设施的变革。

marsbit31分钟前

SharpLink CEO:如何理解以太坊开发者刚刚突破 100 万?

marsbit31分钟前

SharpLink CEO:如何理解以太坊开发者刚刚突破 100 万?

SharpLink CEO分享了其对以太坊开发者总数突破100万的见解。根据Electric Capital数据,以太坊历史开发者总数已达1,012,824人,其中约23.2万人在过去一年保持活跃,构成了加密领域最庞大的技术人才库。 作者认为,加密领域的核心竞争并非单纯追求速度与低费用,而是顶尖建设者的选择。以太坊凭借十年积累的制度、文化、经济与生态结构,形成了难以复制的综合优势,已成为可编程金融和互联网原生资本的默认操作系统。 这百万开发者正致力于攻克行业最前沿的挑战:通过预计2026年的Glamsterdam升级提升核心协议可扩展性;通过同步可组合性技术让众多Rollup如一条链般协同工作;以及积极布局抗量子能力,以太坊基金会已成立专门团队推进,目标是2029年前完成迁移。 更深层的护城河在于网络效应:以太坊的可组合性让应用像乐高积木一样互操作,EVM和Solidity技能在数百个网络中通用,形成了“更多开发者→更多工具与流动性→更多应用”的飞轮。此外,由超90万验证者保障的可信中立性、模块化扩展架构以及顶尖的研究与文化氛围,共同巩固了其作为大型机构首选信任层的地位。 作者在访问亚洲以太坊社区后强调,以太坊的竞争优势在于汇聚了改变未来金融的建设者,其生态不仅是链上活跃,更在成为互联网原生金融的长期协调层。

链捕手34分钟前

SharpLink CEO:如何理解以太坊开发者刚刚突破 100 万?

链捕手34分钟前

从身份协议到AI入口,World的野心有多大?

近期,加密市场中的WLD成为焦点,其价格持续上涨,市值突破30亿美元。这一热度源于World项目正式进入“The Simple Plan”第三阶段,其发展逻辑正从早期的代币激励转向实用驱动。World的核心目标是构建全球“人格证明”网络,通过扫描虹膜的World ID解决互联网中验证真实人类身份的关键问题。随着生成式AI爆发,区分真人与AI变得日益紧迫。 World的落地场景正在拓宽,覆盖企业端、个人端及AI Agent端。企业方面,与Zoom等公司合作应对深度伪造;个人层面,瞄准社交与票务等场景的真人验证需求;AI Agent端则推出AgentKit,旨在建立人与AI间的可信授权框架,为未来AI经济奠定信任基础。 市场上涨背后是对“真人身份”稀缺价值的重估。在AI内容成本趋近零的未来,真人身份与行为可能成为稀缺资源。World的运营策略也更聚焦,资源集中于高价值城市以构建网络效应,同时下一代Orb设备将实现自助化以降低扩张成本。 宏观来看,World可能推动加密叙事从金融扩展到身份基础设施,身份或成为可组合资产。它也有望成为AI Agent经济的关键入口,解决Agent归属、可信与验证问题。World ID 4.0引入的费用机制开启了协议的收入来源,使其商业模式更趋清晰。 总之,WLD的上涨反映了市场对World在AI时代定位的认可——其野心是成为验证人类身份的关键入口。随着AI与人的界限模糊,掌握人格证明网络可能意味着掌握下一代互联网的重要枢纽。

marsbit1小时前

从身份协议到AI入口,World的野心有多大?

marsbit1小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

573人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片