AI算力产业链瓶颈传导的底层逻辑

Q: 根据文章，AI算力产业链的瓶颈演变顺序是什么？

AI算力产业链的瓶颈演变遵循着从“计算(GPU)→存储(HBM等)→光互连→电力/液冷”的清晰顺序递进。每解决一个环节的瓶颈，下一个物理/供应链限制就会立即暴露出来，形成系统级的互补约束。

Q: 当前（文中指2026年）最前沿的瓶颈是什么？其核心限制是什么？

当前最前沿的瓶颈是“电力 + 液冷”。核心限制包括：1. **功耗墙**：单张GPU功耗高达700-1200W，单机柜功耗飙升至120-200kW以上。2. **散热墙**：传统风冷已无法满足高功耗器件的散热需求。3. **电网接入**：数据中心需要吉瓦（GW）级供电，但电网并网排队时间可能长达数年，关键电力设备交付周期也被拉长。

Q: 为什么说存储（HBM）成为了AI算力产业链中新的战略级卡脖子环节？

存储（HBM）成为战略级卡脖子环节的原因包括：1. **技术门槛高**：HBM制造工艺复杂（涉及硅通孔TSV和堆叠技术），目前全球仅SK海力士、三星、美光三家能规模化生产。2. **需求爆炸**：AI模型参数爆炸式增长，对内存带宽要求极高，HBM的带宽远超传统内存，每张高级GPU（如B200）就需要192GB以上的HBM。3. **供应链紧张**：产能已全部售罄，价格暴涨。4. **系统性约束**：即使GPU芯片就绪，若没有HBM也无法组装成整卡，会延误整个AI集群的部署，导致其在产业链资本开支中的占比高达30%。

Q: 文章提到AI硬件的瓶颈已从单一维度扩散到多个维度。具体是哪五个维度？

AI硬件的瓶颈已经从“GPU供应”这一单一维度，扩散到电力、芯片、存储、设备、材料这五个维度的集体紧张。AI需求量级已经突破了传统电力规划、半导体设备产能、存储价格模型以及机器人装机假设的所有预测区间。

Q: AI算力从铜缆互联转向光互连（如CPO）的主要原因是什么？

从铜缆转向光互连（如CPO，共封装光学）的主要原因包括：1. **物理极限**：铜缆在带宽、传输距离、功耗和重量上已达到物理极限。2. **性能制约**：在多机柜、超大规模（数千张GPU）集群扩展时，铜缆信号衰减严重、延迟高，无法保证信号完整性。3. **重量与散热**：一个NVL72机柜的铜缆就超过5000根，总重达1.36吨，且功耗巨大（可插拔光模块替代铜缆会增加额外2万瓦功耗）。4. **新方案优势**：光互连（特别是硅光子技术）能提供更高的带宽密度、更低的每比特功耗和更远的传输距离，是突破AI数据中心性能天花板的必由之路。

marsbit发布于2026-05-22更新于2026-05-22

文章摘要

AI算力产业链的瓶颈呈现清晰且递进的传导路径：从GPU计算（2022-2024年主导，受限于先进制程晶圆和CoWoS封装产能），转移到存储（2024-2025年，HBM高带宽内存成为最紧缺环节），再演进到光互连（2025-2026年，铜缆物理极限倒逼向CPO/硅光子技术切换），目前正进入第四阶段，电力供应和液冷散热成为最终的物理约束（2026年起）。这种演变遵循系统性的“Leontief式”互补逻辑——GPU、HBM、互连、电力与冷却必须按最低短板匹配。超大规模AI集群的扩展，每解决一个环节的瓶颈，立即会暴露下一个供应链或物理限制。当前行业正处于光互连加速落地与电力/液冷大规模商用的关键切换期。这一瓶颈的序列性转移，也在不断重塑产业链的价值分配，投资焦点已从最初的芯片制造商，转向存储、光学器件及能源基础设施等环节。

作者:qinbafrank

2月份在《这一场资本开支的战争意味着什么?》里有聊过算力产业链上关键环节依然能攫取最大的价值:芯片、封装测试、存储、光模块等,哪些产能不易快速扩张的,哪些是有极高护城河的,就会享受到庞大资本开支的红利;

效率优化空间仍然很大:推理端的蒸馏、量化、MoE、专用芯片、液体冷却、核聚变(远期)等可能把单位算力的能耗和成本再降10–100倍。要在这些环节上寻找机会。

最近多家投行大摩、摩根大通、美银、高盛、瑞银、花旗、伯恩斯坦、HSBC,发布AI/半导体/电力/存储相关更新报告,AI硬件的瓶颈已经从"GPU 供应"单一维度扩散到电力、芯片、存储、设备、材料五个维度的集体紧张,

AI 需求量级已经突破了传统电力规划、半导体设备产能、存储价格模型、机器人装机假设的所有预测区间。

大摩的全球主题研究复盘指出,全球每周大语言模型 token 消耗量在 3 个月内从 6.4 万亿个飙升到 22.7 万亿个,增幅达到 2.5 倍,美国 2025-28 年数据中心电力缺口 55 吉瓦;摩根大通的数据中心高性能计算项目债首次覆盖直接给出"未来 5 年 122 吉瓦待融资"的缺口数字,美国 5 年电力规划从 101 吉瓦飙升到 230 吉瓦,44% 的新项目并网等待时间超过 4 年;美银给 Alphabet 的最新目标价报告里,2026 年资本支出被直接上修到 1815 亿美元、同比翻倍,自由现金流同比下降 62%。这三组数据不是同一套框架的输出,而是三家独立机构在不同研究路径上的独立画像。

半导体产业链(尤其是AI算力领域)的瓶颈演变,正是从“计算(GPU)→存储(HBM等)→光互连→电力/液冷”这一清晰的顺序递进的。这是2025-2026年行业共识,随着AI训练/推理集群从单机柜(几十张GPU)向超大规模(数千至数十万张GPU)扩展,每解决一个环节的瓶颈,下一个物理/供应链限制就会立即暴露出来,形成“Leontief式”互补约束(缺一个都无法出货)。

有必要了解为什么会出现这种演变、当前现状以及背后的物理/工程原因:

1. 第一阶段瓶颈:GPU计算(2022-2024年主导)核心限制:

高端GPU(如NVIDIA Hopper H100 → Blackwell B200 → Rubin)本身的晶圆产能 + 先进封装。

为什么是瓶颈:AI大模型需要海量并行计算,TSMC 4nm/3nm/2nm逻辑工艺 + CoWoS(2.5D/3D封装)产能一度成为最大卡点。哪怕前端晶圆够,后端把逻辑芯片 + HBM堆叠封装的能力跟不上,整张GPU就出不来。

缓解情况:TSMC大力扩CoWoS(2024-2025年产能翻倍),NVIDIA Blackwell已大规模出货。但这只是“计算”环节解锁,后面立刻暴露新问题。

2. 第二阶段瓶颈:存储(HBM高带宽内存,2024-2025年成为最紧缺)

核心限制:HBM3/HBM3e/HBM4产能。

为什么接力成为瓶颈:GPU算力上去了,但模型参数爆炸式增长(万亿甚至十万亿参数),数据搬运(memory bandwidth)成了“内存墙”。HBM 每秒可传输数 TB 数据,比常规 DDR 内存快 20 倍以上。由于HBM紧邻逻辑芯片,数据无需传输太远,因此节省了能耗。

一张B200 GPU需要192GB+ HBM3e,单机柜(NVL72)HBM总量已达30-40TB,且带宽需求远超传统DRAM。

供应链现状:仅SK海力士、三星、美光三家能规模化生产HBM,工艺复杂(硅通孔TSV + 堆叠),2025年已全部卖光,2026年仍供不应求,价格同比暴涨246%。即使GPU芯片 ready,没有HBM就无法组装交付,导致整个AI集群部署延期。

结果:存储从“商品”变成战略级卡脖子环节,资本开支中存储占比可达30%。

3. 第三阶段瓶颈:光互连(2025-2026年正在切换)

核心限制:铜缆(NVLink/NVSwitch)在带宽、距离、功耗、重量上的物理极限。

为什么必然转向光:单机柜内(72张GPU)还能靠铜缆,但要扩展到多机柜、乃至数千张GPU互联时,铜缆衰减严重(1.8TB/s带宽下有效距离<1米)、重量爆炸(NVL72机柜铜缆超5,000根、总重1.36吨)、功耗高(可插拔光模块替代铜缆会额外吃2万瓦)。信号完整性、延迟、散热都无法支撑更大集群。

解决方案:转向光互连(CPO共封装光学 + 硅光子技术)。把光引擎直接封装在GPU/ASIC旁边,用光纤实现Scale-Out,带宽密度更高、每比特功耗更低、距离更远。

NVIDIA在2026年GTC大力押注,已投资光学公司,800G/1.6T光模块需求爆发式增长。lite、Broadcom、Coherent、Ayar Labs等成为新赢家。

当前进度:铜缆已到极限,光互连正从“可选”变成“必选项”,正突破AI数据中心性能天花板。

4. 第四阶段瓶颈(当前最前沿):电力 + 液冷(2026年起成为最终物理约束)核心限制:功耗墙 + 散热墙 + 电网接入。

为什么是终极瓶颈:每张GPU从300W→700-1200W,单机柜从10-20kW(CPU时代)飙升到120-200kW+甚至更高。传统风冷物理上限只有20-50kW,噪音、风量、能耗都不可接受。

电力侧:数据中心需GW级供电,电网并网排队可达数年,变压器、固态变压器等设备交付周期拉长至100周。微软CEO曾直言“有GPU但没电插”。

液冷侧:必须切换到Direct-to-Chip(直接芯片液冷)或浸没式液冷,结合微流控、冷板等技术。台积电已在CoWoS平台演示硅基液冷,支持>2.6kW TDP。Vertiv(VRT)等液冷/热管理厂商成为基础设施新核心。

连锁反应:PUE(电能利用效率)要求<1.2,余热回收、核电/新型能源并网都成为新话题。即使前面所有环节都解决,没有电和冷,机柜也无法上架运行。

AI算力产业链瓶颈转移的本质逻辑AI算力不是“单点”问题,而是系统级Leontief生产函数——GPU、HBM、互连、电力、冷却必须按最低短板匹配。 hyperscaler(谷歌、微软、Meta等)每解决一个,就立刻把资本和创新推向下个环节。

目前(2026年)正处于“光互连加速落地 + 电力/液冷大规模商用”的切换期,未来可能还会出现新瓶颈(如激光器、光纤材料或电网变压器),但这个“计算→存储→光→电/冷”的链条已成行业公认路径。

这也解释了为什么投资逻辑从NVIDIA/TSMC转向HBM三巨头(SK海力士等)、光学厂商(Lumentum、Coherent)、液冷/电力基础设施(Vertiv、相关电源公司)。

每一次瓶颈转移,都在重塑整个半导体+数据中心产业链的价值分配。

你可能也喜欢

Derive [DRV] 因 Upbit 上线消息上涨 40% – 此区域成下一主要阻力

Derive（DRV）因即将在韩国头部交易所Upbit上线KRW、BTC和USDT交易对的消息而大幅上涨，涨幅约40%，价格从0.1147美元升至0.19美元，随后回落至约0.1471美元。市场反应热烈，24小时交易量激增1744.3%，市值升至约1.0964亿美元。然而，相对强弱指数（RSI）高达84.43，显示市场短期内可能过热，部分投资者选择获利了结。此次上线有望为DRV带来韩国活跃零售市场及更广泛的全球参与，从而提升流动性并加强价格发现。但关键挑战在于，价格上涨能否在上市初期的炒作消退后持续。未来需关注持有者增长、交易量稳定性和市场深度改善等指标，以判断需求是否坚实。若价格能维持在0.131美元以上，表明买盘仍在吸收抛压；若失守，则可能意味着投机性需求正在消退。

ambcrypto44分钟前

Derive [DRV] 因 Upbit 上线消息上涨 40% – 此区域成下一主要阻力

ambcrypto44分钟前

英国计划自2027年起推迟对符合条件的加密货币借贷及流动性池征收资本利得税

英国政府公布计划，将从2027年起对符合条件的加密资产借贷和流动性池交易延迟征收资本利得税。根据英国税务海关总署7月13日发布的新政策文件，从2027年4月6日起，符合条件的加密资产借贷和流动性池安排通常将按“无损益”基础处理。这意味着，当用户将加密资产借出或存入合格的流动性池时，不会立即触发资本利得税，税负通常将递延至资产被实际处置时。该措施旨在使加密资产借贷和流动性池安排的税收处理与其经济实质更好地保持一致。新框架涵盖三种安排：单一加密资产借贷安排、单一加密资产借款安排以及包括合格流动性池在内的自动做市商安排。此次改革源于多年行业咨询，是对2022年指南反馈的回应，原有规则被认为给参与者带来了不成比例的管理负担。英国税务海关总署估计，约有70万参与相关交易的个人将受益于这套更易理解、更贴近经济实质的框架。需要注意的是，该提案并非免税，而是改变了损益确认的时点。相关立法将修订《1992年应税收益征税法》，并于2027年4月6日生效，以便纳税人和服务提供者有时间做好准备。

ambcrypto3小时前

ambcrypto3小时前

DeXe下跌13%——但这次回调或许只是暂时的

DeXe代币在近期经历显著上涨，过去180天内涨幅超过1000%，仅过去一周就上涨45%。然而，在过去24小时内，价格出现约13%的回调，主要原因是买家获利了结。技术分析显示，价格图表上出现了墓碑十字线和蜻蜓十字线，表明买卖双方存在对峙。目前价格处于短期看跌状态，关键支撑位位于需求区1和需求区2。需求区1能否守住尤为重要，若成功支撑，价格可能恢复上涨势头。动量指标并未完全确认看跌趋势。累积/分配指标在价格下跌时仍小幅上升，显示有逢低买盘介入。相对强弱指数位于52，处于50-70的看涨区间内，表明市场情绪中性偏多，而非彻底转向看跌。现货市场数据也显示卖压正在缓解。7月12日净流出高达538万美元，但目前已急剧收缩至39.1万美元，表明卖方力量已大幅减弱，买方可能正在回归。综上所述，DeXe近期的下跌更像是强劲上涨后的技术性回调与获利盘消化，而非趋势逆转。多个指标暗示卖压减弱，买盘有望在关键支撑位附近重新占据主动，中长期上行趋势可能尚未结束。

ambcrypto3小时前

ambcrypto3小时前

存储的繁荣，能够持续多久？

半导体存储器市场正经历历史性的爆炸式增长。根据WSTS数据，存储器出货量在短短十年内增长超11倍，2026年5月单月达633亿美元，同比增速高达285%，远超以往任何“泡沫”时期。增长的核心驱动力并非出货量，而是DRAM和NAND闪存价格的异常飙升，自2025年初以来两者现货价格均上涨约10倍。价格暴涨的根本原因在于人工智能数据中心带来的需求激增。以亚马逊、谷歌、微软和Meta为代表的超大规模数据中心运营商，为构建AI基础设施进行了巨额资本投资，预计2026年将达7550亿美元。这些数据中心像“黑洞”一样吸走了大量用于AI的高性能存储（如HBM），导致供应产能向AI领域倾斜，进而造成用于个人电脑、智能手机等消费电子产品的传统DRAM和NAND闪存严重短缺，价格被大幅推高。这种扭曲的增长结构使得全球半导体市场规模预测被彻底颠覆。此前预测到2032年达1.2万亿美元的目标，可能在2026年就被超越。市场增长高度集中于存储器和逻辑电路（含GPU），而模拟和微控制器市场则增长平缓。然而，作者根据存储器市场近35年的历史周期规律发出警告：该市场从未出现过连续六年以上的正增长，繁荣期通常不超过五年。此次以2024年为顶点的AI热潮，按历史规律预计最迟将在2028年、甚至2027年结束。更关键的是，“高峰越高，低谷越深”是半导体行业的铁律。当前285%的增速是前所未有的峰值，随之而来的衰退很可能比以往任何一次都更加严重和漫长。尽管当前存储制造商因利润暴增而股价飙升，甚至创造了许多“亿万富翁”，但作者强烈呼吁行业应保持冷静，利用当前的繁荣期为必将到来的严峻衰退做好切实准备。

链捕手4小时前

链捕手4小时前

美国通胀降温让加密货币空头措手不及，空头平仓额达1.79亿美元

美国通胀降温令加密市场空头措手不及，短短12小时内强平金额达2.1977亿美元，其中空头头寸强平占1.7926亿美元。此轮市场波动由美国6月CPI数据环比下降0.4%所触发，年通胀率放缓至3.5%，增强了市场对美联储货币政策可能转向宽松的预期，从而提振了风险资产。数据显示，以太坊引领了此轮空头强平潮，强平额达9873万美元，超过比特币的5959万美元。仅在数据发布后的一小时内，空头强平额就高达5605万美元。这表明许多押注价格下跌的交易者在通胀数据公布后因市场快速上涨而被强制平仓。总体而言，宏观数据对加密货币市场，特别是高杠杆头寸，产生了显著影响。

ambcrypto5小时前