中美AI对弈之下的算力难题

marsbit發佈於 2026-06-22更新於 2026-06-22

文章摘要

本文探讨了中美在人工智能领域竞争中的核心难题——算力差距。文章指出，尽管国产GPU企业在资本市场受到热捧，但主要集中于AI推理侧，在更高端的AI训练芯片领域仍处边缘。美国科技巨头凭借英伟达等公司的高端GPU，在算力规模上形成碾压优势，如Meta计划部署超120万张高端GPU，美国算力规模是中国的两倍多。这使美国企业能快速进行大模型迭代，参数规模已达十万亿级，而中国最强模型参数约为1.6万亿。文章分析，算力基座的巨大差距是中美模型性能代差（估计约8-15个月）的根本原因。高端训练芯片的缺失限制了国产大模型参数规模和训练速度。尽管黄仁勋等人对中国半导体发展表示乐观，但作者认为需清醒认识差距，尤其在复杂任务和软件生态（如英伟达CUDA）方面，国产GPU仍有很长的路要走。然而，国产算力正在崛起。华为昇腾910B等芯片已在性能上接近英伟达A100，并开始在推理和特定训练场景中实现应用突破，如智谱与华为合作训练多模态模型。文章最后强调，在芯片进口受限背景下，应坚持自主创新与开放合作并举，凭借市场、人才和资本优势，逐步追赶。这场AI对弈关乎国运，虽挑战巨大，但国产GPU已展现出解决实际需求的潜力。

算力掣肘

去年底以来,摩尔线程、沐曦股份、壁仞科技、天数智芯等国产GPU掀起资本热浪。然而,二级市场财富盛宴之下,一条不容忽视的暗线正变得越来越明晰,其引发的问题也愈发迫切。

过去几年,国产AI芯片主要集中在相对安全且较为边缘的“推理侧”,如近期豆包计划豪购天数智芯5万块芯片用于推理运算任务,以满足这家中国最大AI APP终端的高频调用。

而在AI训练这一算力金字塔顶端序列中,国产芯片目前只能参与边缘“打杂”任务。

AI训练芯片主要用于人工智能模型的训练,期间会进行大量的矩阵运算和参数调整,因此需要具备强大的计算能力和高能效比,性能更强大且价格也十分高昂,如英伟达A100、H100、H200以及AMD的MI300系列等;

相较而言,推理芯片的任务要轻松许多。用于模型训练完成后的部署阶段,主要负责执行模型的推理任务,其对实时性要求较高,推理芯片需要在保证准确率的同时,具备快速响应和低功耗的特点。

一个恰当的比喻就是,训练是让AI模型“学会知识”,推理是让大模型“运用知识”。在学习阶段,训练芯片要调用巨量数据来“喂养”十亿、万亿乃至十万亿级参数的动态更新,不仅要具备强悍的算力,还需配置高效的带宽和通信能力,还要保障万卡级集群下的稳定性。

中美模型差距根源就在这些“看不见的地方”,尤其是高端训练芯片的缺席。

在大模型Scaling Law规律下,模型参数越大,算力需求相应线性增长,而指数级膨胀的算力及硬件成本开支,让训练大模型成为极少数科技巨头的“专属游戏”。

美国科技巨头中,仅Meta一家就计划2026年底部署超120万张高端GPU,年投入超1450亿美元;另据测算,谷歌拥有的AI总算力相当于500万块英伟达H100,一家企业占到了全球总量的1/4。

Amazon、Microsoft、Alphabet、Meta四家公司今年的资本开支高达7250亿美元,同比猛增77%,这一规模,相当于美国全年私人国内总投资的13%。大摩更是预测,到2027年,美国科技企业资本开支有望达到1.1万亿美元的历史纪录。

目前美国掌控全球七成以上高端GPU,芯片禁令后国内可用的高端芯片只有美国的1/8。斯坦福AI Index Report 2026报告中指出,美国数据中心数量(5427个)是中国10倍有余。

依据中国信息通信研究院(CAICT)的测算,截至2025年初,美国算力规模为2400 EFLOPS,中国1053 EFLOPS,美国是中国的2倍有余。

上述四家科技巨头在手的算力规模,每一家单拎出来,都已经超过中国所有AI企业之和。

这种碾压式的算力优势,使美国企业可以一年内完成十几轮大模型迭代实验。

马斯克甚至更加奢侈,旗下的xAI拥有号称全球“首个GW级AI集群”的Colossus 2。因此他有底气宣称,正在同时训练7个模型——两个1万亿、两个1.5万亿、一个6万亿和一个10万亿参数模型,这种“暴力美学”,只有在算力极度充裕的情况下才能做到。

与此同时,由于美国钳制芯片出口,在近年来出货的高端AI芯片中,中国企业获得的份额持续下滑(根据epoch.AI统计)。

可以毫不夸张地说,算力基座的巨大差距,将导致中国AI长期处于追赶阶段,也将让国产大模型追上美国同行的过程变得更加困难。

代际之差

“中国创新的步伐不可阻挡”,“谁要是觉得中国做不出来(芯片),那就真的看走眼了。中美之间的差距只是纳秒级别”。

英伟达创始人黄仁勋不止一次在公开场合称赞中国半导体的进步。

马斯克也经常会在X上表达相似的观点——“中国一定会解决芯片卡脖子问题,人工智能算力领域,必将远超全球其他国家”,“中国会赢下地球上的AI竞赛”。

科技界如雷贯耳的大佬对中国AI发展极尽溢美之词,很容易让人信以为真。这些言论显然有捧杀的嫌疑。部分美国媒体不断宣扬中美模型差距极小的舆论,试图混淆事实,掩盖一些客观真相。

对此,国内AI相关领域都应该保持清醒冷静。

如果说如今中国先进大模型在解决标准化问题时与美国竞品差别不大,那么在复杂工业和企业环境下,差距就会显得更加明显。

和美国Anthropic等公司的前沿模型相比,中国仍属于追赶者。美国CAISI评估认为,国内最强的DeepSeek V4 Pro落后美国前沿约8个月。

李开复近期在接受《华尔街日报》采访时指出,以Anthropic推出的Claude Fable 5等美国顶尖模型为标杆,‌美国目前领先中国约15个月‌。

大模型遵循Scaling Law规律,模型参数量越大、训练数据越多、投入的算力越大,模型的性能就越好。如今,美国最前沿大模型已进入十万亿参数时代,且迭代速度还在加快。

Anthropic最强大的Mythos已达10万亿参数,训练它就要耗费100亿美元;xAI的Colossus 2正同时训练7个模型,含6万亿和10万亿参数模型;OpenAI迭代一轮4万亿参数模型的周期仅为一个月。

中国最强模型DeepSeek V4 Pro总参数量为1.6万亿,和美国十万亿级前沿相差约6倍。

Anthrpoic旗下的Claude系列,已经被公认为近两年最强的AI编程大模型,Mythos则又再一次刷新了公众的认知,其性能相比此前的旗舰Oups 4.6还要更加强大。

OpenBSD在业界有着最安全的系统的美名,结果Mythos找到了一个27年间都没发现的漏洞,它还在FFmpeg、Linux内核中寻觅到了几年甚至十几年都没发现的漏洞,而且全程自主发现,没有依靠人类。

要知道,大模型“预训练”决定了模型能力的上限,无法通过“后训练”将万亿级别参数模型调到达到10万亿参数模型的能力水平。而预训练的决定因子就是高端算力芯片,它决定了参数规模和训练迭代速度。

科大讯飞董事长刘庆峰就坦言,目前各家顶尖大模型厂商,特别是美国的巨头,都在建超大规模算力平台。而国产算力目前确实面临阵痛期,导致在训练超长文本上下文中遇到了限制。

可见,算力差距就是中美模型之差的根源。

国产崛起

一家企业垄断全球高端AI训练芯片90%的市场份额——这助力英伟达保持着全球第一大市值公司的王座。其总市值一度超过全球第三大经济体德国2025年的GDP。

集邦咨询数据显示,2026年Q1全球GPU服务器市场,英伟达一家吃掉68%,AMD占据5%-6%,而国产GPU厂商整体不足4%。

凭借先发优势,超强的技术壁垒、高速互联、软件生态以及绑定台积电先进制程,英伟达独霸天下。在高端训练场景,英伟达GB300性能强于AMD MI325,也好于寒武纪思元690、摩尔线程MTT40,尤其在万亿参数大模型训练中,性能强于竞品30%以上。

出口禁令之下,黄仁勋此前已表示,英伟达在华市场份额(新增)已基本归零,仅剩存量市场。国产替代政策支持下,包括华为昇腾910、海光DCU深算2号、寒武纪思元370/590,以及摩尔、沐曦等企业相继涌现。

其中昇腾910是华为最强算力芯片,昇腾910B算力达到640TOPS(INT8),可媲美到英伟达A100芯片。

绝对性能层面,国产GPU虽仍有差距,但可先从推理与边缘场景入手,目前国产GPU基本满足国内政企通用推理需求,与英伟达中端产品差距缩小至15%-20%,具备替代可行性。

需要特别指出的是,算力性能固然重要,而其背后的技术软件生态才是国产GPU的软肋。正如CUDA才是铸造英伟达GPU帝国的根基,中国工程院院士郑纬民就指出,国产AI芯片核心问题是生态不够好,如果生态好,性能做到60%也有人用。

可以说,软件生态是GPU赛道最硬核的壁垒,在这方面英伟达的能力同样难以替代。

CUDA生态经过了十余年深耕,已经拥有超400万开发者、数十万开源模型、全品类第三方工具链,覆盖AI训练、推理、图形渲染、科学计算,生态壁垒强悍无二。

IDC数据显示,目前全球95%以上的AI模型基于CUDA生态开发。而国产GPU在依托政策支持下,需要和产业链进行长期协同,需要媒体舆论、资本市场给予足够的耐心。

今年1月,智谱就联合华为开源新一代图像生成模型GLM-Image,该模型基于华为昇腾Atlas 800T A2设备与昇思MindSpore AI框架,完成从数据处理到模型训练的全流程闭环,是首个依托国产芯片实现全程训练的SOTA多模态模型;

摩尔线程还与北京智源人工智能研究院一起,基于MTT S5000智算集群与FlagOS-Robo框架,完成智源自研具身大脑模型RoboBrain 2.5的全流程训练。这一成果首次验证了,国产算力集群在具身智能大模型训练中的可用性。

可以看出,国产GPU在适配性和生态构建方面已经有所突破,并正从推理侧的“单点突破”,迈向训练侧的“逐步适配”,这已是一种长足进步。

总结

整体上看,在海外先进芯片进口受阻的背景下,不妨“中西结合”用两条腿来走路,同时重点扶持国内算力芯片,以满足迫切的市场需求。

需求的真实性毋庸置疑,“泡沫论”仍然存在,但声音并没有越来越大。全球市场对于AI建设的热情,已经超越了此前以往任何一个产业早期的发展历程。

今年以来,全球资本市场再度掀起超级AI周期,三星、sk海力士、博通、台积电股价屡创新高,国内市场上,以寒武纪等代表的硬科技也是涨势凶猛,光模块巨头中际旭创市值更是一度超过茅台。

回顾韩国半导体发展史,韩国以举国之力支持存储芯片产业,熬过至暗时刻,并最终击败日本,成为世界存储产业绝对王者。

无论存储芯片、手机芯片、乃至当下的AI芯片,中国都还处于追赶阶段,这绝非一朝一夕之功。但凭借巨大的市场、不断涌现的AI人才、庞大的资本实力,国产GPU已经开始展露出一定的适配性,能够解决很多AI企业的真实需要。

在这场关于国运的AI对弈中,中美两国既是对手,同时也有对方所需的技术、市场和资源。

本文来自微信公众号: 巨潮WAVE ,编辑:杨旭然,作者:谢泽锋,原文标题:《中美AI对弈之下的算力难题 | 巨潮》

你可能也喜歡

BTC 市场脉搏：第 26 周

比特币在强劲复苏后进入盘整，市场参与度和方向性信心开始降温。价格动能仍具建设性，但订单流已转向净卖出，因激进的接受方需求消退。现货交易活动也收缩，成交量趋于近期区间低端。衍生品市场同样反映谨慎情绪。期货未平仓合约保持稳定，表明杠杆得以维持而非扩张，资金费率微升指向持续看涨倾向。但永续合约买压下降和25-delta偏度上升显示，交易者正越来越多地为下行保护付费，反映出防御姿态增强，尽管价格走势相对平稳。机构需求疲软，美国现货ETF持续净流出且交易活跃度降低。链上活动保持低迷，转账量和手续费生成继续走低，凸显投机性参与广泛放缓。然而，表层之下，供应动态依然具有支撑性。供应余额继续向长期持有者转移，盈利能力保持高位，已实现利润在增加。热资本份额上升表明更多短期资本开始活跃，可能加剧波动性，但未必预示市场结构恶化。总体而言，比特币维持区间震荡。市场参与和风险偏好有所缓和，但持有者行为坚韧、期货持仓稳定以及健康的盈利水平，继续提供建设性基础。市场正处于动能减退与基础实力之间的拉锯状态，等待下一个方向性催化剂。

insights.glassnode2 小時前

insights.glassnode2 小時前

臭名昭著的MEV机器人JaredFromSubway被盗取750万美元

以太坊上臭名昭著的MEV机器人“JaredFromSubway”据报道被盗约750万美元。安全公司Blockaid指出，攻击者通过其控制的合约欺骗该机器人的自动化系统，使其批准了恶意交易路径。随后，攻击者利用这些授权从机器人合约中提取了WETH、USDC和USDT资产。此次事件并非以太坊底层协议被黑，也非普通用户使用的主流DeFi应用出现广泛故障，而是针对特定MEV机器人及其在自动交易中与合约交互逻辑的攻击。这凸显了自动化交易系统的一个普遍风险：对速度的追求可能转化为脆弱性。MEV机器人需要比人类交易者行动更快，但也因此更容易落入精心设计的陷阱。该事件对市场的主要影响可能不在金额本身，而在于对MEV基础设施声誉的打击，以及促使机器人运营商更严格地审查其授权逻辑。目前，这应被视为针对交易机器人的定向攻击，而非影响整个网络的安全事件。

bitcoinist5 小時前

bitcoinist5 小時前

研报解读：摩根大通详解美光季报前买方情绪、硬件板块近况

摩根大通于6月21日发布报告，综合分析了美光科技季报前的市场情绪、硬件供应链近况及AI资本开支预测。报告指出，存储是当前市场共识度最高的多头方向，AI需求强劲且平均售价持续上升。市场普遍预期美光将在季报中宣布更多长期供应协议，关注焦点在于其高毛利率的可持续性以及协议条款的披露程度。硬件供应链方面，AI相关的服务器、网络和存储需求保持强劲，但个股出现分化。例如，Celestica利润率展望转好，对AI网络项目信心增强；Fabrinet的AI光模块业务增长可预见性提高。摩根大通上调了晶圆设备市场预测，预计2026年增长28%，2027年增长29%，主要驱动力来自DRAM、台积电、英特尔和三星代工。报告还指出，AI项目融资中债务比例已超85%，但贷款价值比相对较低，融资约束正在减弱。报告最后提示需关注三个信号：美光长期协议的披露细节、Arista Networks是否上调全年指引，以及Fabrinet来自亚马逊的光模块收入爬坡情况。

marsbit5 小時前

marsbit5 小時前

研报解读：美联储新主席首秀，换了掌门，但没换剧本？

美联储新任主席凯文·沃什主持了首次FOMC会议。摩根士丹利经济学家赛斯·B·卡彭特在报告中指出，此次会议有三个关键信号。首先，沃什有意减少“前瞻指引”，未明确利率路径。点阵图显示今年仅预期加息一次，但卡彭特认为，若通胀超预期下行，这次加息的逻辑可能站不住脚。其次，缩表（缩减资产负债表）路径可能比市场预期的更激进。通过削减财政部账户余额、调整准备金利率等方式，缩表规模可能显著扩大，但对市场的冲击或许有限，除非美联储主动出售抵押贷款支持证券。最后，美联储的政策框架正在被重新审视，但2%的通胀目标短期内不会改变。沟通方式的调整更多是形式上的回归传统。报告的核心观点是：市场对加息的担忧可能过度，而更应关注可能超预期的缩表进程。后续需重点关注通胀数据、具体的缩表路径以及政策框架审查的进展。

marsbit6 小時前

marsbit6 小時前

研报解读：花旗参会 AWS 峰会，看好云业务加速但数据治理仍是关键变量

花旗分析师团队参加AWS纽约峰会后发布报告，认为AWS的战略重心已从AI实验验证转向规模化部署。峰会发布的新产品矩阵（如AWS Context、Amazon Quick等）旨在解决企业级落地的数据治理、跨应用集成和安全等核心痛点。报告指出，数据基础设施公司（如Snowflake、Elastic）将直接受益于AI工作负载增长，但数据治理能力已成为AI能否从试点项目融入核心业务流程的关键变量。花旗维持亚马逊“买入”评级，预计AWS云业务收入增速将从FY26的30%加速至FY27的37%，并认为该预测可能偏保守。投资逻辑关注AWS收入增速兑现、数据基础设施商的收入弹性，以及相关产品使用量的增长信号。

marsbit6 小時前

marsbit6 小時前

交易

現貨

合約

中美AI对弈之下的算力难题

文章摘要

相關問答

你可能也喜歡

BTC 市场脉搏：第 26 周

臭名昭著的MEV机器人JaredFromSubway被盗取750万美元

研报解读：摩根大通详解美光季报前买方情绪、硬件板块近况

研报解读：美联储新主席首秀，换了掌门，但没换剧本？

研报解读：花旗参会 AWS 峰会，看好云业务加速但数据治理仍是关键变量

交易

熱門分類

熱門標籤