中国AI算力反击战

marsbit发布于2026-03-04更新于2026-03-04

文章摘要

八年前中兴通讯因美国芯片禁令一度停摆,付出14亿美元代价后艰难生存。八年后,中国AI独角兽DeepSeek宣布其新一代多模态大模型将全面采用国产芯片方案,标志着中国AI算力自主迈出关键一步。 美国对华芯片管制层层加码,但真正卡住中国AI发展咽喉的是英伟达的CUDA生态——全球90%的AI开发者被绑定在这一平台上。面对封锁,中国选择非对称突围:通过混合专家模型等算法优化大幅降低成本。DeepSeek V3模型仅激活5.5%参数,训练成本仅为GPT-4的十分之一,API价格低至美国模型的1/25。 国产芯片实现从推理到训练的能力跨越。华为昇腾芯片生态已汇聚400万开发者,龙芯、太初元碁等国产芯片开始承担大模型训练任务。2026年成为国产算力规模部署元年。 与此同时,美国正面临AI算力带来的电力危机,预计2030年数据中心将耗用全国20%以上电力。中国凭借发电总量2.5倍于美国、工业电价仅其1/4的优势,开始以"算力出海"新形态向全球输出Token服务。 这场算力战争本质是生态之争。本土芯片企业寒武纪、摩尔线程等营收暴涨却仍见亏损,正是为构建独立生态支付的"战争税"。与日本半导体遭遇不同,中国正通过算法创新、芯片自主、能源优势和全球市场渗透,走出一条艰难的产业自主之路。

八年前,中兴心脏骤停。

2018 年 4 月 16 日,美国商务部工业与安全局的一纸禁令,让中兴通讯这家拥有 8 万名员工、年营收超千亿的全球第四大通信设备商,在一夜之间停摆。禁令内容很简单,未来七年,禁止任何美国公司向中兴出售零部件、商品、软件和技术。

没有了高通的芯片,基站停产。没有了谷歌的安卓授权,手机也没有能用的系统了。23 天后,中兴发布公告,称公司主要经营活动已无法进行。

不过中兴最终活了下来,但代价是 14 亿美元。

10 亿美元罚款,一次性付清;4 亿美元保证金,存入美国银行的托管账户。此外,全部高管换血,接受美方合规监督团队进驻。2018 年全年,中兴净亏损 70 亿元人民币,营收同比暴跌 21.4%。

时任中兴董事长殷一民在内部信中写道:「我们身处在一个复杂的、高度依赖全球供应链的产业中。」这句话,在当时听来,是反思,也是无奈。

八年后,2026 年 2 月 26 日,中国 AI 独角兽 DeepSeek 宣布,其即将发布的 V4 多模态大模型,将优先与国产芯片厂商深度合作,首次实现从预训练到精调的全流程非英伟达方案。

翻译一下就是:我们不用英伟达了。

消息一出,市场的第一反应是质疑。英伟达在全球 AI 训练芯片市场的份额超过 90%,放弃它,这在商业上合理吗?

但 DeepSeek 的选择背后,藏着一个比商业逻辑更大的问题:中国 AI,到底需要一场怎样的算力独立?

被卡脖子的到底是什么

很多人以为,芯片禁令卡住的是硬件。但真正让中国 AI 公司感到窒息的,是一个叫 CUDA 的东西。

CUDA,全称 Compute Unified Device Architecture,是英伟达在 2006 年推出的一套并行计算平台和编程模型。它允许开发者直接调用英伟达 GPU 的算力,来加速各种复杂的计算任务。

在 AI 时代到来之前,这只是一个属于少数极客的工具。但当深度学习的浪潮袭来,CUDA 变成了整个 AI 产业的地基。

AI 大模型的训练,本质上就是海量的矩阵运算。而这恰恰是 GPU 最擅长的工作。

英伟达凭借提前十几年的布局,用 CUDA 为全球的 AI 开发者搭建了一整套从底层硬件到上层应用的完整工具链。今天,全球所有主流的 AI 框架,从谷歌的 TensorFlow 到 Meta 的 PyTorch,底层都与 CUDA 深度绑定。

一个 AI 专业的博士生,从入学第一天起,就是在 CUDA 的环境里学习、编程、做实验。他写的每一行代码,都在加固英伟达的护城河。

截至 2025 年,CUDA 生态已经拥有超过 450 万开发者,覆盖了 3000 多个 GPU 加速应用,全球超过 4 万家公司在使用 CUDA。这个数字意味着全球 90% 以上的 AI 开发者,都被绑定在英伟达的生态里。

CUDA 的可怕之处在于,它是一个飞轮。越多的开发者使用,就会产生越多的工具、库和代码,生态就越繁荣;生态越繁荣,就越能吸引更多的开发者加入。这个飞轮一旦转起来,就几乎无法被撼动。

结果就是,英伟达卖给你最贵的铲子,还定义了唯一的挖矿姿势。你想换一把铲子?可以。但你得先把过去十几年里,全球几十万最聪明的大脑在这个姿势下积累的所有经验、工具和代码,全部重写一遍。

这个成本,谁来付?

所以,当 2022 年 10 月 7 日,BIS 第一轮管制落地,限制英伟达 A100 和 H100 对华出口时,中国的 AI 公司们,第一次集体感受到了中兴式的窒息感。英伟达随后推出了「中国特供版」A800 和 H800,降低了芯片间的互联带宽,勉强维持供应。

但仅仅一年后,2023 年 10 月 17 日,第二轮管制再次收紧,A800 和 H800 也被禁,13 家中国公司被列入实体清单。英伟达不得不再推出进一步阉割的 H20。到 2024 年 12 月,拜登政府任期内的最后一轮管制落地,连 H20 的出口都被严格限制。

三轮管制,层层加码。

但这一次,故事的走向,和当年的中兴完全不同。

一场非对称的突围

禁令之下,所有人都以为,中国 AI 的大模型之梦会就此终结。

他们都错了。面对封锁,中国公司并没有选择正面硬刚,而是开始了一场突围。这场突围的第一个战场,不在芯片,而在算法。

2024 年底到 2025 年,中国的 AI 公司们集体转向了一个技术方向:混合专家模型。

简单来说,就是把一个巨大的模型拆分成很多个小专家,处理任务时只激活其中最相关的几个,而不是让整个模型都动起来。

DeepSeek 的 V3 就是这个思路的典型代表。它拥有 6710 亿个参数,但每次推理只激活其中的 370 亿个,仅占总量的 5.5%。训练成本方面,它使用了 2048 块英伟达 H800 GPU,训练 58 天,总花费 557.6 万美元。作为对比,外界对 GPT-4 训练成本的估算,大约在 7800 万美元。一个量级的差距。

算法上的极致优化,直接反映到了价格上。DeepSeek 的 API 价格,输入每百万 Token 仅 0.028 到 0.28 美元,输出 0.42 美元。而 GPT-4o 的输入价格是 5 美元,输出 15 美元。Claude Opus 更贵,输入 15 美元,输出 75 美元。换算下来,DeepSeek 比 Claude 便宜了 25 到 75 倍。

这个价格差,在全球开发者市场上反响巨大。2026 年 2 月,全球最大的 AI 模型 API 聚合平台 OpenRouter 上,中国 AI 模型的周调用量在三周内暴涨 127%,首次超越美国。一年前,中国模型在 OpenRouter 上的份额不足 2%。一年后,增长了 421%,逼近六成。

这组数据背后,有一个容易被忽视的结构性变化。2025 年下半年开始,AI 应用的主流场景从聊天转向了 Agent。Agent 场景下,一次任务的 Token 消耗量是简单聊天的 10 到 100 倍。当 Token 的消耗量指数级增长时,价格就成了决定性因素。中国模型的极致性价比,恰好踩中了这个窗口。

但问题是,推理成本的降低,并没有解决训练的根本问题。一个大模型如果不能在最新的数据上持续训练、迭代,它的能力就会迅速退化。而训练,依然是那个绕不开的算力黑洞。

那么,训练的「铲子」,从哪里来?

备胎的转正

江苏兴化,苏中小城,以不锈钢和健康食品闻名,此前和 AI 没有任何关系。但 2025 年,一条 148 米长的国产算力服务器产线在这里建成投产,从签约到投产,只用了 180 天。

这条产线的核心,是两颗完全国产的芯片:龙芯 3C6000 处理器和太初元碁 T100 AI 加速卡。龙芯 3C6000,从指令集到微架构全部自主研发。太初元碁脱胎于国家超级计算无锡中心和清华大学团队,采用异构众核架构。

这条产线满产时,5 分钟下线一台服务器,这条生产线总投资 11 亿元,预计年产 10 万台。

更重要的是,基于这些国产芯片组成的万卡集群,已经开始承接真正的大模型训练任务。

2026 年 1 月,智谱 AI 联合华为发布了 GLM-Image,这是首个完全依托国产芯片实现全程训练的 SOTA 图像生成模型。2 月,中国电信的千亿级「星辰」大模型,在上海临港的国产万卡算力池上完成了全流程训练。

这些案例的意义在于,它们证明了一件事:国产芯片,已经从「能用于推理」跨越到了「能用于训练」。这是质变。推理只需要跑已经训练好的模型,对芯片的要求相对较低;而训练需要处理海量数据、进行复杂的梯度计算和参数更新,对芯片的算力、互联带宽和软件生态的要求,高出一个数量级。

承担这些任务的核心力量,是华为的昇腾系列芯片。截至 2025 年底,昇腾生态的开发者数量已突破 400 万,合作伙伴超过 3000 家,43 个业界主流大模型基于昇腾完成了预训练,200 多个开源模型完成了适配。2026 年 3 月 2 日的 MWC 大会上,华为还面向海外市场首发了新一代算力底座 SuperPoD。

昇腾 910B 的 FP16 算力已经对标英伟达 A100。虽然差距依然存在,但已经从不可用变成了可用,从可用正在走向好用。生态的建设,不能等到芯片完美了再开始,必须在够用的阶段就大规模铺开,用真实的业务需求去倒逼芯片和软件的迭代。字节跳动、腾讯、百度对国产算力服务器的导入目标,2026 年普遍较上一年翻倍增长。工信部的数据显示,中国智算规模已达 1590 EFLOPS。2026 年,正在成为国产算力规模部署的元年。

美国电荒与中国出海

2026 年初,承载了全球大量数据中心流量的弗吉尼亚州,暂停批准新的数据中心建设项目。佐治亚州跟进,暂停审批延续到 2027 年。伊利诺伊州、密歇根州也相继出台限制措施。

根据国际能源署的数据,2024 年美国数据中心耗电量已达 183 太瓦时,约占全国总用电量的 4%。到 2030 年,这个数字预计翻倍至 426TWh,占比可能突破 12%。Arm 公司 CEO 更是预测,到 2030 年,AI 数据中心将消耗美国 20% 到 25% 的电力。

美国的电网已经不堪重负。覆盖美国东部 13 个州的 PJM 电网面临 6GW 的容量短缺。到 2033 年,美国整体面临 175GW 的电力容量缺口,相当于 1.3 亿户家庭的用电量。数据中心集中区域的批发电力成本,比五年前高出了 267%。

算力的尽头,是能源。而在能源这个维度上,中美之间的差距,比芯片还要大,只不过方向反了过来。

中国的年发电量是 10.4 万亿度,美国是 4.2 万亿度,中国是美国的 2.5 倍。更关键的是,中国的居民生活用电仅占总用电量的 15%,而美国这个比例是 36%。这意味着中国有远比美国更大的工业用电余量可以投入算力建设。

在电价上,美国 AI 公司聚集区的电价在 0.12 到 0.15 美元每千瓦时,而中国西部的工业电价约为 0.03 美元,仅为美国的四分之一到五分之一。

中国的发电增量,已经达到美国的 7 倍。

就在美国为电发愁的时候,中国的 AI 正在悄悄出海。但这一次出海的,不是产品,不是工厂,而是 Token。

Token,AI 模型处理信息的最小单位,正在成为一种新的数字商品。它从中国的算力工厂里被生产出来,通过海底光缆输送到全球。

DeepSeek 的用户分布数据很能说明问题:中国本土占 30.7%,印度 13.6%,印尼 6.9%,美国 4.3%,法国 3.2%。它支持 37 种语言,在巴西等新兴市场广受欢迎。全球有 2.6 万家企业开通了账户,3200 家机构部署了企业版。

2025 年,58% 的新 AI 创业公司把 DeepSeek 纳入了技术栈。在中国,DeepSeek 拿下了 89% 的市场份额。而在其他受制裁国家,市场份额则在 40%~60% 不等。

这幅景象,像极了四十年前的另一场关于产业自主权的战争。

1986 年的东京,在美国的强大压力下,日本政府签订了《美日半导体协议》。协议的核心条款有三条:要求日本开放半导体市场,美国芯片在日本的市场份额须达到 20% 以上;严禁日本半导体以低于成本价格出口;对日本出口的 3 亿美元芯片征收 100% 惩罚性关税。同时,美国否决了富士通对仙童半导体的收购。

那一年,日本半导体产业正处在巅峰。1988 年,日本控制了全球半导体市场 51% 的份额,美国只有 36.8%。全球十大半导体公司,日本独占六席:NEC 排名第二,东芝第三,日立第五,富士通第七,三菱第八,松下第九。1985 年,Intel 在美日半导体争夺战中亏损 1.73 亿美元,濒临破产。

但协议签订后,一切都变了。

美国通过 301 调查等手段,对日本半导体企业发起了全方位的压制。同时扶持韩国的三星、海力士,以更低的价格冲击日本的市场。日本的 DRAM 份额从 80% 跌至 10%。到 2017 年,日本 IC 市场份额仅剩 7%。曾经不可一世的巨头们,或被拆分,或被收购,或在无休止的亏损中黯然离场。

日本半导体的悲剧在于,它满足于在一个由单一外部力量主导的全球分工体系中,做那个最优秀的生产者,却从未想过去构建一个属于自己的、独立的生态。当潮水退去,它才发现,自己除了生产本身,一无所有。

今天的中国 AI 产业,正站在一个相似却又完全不同的路口。

相似的是,我们同样面临着来自外部的巨大压力。三轮芯片管制,层层加码,CUDA 生态的壁垒依然高耸。

不同的是,这一次,我们选择的是一条更难的路。从算法层面的极致优化,到国产芯片从推理到训练的跨越,再到昇腾生态 400 万开发者的积累,再到 Token 出海对全球市场的渗透。这条路上的每一步,都在构建一种日本当年从未拥有过的独立产业生态。

尾声

2026 年 2 月 27 日,三份来自本土 AI 芯片公司的业绩快报,在同一天发布。

寒武纪,营收暴增 453%,首次实现全年盈利。摩尔线程,营收增长 243%,但净亏损 10 亿。沐曦,营收增长 121%,净亏损近 8 亿。

一半是火焰,一半是海水。

火焰,是市场的极度饥渴。黄仁勋让出的那 95% 的空白,正在被这些本土公司的营收数字,一寸一寸地填满。无论性能如何,无论生态怎样,市场需要英伟达之外的第二个选择。这是地缘政治撕开的、一个千载难逢的结构性机会。

海水,是生态建设的巨大成本。每一分亏损,都是为追赶 CUDA 生态而付出的真金白银。是研发的投入,是软件的补贴,是派驻到客户现场、一个一个解决编译问题的工程师的人力成本。这些亏损,不是经营不善,而是构建一个独立生态所必须支付的战争税。

这三份财报,比任何一份行业报告都更诚实地记录了这场算力战争的真实面貌。它不是一场高歌猛进的胜利,而是一场惨烈的、一边流血一边冲锋的阵地战。

但战争的形态,确实已经变了。八年前,我们讨论的是「能不能活下来」的问题。今天,我们讨论的是「活下来要付出多大代价」的问题。

代价本身,就是进步。

相关问答

Q什么是CUDA,为什么它对中国AI产业如此重要?

ACUDA是英伟达推出的并行计算平台和编程模型,允许开发者直接调用GPU算力加速计算任务。在AI时代,它成为全球AI产业的地基,几乎所有主流AI框架(如TensorFlow、PyTorch)都深度绑定CUDA。中国AI产业依赖CUDA生态,但美国芯片禁令使中国公司面临无法使用CUDA的风险,导致算力受限,因此摆脱对CUDA的依赖成为中国AI算力独立的关键。

QDeepSeek的V4多模态大模型宣布了什么重要决策?

ADeepSeek宣布其V4多模态大模型将优先与国产芯片厂商深度合作,首次实现从预训练到精调的全流程非英伟达方案,这意味着他们不再使用英伟达芯片,转向国产算力解决方案。

Q中国AI公司如何通过算法优化应对算力限制?

A中国AI公司转向混合专家模型(MoE)技术,将大模型拆分为多个小专家,仅激活相关部分处理任务,大幅降低计算成本。例如DeepSeek V3拥有6710亿参数但每次推理仅激活5.5%,训练成本仅为GPT-4的约1/14,API价格比Claude模型便宜25到75倍,从而以极致性价比抢占全球市场。

Q国产芯片在AI训练方面取得了哪些突破?

A国产芯片如华为昇腾910B已实现对英伟达A100的算力对标,并从仅能用于推理跨越到能用于训练。2026年,智谱AI和华为联合发布了完全依托国产芯片训练的GLM-Image模型,中国电信的千亿级“星辰”大模型也在国产万卡算力池上完成全流程训练,证明国产芯片已具备大模型训练能力。

Q中美在AI算力领域的能源优势对比如何?

A中国在能源方面具有显著优势:年发电量是美国的2.5倍(10.4万亿度 vs 4.2万亿度),工业用电余量更大(中国居民用电占比15% vs 美国36%),电价仅为美国的1/4到1/5(0.03美元/千瓦时 vs 0.12-0.15美元/千瓦时)。而美国正面临电力短缺,多个州暂停新建数据中心,预计2030年AI数据中心将消耗美国20%-25%的电力。

你可能也喜欢

a16z:区块链为 AI 代理基础设施提供帮助的 5 种方式

人工智能代理正迅速从“副驾驶”转变为经济参与者,但其发展速度超过了现有基础设施的支持能力。当前代理缺乏标准化的方法证明身份、权限和跨环境报酬机制,身份无法跨平台共享,支付方式尚未实现可编程,协调工作也各自独立。 区块链技术为代理基础设施提供了关键支持,主要体现在五个方面: 1. **非人类身份**:代理经济当前的瓶颈是身份而非智能。区块链提供可移植的身份层、可编程钱包和可验证证明,帮助代理建立跨平台的可信身份(KYA,了解你的代理),解决权限证明和跨平台独立运作问题。 2. **AI运行系统治理**:当代理操作关键系统时,治理成为核心问题。区块链通过链上记录和自动执行决策,确保代理行为符合用户利益,防止模型供应商单方面控制结果,实现真正的去中心化治理。 3. **支付系统空白填补**:代理开始进行无头交易(如数据购买、API调用),稳定币成为默认支付方式。加密支付支持无许可编程和低风险承保,推动代理对代理的商业发展,如x402和MPP协议已处理大量代理驱动支付。 4. **重新定价信任**:当智能成本趋近于零时,验证成为稀缺资源。区块链提供可审计的历史记录和加密收据,确保代理行为的透明度和可追溯性,从而降低规模化风险,将信任硬编码到系统架构中。 5. **保留用户控制权**:随着用户将更多任务委托给代理,加密技术通过智能合约和基于意图的架构(如NEAR Intents)设定代理的行为边界,确保用户保持最终控制权,减少盲目信任。 人工智能降低了规模化门槛,但信任建立仍需依赖加密货币和区块链技术,以确保透明度、问责制和用户控制。互联网基础设施的设计需适应非人类行为者,以实现真正的代理经济。

marsbit2小时前

a16z:区块链为 AI 代理基础设施提供帮助的 5 种方式

marsbit2小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.0k人学过发布于 2025.01.15更新于 2025.03.21

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片