不只DeepSeek,大厂都想“抛弃”英伟达

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

英伟达凭借AI芯片市场的统治地位,毛利率高达75.2%,市值近5万亿美元,但各大AI公司正试图摆脱对其依赖。DeepSeek V4在训练中使用英伟达芯片,但正与华为昇腾等国产芯片适配推理,以降低成本。谷歌、Meta等美国公司也自研TPU和MTIA芯片,构建“自研+外采”算力体系。黄仁勋承认摩尔定律趋近终结,并认为对华芯片出口限制将促使中国形成自主生态。 OpenAI因巨额算力成本压力,积极寻求替代方案,与Cerebras签署超200亿美元协议,部署其晶圆级芯片以降低推理延迟和成本。Cerebras采用整块晶圆单芯片设计,避免“内存墙”问题,但其业务高度依赖OpenAI和G42等少数客户,财务盈利存在会计操作成分,面临地缘政治和竞争风险。英伟达则通过授权Groq技术等策略保持优势。 尽管挑战者涌现,但算力需求持续增长,市场多元化竞争加剧,英伟达仍占据主导地位,但不再唯一。

全世界都眼馋英伟达的生意。

根据英伟达公布的2026财年第四季度(截至2026年1月底)财报,其GAAP毛利率高达75.2%,简直印钞机,而这般印钞能力主要源于它在AI芯片市场的统治级地位所带来的强大定价权。

几乎所有大模型都奔跑在英伟达的算力芯片上,支撑起它那近5万亿美元的市值。

但正因为如此,也几乎所有AI大厂都明里暗里试图摆脱英伟达的围笼,不想把命运交给它。刚刚发布的DeepSeek V4,在技术报告上看,训练部分大概率还是用英伟达芯片,但在与华为的昇腾算力芯片做推理适配,并且表示下半年昇腾950上市后Pro版的token价格将大幅下调。此外,除了华为昇腾,天数智芯、寒武纪等国产芯片厂商也表示已支持DeepSeekV4新模型。

在英伟达的大本营美国,谷歌自研了TPU(张量处理单元)算力芯片,截至2026年4月,TPU已发展到第八代,形成了完整的训练与推理芯片产品线。Meta在今年3月也披露了自研AI芯片路线图,计划2027年底前部署四款MTIA系列新品,适配内部AI业务算力需求,同时维持与英伟达、AMD的大规模采购合作,构建“自研+外采”双轨算力供给体系。

是的,一时半会,还是没有哪家AI公司能绕开英伟达,但黄仁勋还是感受到了危机。在最近的一次播客采访里,黄仁勋认为摩尔定律正在走向终结,即芯片性能每年翻倍的时代已经过去了,今天最先进的芯片的性能优势不会是永恒的护城河,而是有时间窗口的相对优势。一旦制程逼近物理极限,后来者的追赶难度反而会降低。

黄仁勋表示限制对华出口算力芯片,短期确实会延缓中国AI的发展速度,但长期来看,这只会逼迫中国形成自己的生态链。他还没深入谈论下去的是,目前只有中国AI公司在致力于开源,并被众多公司、创业公司所采用,如果越来越多的开源模型跑在中国产的算力芯片上,那英伟达纵使依旧占据市场第一,但也将不再是唯一。

事实上,即使没有中国开源大模型、算力芯片的威胁,市场竞争也想促使算力芯片形成双寡头结构,而不是让英伟达一家独大。

有意思的是,这其中,极度依赖英伟达的Open AI反而是最积极“背刺”它的那家。

01

当地时间4月17日,美国AI芯片制造商Cerebras正式向美国SEC提交IPO申请,目标融资30亿美元,估值达350亿美元。

在2025年10月撤回上一轮IPO申请后,这家以“晶圆级芯片”为核心卖点的英伟达挑战者用半年时间就再次向IPO发起冲刺,并成功将公司估值从81亿美元推高至350亿美元。

轮估值暴涨的核心支点,是一份与OpenAI签订的总额超200亿美元的合作协议。

根据协议,OpenAI承诺在未来三年内使用Cerebras芯片驱动的服务器集群,Cerebras则将为后者部署750兆瓦算力,预计2028年完成全部部署。此外,OpenAI还将向Cerebras提供约10亿美元资金帮助其开发数据中心,并获得约10%的认股权证。

显然,OpenAI已经不算是单纯的客户了,而是债权人,也可能是未来的大股东。选择此时重新冲击IPO,大概率也是两家公司的一致决定。

在Cerebras递交IPO文件的同一天,包括Sora负责人Bill Peebles在内的OpenAI三位核心高管宣布离职。同时,曾被视为美国AI基础设施里程碑的5000亿美元“星际之门”计划也正处于一团乱麻状态,内部协调与融资问题进展缓慢。

据媒体披露,2025年OpenAI营收131亿美元,亏损高达80亿美元,预计今年亏损将飙升至250亿美元。在巨额亏损的压力下,OpenAI甚至不得不自断手臂,砍掉了备受欢迎的视频生成产品Sora。

有分析称,Sora的日均算力成本约为1500万美元,10秒高精度视频的成本约33美元。而在Sora运营期间,用户付费总收入仅有210万美元。

在这样动荡的时期,奥尔特曼自然清楚对英伟达的过度依赖会成为OpenAI最大的软肋。

此前,OpenAI相继宣布与博通合作开发定制芯片,采用AMD新款MI450芯片,频频向外界传递明确信号——不想再给英伟达打工了。正是在这样的背景下,Cerebras成了OpenAI“去英伟达化”战略中关键的押注对象。

Cerebras的知名度尽管不显,却在芯片制造企业中有着独特性。

芯片设计巨头们几乎都遵循“切晶圆、做小芯片”的路线,Cerebras则关注到了数据在芯片之间搬来搬去时撞上的“内存墙”,因而它采用了一条更激进的单芯片技术路线。

Cerebras的核心产品是以整块300mm晶圆打造的单芯片晶圆级引擎WSE-3。由于计算、存储、互联全在单芯片内,数据传输延迟较GPU集群降低90%,尤其适配大模型低延迟推理。

在推理场景下,晶圆级架构有望让单位token成本降低80%。

OpenAI计算基础设施部门负责人表示,Cerebras为平台新增了专属低延迟推理解决方案,不仅能让用户获得更快响应速度,也将为实时AI技术拓展至更广泛用户群体奠定基础。

更重要的是,Cerebras开辟的非HBM依赖路线,可能会打破英伟达近乎垄断的芯片行业格局,让算力供应变得更多元。

这些都恰到好处地击中了OpenAI最痛的部位,两者的合作自然水到渠成。

除了OpenAI,Cerebras在3月还跟AWS达成了合作,CS-3会部署在亚马逊的数据中心,进入主流超大规模云平台的基础设施体系。

02

“这个快速迭代的行业最令人兴奋之处就在于:算法将不断变得更快速、精准和高效——正因如此我才不愿投身那些九年如一日的传统行业。”

Cerebras能够走到现在的位置,与创始人AndrewFeldman密不可分。

与典型的芯片公司创始人是工程师出身不同,Feldman毕业于斯坦福大学,拥有经济学、政治学学士学位和MBA。从职业生涯伊始,他就持续在产品和营销领域积累,这种职业路径让他对什么样的商业模式能跑通有着天然嗅觉。

随着经验积累,Feldman也逐渐从打工人转变为连续创业者。

而所有连续创业者都有一个极其明显的特性——想赢,不顾一切地要赢。这种人不是普通的“好胜”,而是把“赢”当作呼吸一样不可或缺。他们通常选择在行业共识的“无人区”下注,在大多数人觉得“没必要”或“不可能”的方向上孤注一掷。换句话说,“赌性”比较大。

2007年,Feldman创办了服务器公司SeaMicro。

“如今大型处理器在使用中就如同我们开着航天飞机去杂货店买东西一样。实际上,我只需要开着普锐斯去就行了。”

SeaMicro摒弃了传统服务器“堆料”的思路,把CPU、内存和一颗自研ASIC之外的所有组件全部移除,为需要“横向扩展”负载的专业互联网公司提供“更多的核心”,该公司在2012年被AMD以3.55亿美元收购。

虽然微服务器业务并入AMD后渐渐没了声响,但这段经历让Feldman完成了财富积累,也让他进一步坚定了自己的创业方法论:在代际变革的节点上,用“反主流”的硬件设计切入巨头尚未覆盖的细分市场。

按照行业常规,芯片良率随面积增大而下降。当芯片企业都沿着英伟达的路往前走的时候,Feldmam用很“外行”的思考方式决定直接做盘子大小的整颗芯片。

2015年,Feldman和技术搭档Gary Lauterbach共同成立了Cerebras,并拉来了多位曾在SeaMicro工作过的老部下。Cerebras沉寂了整整四年时间,直到2019年8月发布了第一代WSE-1。

在这段默默无闻的研发期,Feldman赌的是两个东西:一个是台积电的晶圆级封装技术会逐渐成熟,另一个是AI模型规模会大到让GPU的内存墙成为致命瓶颈。

从当前的发展看,他赌对了。

2019年到2024年,Cerebras每两年推出一代新品,制程从16nm跳到7nm再跳到5nm,晶体管数从1.2万亿滚到4万亿。与此同时,Feldman开始主动出击寻找大客户。2023年,他飞到阿布扎比拿下了G42。

Cerebras和G42合作训练了阿拉伯语领域最领先的语言模型,共同创建了由九台互连超级计算机组成的网络CondorGalaxy。和这家中东企业的密切合作也引发了美国外国投资委员会对Cerebras的国家安全审查,但Feldman不在乎——审查说明自身的实力。

“如果你每周只工作38个小时,还想挑战像英伟达这样的800磅大猩猩?门都没有。你需要清醒时的每一分钟。”

Feldman曾在访谈里被问过“工作与生活平衡”的看法,他做出了颇为激进的否定回答。他毫不掩饰想要向英伟达发起挑战的雄心壮志。

参照英伟达十年百倍增长,Feldman对Cerebras的前景抱有颇为乐观的预期:要在未来3到5年开发出针对百万级患者的治疗方案;为尚未问世的应用提供推理算力;让民众无感知地使用公司技术。

03

Cerebras冲刺IPO面临着此起彼伏的争议,乐观者期待着见证第二个英伟达的诞生,唱衰者则质疑在其业绩的稳定性。

从官方披露的财务信息来看,2022年至2025年Cerebras营收从2460万美元增长至5.1亿美元,四年复合增速达175%。尤其突出的是,2025年GAAP净利润为2.38亿美元,成功扭转了2024年净亏损4.82亿美元的颓势。

但仔细分析会知道,GAAP盈利得益于一笔3.63亿美元的非现金账面收益,这个收益实际是因美国安全审查而将G42相关负债从资产负债表中移除的会计操作。剔除这项非经常性项目后,公司非GAAP净亏损实际为7570万美元。

换句话说,Cerebras的“扭亏为盈”是会计游戏。

2023年和2024年,G42分别贡献了Cerebras总营收的83%和87%。在地缘政治冲突越发严重的情况下,依赖来自中东的单一客户的风险性可想而知。毕竟,Cerebras首次IPO被撤回就有来自国家安全审查的缘故。

根据招股书,公司高达246亿美元的剩余履约义务绝大部分依赖于跟OpenAI签订的200亿美元协议。换言之,Cerebras的预期收入几乎完全建立在OpenAI的远期承诺之上,而非分散化的大规模客户基础。

这份“强心剂”式的订单能否兑现取决于OpenAI自身的命运走向。当最大客户的稳定性本身都在被市场反复打量时,这张“空头支票”能落实多少,恐怕Feldman自己也无法打包票。

与英伟达对比则更能看出Cerebras的劣势。

在AI行业大爆发之前,英伟达就已经建立了游戏、专业可视化、数据中心等多个领域的多元化客户基础,没有任何单一客户能占据其超过10%的收入。英伟达在二十余年的演进过程中与数百万开发者深度绑定,每一次产品迭代都源于内在生态扩张的需求,产品规划路径很清晰。Cerebras生态处于非常早期阶段,仍然是推理场景下的单点突破,距离真正的平台型企业还有很长的路要走。

哪怕没有ChatGPT的横空出世,英伟达也是一家营收稳定、利润可观的优质企业。可要是离开了OpenAI的200亿美元大单,Cerebras恐怕都没有冲刺IPO的可能性。

2025年12月,英伟达与Cerebras的竞争对手Groq达成了一项价值约200亿美元现金的特殊合作协议,英伟达获得了GroqLPU推理架构、芯片设计全栈技术的永久非独家授权。

黄仁勋下场代表着Cerebras低延迟专用推理架构的价值得到了业界巨头的认可,但是也让Cerebras面临的竞争压力急剧爬升。

从现实出发,OpenAI引入Cerebras不是为了替换,而是成为“鲶鱼”,增加谈判筹码,分散供应链风险。

有消息称,英伟达基于Groq芯片的系统将于2026年下半年推出。要是奥尔特曼转过头又和黄仁勋达成了一致,Cerebras很可能成为牺牲品。

在AI芯片这个万亿级赛道中,多元化竞争对行业生态的长期发展无疑是件好事。但资本市场向来不缺造富神话与舆论炒作,Cerebras能否真正兑现技术与商业价值还要跨过多重考验。

“英伟达挑战者”这个动听的名头,也搞不好会变成昙花一现的泡沫。

但正如“杰文斯悖论”所揭示的,技术进步会提高资源的利用效率,降低单位产出成本,而人们用得起用得多了,反而会导致资源的‌总消耗量不降反增‌。随着AI更大幅度渗透到人们生活的方方面面,在可预见的未来,算力需求依然会高速增长。

这个千亿乃至数千亿级美元的超级大市场,不止关乎经济,更涉及到地缘安全,谁都不想把命运的钥匙交给英伟达一家所掌握。

但显然,即便是出于自尊,黄仁勋也不会轻易交出钥匙。

本文来自微信公众号“最话FunTalk”(ID:iFuntalker),作者:何伊然,编辑:刘宇翔

相关问答

Q为什么各大AI公司都试图摆脱对英伟达的依赖?

A因为英伟达在AI芯片市场具有统治级地位和强大定价权,毛利率高达75.2%,AI公司不想将命运完全交给它,希望降低成本和供应链风险,并寻求算力供应的多元化。

QDeepSeek V4在算力适配方面有哪些动作?

ADeepSeek V4在训练部分仍使用英伟达芯片,但正与华为昇腾算力芯片做推理适配,并计划在昇腾950上市后下调Pro版的token价格。此外,天数智芯、寒武纪等国产芯片厂商也已支持DeepSeek V4新模型。

QOpenAI与Cerebras的合作内容是什么?

AOpenAI与Cerebras签订了总额200亿美元的合作协议,承诺在未来三年内使用Cerebras芯片驱动的服务器集群,Cerebras将为OpenAI部署750兆瓦算力。OpenAI还提供10亿美元资金帮助Cerebras开发数据中心,并获得约10%的认股权证。

QCerebras的晶圆级芯片技术有什么优势?

ACerebras采用整块晶圆打造的单芯片晶圆级引擎WSE-3,计算、存储、互联全在单芯片内,数据传输延迟较GPU集群降低90%,尤其适配大模型低延迟推理,单位token成本可降低80%。

QCerebras面临的主要风险和挑战有哪些?

ACerebras依赖单一客户G42和OpenAI的大额订单,地缘政治和客户稳定性风险高;其盈利依赖会计操作,实际仍亏损;生态建设早期,面临英伟达和Groq的竞争;OpenAI可能转而与英伟达合作,使其订单存在不确定性。

你可能也喜欢

从封杀豆包到拥抱荣耀,微信为什么突然“变脸”?

从严防死守到主动合作,微信对手机AI助手的态度在近期发生了180度转变。过去一年,微信曾封杀字节跳动豆包手机、限制OPPO“AI一键闪记”等功能,坚决反对第三方通过模拟点击操控微信。如今,微信却与华为、荣耀、小米等多家厂商合作,推出A2A(智能体到智能体)助手能力,允许用户通过系统AI助手直接发送微信消息、拨打语音电话。 这一转变源于腾讯在AI竞争中的焦虑。其AI应用“元宝”月活远低于竞争对手,而微信坐拥14亿月活和小程序生态,成为腾讯在AI时代的关键底牌。微信正内测AI智能体,旨在通过自然语言调用小程序服务,但需要打通手机系统这一首要AI入口。A2A合作让手机厂商的智能体作为“接线员”,将用户指令转交微信执行,腾讯借此既保住了生态控制权,又接入了系统级流量。 与之前被封杀的GUI(图形界面模拟操作)路线不同,A2A采用双重授权机制,通过标准化接口调用,微信在其中占据主导。手机厂商之所以愿意合作,是因为GUI强攻路线已被证明行不通,而A2A为其保留了在系统级AI场景中的发展空间,并有助于在激烈的行业竞争中快速提升AI整合能力。尽管存在数据隐私担忧,但A2A被视为比模拟点击更安全合规的路径。 这场合作本质是双方在AI入口争夺中的阶段性妥协:腾讯需要手机入口为微信AI引流,手机厂商则需要突破跨应用调用的合规瓶颈。长远看,腾讯试图将微信打造为AI“服务操作系统”,而手机厂商则希望用户深度依赖系统自带助手,双方生态战略的博弈将持续。AI时代的入口之争,已随着用户一句“帮我发微信”悄然展开。

marsbit45分钟前

从封杀豆包到拥抱荣耀,微信为什么突然“变脸”?

marsbit45分钟前

从SpaceX上市看Crypto未来:哪些加密板块将承接万亿叙事?

SpaceX计划以1.77万亿美元估值上市,其整合火箭、星链、AI与轨道数据中心的超级叙事,反映出资本正围绕AI、基础设施和未来生态重新配置。这一趋势可能为加密市场带来资金溢出效应,推动以下板块成为下一轮周期核心: 首先,AI叙事进入下半场,市场焦点从应用转向“卖铲人”式的基础设施。算力成为稀缺资源,类似TAO的AI网络协议,以及RENDER、AKT等提供算力流动性的项目,其估值逻辑可能向更持久的基础设施价值迁移。 其次,万亿美元级资产上链可能推动RWA(真实世界资产)爆发式发展。未来方向可能从国债扩展至股权、未上市资产等,通过链上化打破一二级市场壁垒,重构资产发行、交易与清算模式。基础设施如ONDO、LINK等或将率先受益。 最后,稳定币、支付网络与DePIN(去中心化物理基础设施)作为底层支撑逻辑日益重要。稳定币需求将超越交易媒介,成为链上经济与全球资产流通的基石;支付网络可能演变为关键入口;而DePIN通过代币激励建设现实世界网络,其基础设施价值有望获得重估。 SpaceX上市事件揭示了资本从追逐故事转向追逐基础设施与现金流的路径。加密市场中,AI基础设施、RWA、稳定币、支付网络及DePIN等板块更贴近未来周期的底层逻辑,它们可能不是短期涨幅最快,但或许是建设下一代数字生态系统的关键赢家。

marsbit1小时前

从SpaceX上市看Crypto未来:哪些加密板块将承接万亿叙事?

marsbit1小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.5k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片