DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”

marsbit发布于2026-04-26更新于2026-04-26

文章摘要

DeepSeek V4和Kimi K2.6两大国产大模型相继发布,在Hugging Face开源榜单上名列前茅,展现出中国AI开源生态的协同发展。与硅谷OpenAI、Anthropic等闭源巨头之间的“权力游戏”不同,中国厂商选择开源协作、技术共享,形成了互补共进的格局。DeepSeek V4在架构优化、国产芯片适配等方面实现突破,而Kimi则聚焦Agent工程化落地。尽管目前中国大模型厂商在商业规模上仍落后于美国,但凭借更低的训练成本、更高的调用效率及开源生态的正向循环,中国AI产业正在算力自主和技术协同中稳步推进,为未来AGI发展奠定基础。

文 | Alter

4月24日上午,姗姗来迟的DeepSeek V4终于显露真身。

当天,DeepSeek-V4-Pro即登顶Hugging Face开源模型榜,两个“核弹级创新”被津津乐道:

一是百万级的超长上下文,但KV cache只有V3.2的10%,被亚马逊工程师盛赞将解决HBM短缺问题;

二是对国产芯片的适配,在研发过程中与华为紧密合作,并第一时间适配了昇腾、寒武纪等国产芯片。

巧合的是,Hugging Face开源模型榜排名第二的,正是4月20日深夜发布并开源的Kimi K2.6。

如果是在太平洋对岸,两个万亿参数模型的“撞档”,免不了为了估值、商业版图互相攻讦,国内却上演了截然不同的一幕:没有互揭老底的戏码、没有暗流涌动的公关战,甚至在技术底层进行了“换防”。

“不寻常”的背后,暗藏了中美在AI技术路线上的分歧:硅谷疯正在狂“竖起高墙”,试图用闭源守住既得利益;国大模型厂商则选择“拆掉围墙”,在开源的土壤上走向了协同进化。

01 硅谷深陷“权力的游戏”

不同于国内大模型百花齐放的开源路线,OpenAI、Anthropic、谷歌Gemini为代表的硅谷AI头羊,无不是闭源的拥趸。

当前沿的技术创新被锁死在各自的数据中心里,面对算力成本的重压和资本市场的期待,以开放与协作著称的“硅谷精神”渐渐消亡,玩家们不可避免地陷入了零和博弈的“权力游戏”。

过去两年里,技术“暗战”已经演变成公开互撕,最典型的手段就是互相“抢风头”:在竞争对手发布新产品的关键节点,迅速抛出自家的重磅更新来遏制对方的声量,已经成为硅谷的常规操作。

早在2024年5月,OpenAI和谷歌就曾同时发布AI新品,一方说GPT-4o全球领先,一方说Gemini家族能覆盖全生态全路径。最后两家公司的CEO都坐不住了,公开在社交媒体上嘲讽对方。

不只是和谷歌的“缠斗”,OpenAI与Anthropic的较量也进入了白热化:就在4月16日,Anthropic刚发布了新模型Claude Opus 4.7,OpenAI在两个多小时后便宣布Codex大幅更新,喊出了“Codex for(almost) everything”的口号。明眼人都看得出来,时间上的撞档绝非巧合,而是OpenAI针对Anthropic精心策划的一场“狙击”。

除了舆论场上的“文斗”,互相“揭老底”的“武斗”也成了硅谷的常态。

Anthropic在4月7日高调宣布年化收入达到300亿美元,成功超越OpenAI的250亿美元。

一个礼拜后,OpenAI首席营收官在给全体员工的内部信中直言不讳地指出:Anthropic对外宣称的300亿美元年化营收存在严重水分,因为它采用的是“总额法”,把分给亚马逊、谷歌等云服务商的抽成,也全额算进了自己的总营收里,导致年化收入被高估了约80亿美元。

内部信中给对手拆台的做法,在科技行业并不常见,目的无非是想告诉投资人——Anthropic的增长神话是注水的。

而一旦敌意滋生,会无孔不入地影响每一个决策。

Anthropic因拒绝删除合同中的特定安全条款与五角大楼“闹掰”后,OpenAI几个小时后就高调宣布已与美国国防部达成合作。

在2026年的“超级碗”上,Anthropic重金投放了一条广告,内容是“广告正在进入AI领域,但不会进入Claude。”可以说是对着刚开始测试广告功能的OpenAI“贴脸开大”.......

为何昔日的“同门兄弟”,走到了水火不容的地步?

根源在于闭源商业模式的固有逻辑:闭源的生存根基在于构建护城河,而构建护城河的前提就是阻断技术扩散,垄断最先进的生产力。再加上技术路线不兼容、产品叙事对立,自然而然地形成了一个纳什均衡:谁先“停火”,谁的品牌叙事就会坍塌,最终在内耗的泥潭里越陷越深。

02 开源阵营的“协同进化”

将视线转回国内,剧本的走向完全不同。

时间回到一年多前,DeepSeek-R1的横空出世,为狂奔的大模型创业赛踩了一脚刹车,进入决赛圈的大模型“六小虎”首当其冲。和硅谷最大的区别,DeepSeek没有扮演吃掉池子里所有鱼的“鲨鱼”,而是像鲶鱼一样激活了整个中国大模型生态,大家纷纷拥抱开源。

直接的例子就是和DeepSeek的成长轨迹高度重合的月之暗面 都是2023年起步的初创团队,都保持着人数极少但人才密度极高的团队结构,并且都是Scaling Law的坚定信徒。

2025年7月,月之暗面发布了全球第一个万亿参数的开源模型Kimi K2,在技术报告里毫不掩饰的说采用了DeepSeek开源的MLA架构。对于大模型来说,处理超长文本最大的噩梦是显存墙,而MLA架构的颠覆性在于,巧妙将KV Cache的压缩率做到了惊人的93%以上。

有了DeepSeek贡献的“业界标准”,月之暗面在内的大模型团队不需要重复造轮子,快速降低了推理成本。

故事并未止步于此。

翻看DeepSeek V4的技术文档,详细描述了模型的架构,其中一个重要升级是把大部分模块的优化器从AdamW换成了Muon,实现了更快的收敛速度、更优的训练稳定性。

在Kimi K2.6的技术文档中,同样提到了Muon优化器,在相同的训练量下实现了2倍的效率提升。

两个模型都提到的Muon优化器,最早由独立研究者Keller Jordan在2024年底的博客里提出。同样被AdamW困扰的月之暗面团队,在2025年初对Muon进行了关键的工程化改进,增加了Weight Decay、RMS控制等能力,并命名为MuonClip。

月之暗面在Kimi K2上率先验证了Muon优化器的稳定性,实现了预训练全程“零Loss Spike”。DeepSeek在训练V4大模型时,同样采用了被验证过的Muon优化器。

需要说明的是,开源大模型的“协同进化”并未陷入同质化,正在走向一条“和而不同”的道路。

比如DeepSeek-V4聚焦基础模型的核心能力攻坚,进一步筑牢了全球开源大模型的性能天花板,为全行业提供了性能比肩闭源旗舰的基础底座;Kimi K2.6深耕Agent工程化落地,解决了大模型长程自主执行的痛点,为大模型进入真实生产场景打通了关键路径。

整个过程中,没有旷日持久的商业谈判,没有剑拔弩张的专利博弈。在开源阵营里,技术创新正在像水一样自由流动,谁做得好,大家就用谁的。

在开源生态中汲取养分,在技术路线上互补。中国的大模型厂商,用行动向世界示范了硅谷之外的另一种可能。

03 美国在“造墙”,中国在“修路”

赞叹开源协同进化的同时,必须直面一个商业现实。

目前OpenAI和Anthropic的年化收入均达到了百亿美元以上,而国内头部大模型厂商的营收,刚跨过年化一亿美元的大门。

OpenAI在二级市场的估值约8800亿美元,Anthropic的估值已经飙升到了1万亿美元左右,而Kimi和DeepSeek新一轮融资的估值,分别为180亿美元和200亿美元。

有人高呼中国大模型厂商的市值被低估了,也有人认为:“能否将技术口碑转化为真金白银,是摆在中国厂商面前的生死大考。”一时间,关于开源“性价比”的讨论甚嚣尘上。

想要看清终局,或可以从大模型的竞争阶段着手:

第一阶段是“拼参数、拼Benchmark”。到了2026年4月末,这个阶段基本结束,各家在榜单上的跑分已经拉不开实质性差距。

第二阶段是“拼训练效率、拼推理成本、拼架构创新”。正是当下所处的赛段,也是算力成本倒逼下的必然结果。

第三阶段将是“拼Agent体系、拼生态、拼开发者”。当Token从免费流量变成执行任务的“燃料”时,生态的繁荣度将决定生死。

国内的开源大模型处于什么生态位呢?我们找到了两组直观的对比数据。

一个是训练成本。

2025年8月发布的GPT-5,训练成本超过5亿美元;同期的Kimi K2 Thinking,训练成本约460万美元;DeepSeek没有公布V4系列模型的训练成本,但V3模型仅花费了557.6万美元......国内大模型厂商只用了不到OpenAI零头的资源,训练出了同等水平的模型。

另一个是调用量。

进入2026年后,多模型聚合平台OpenRouter的数据显示:在OpenClaw代表的Agent产品的带动下,全球的Token消耗量呈现出了指数级增长,中国的“开源梦之队”,凭借“好用又便宜”的口碑,调用量已经连续多周超越美国。

原因并不难解释。

中国开源阵营已经跑通了“正反馈飞轮”:A公司开源底层技术,B公司采用并进行工程优化,再将优化的结果和经验反哺给整个生态。如果说闭源模型的进化是建立在海量算力堆砌上的线性增长,等待开源路线的,将是技术创新相互碰撞带来的指数级扩散。

按照摩根大通的研报,2025-2030年间中国AI推理token消耗量将实现约330%的年复合增长率,将从2025年的10万亿token,激增至2030年的3900万亿token,增长规模达370倍。

也就是说,2026年仍处于AI爆发的初期,未来5年里还有数百倍的增长机会,远未到盖棺定论的时候。

恰恰是对长远机会的自信,在硅谷巨头们拼命造墙时,中国的大模型厂商选择用协同补位的方式,不断夯实通往AGI的路。

04 写在最后

这场轰轰烈烈的AI浪潮,谁会笑到最后?答案不仅关乎模型,还关系到算力的自主可控。如果把模型比作“原子弹”的话,摆脱外部技术封锁的国产算力,就是将原子弹送上天的“火箭”。

让人欣慰的是,国产模型和国产算力的融合越来越紧密:DeepSeek V4的技术文档中,将昇腾NPU与英伟达GPU并列写入了硬件验证清单;月之暗面在最新的论文中将大模型推理的预填充和解码运行在了不同芯片上,为国产芯片大规模参与模型推理打开了大门。

2025年初,DeepSeek R1为国产大模型争取到了上牌桌的机会;到了2026年,中国的开源大模型阵营,正在协同合作中不断创造更多定义牌桌规则的硬资本。

相关问答

QDeepSeek V4的两个“核弹级创新”是什么?

ADeepSeek V4的两个核弹级创新是:1. 百万级的超长上下文,但KV cache只有V3.2的10%,大幅降低了显存需求;2. 对国产芯片的适配,在研发过程中与华为紧密合作,并第一时间适配了昇腾、寒武纪等国产芯片。

Q中美在技术路线上有什么主要分歧?

A中美在AI技术路线上的主要分歧在于:硅谷的OpenAI、Anthropic、谷歌等头部企业选择闭源路线,试图通过技术垄断守住既得利益;而中国的大模型厂商如DeepSeek、月之暗面等则拥抱开源,通过协同进化推动技术共享和生态繁荣。

Q硅谷AI公司之间有哪些典型的竞争行为?

A硅谷AI公司之间的典型竞争行为包括:1. 在竞争对手发布新品时迅速推出自家更新以抢夺声量;2. 互相揭短和质疑对方数据真实性(如OpenAI质疑Anthropic营收注水);3. 在商业合作和广告宣传上直接针对对手(如Anthropic在超级碗广告中暗讽OpenAI)。

Q中国开源阵营如何实现“协同进化”?

A中国开源阵营通过技术共享和工程优化实现协同进化:例如月之暗面采用DeepSeek开源的MLA架构解决长文本显存问题,DeepSeek V4则使用月之暗面改进的Muon优化器提升训练效率。双方在技术底层互补,无需商业谈判或专利博弈,形成正反馈生态。

Q大模型竞争的三个阶段分别是什么?

A大模型竞争的三个阶段是:1. 拼参数和Benchmark性能(已基本结束);2. 拼训练效率、推理成本和架构创新(当前阶段);3. 拼Agent体系、生态和开发者(未来阶段),生态繁荣度将决定最终胜负。

你可能也喜欢

富达年中复盘:2026 年数字资产的 6 大关键趋势

富达数字资产研究团队在2026年年中复盘报告中,梳理了年初展望中提出的六大关键趋势进展,认为数字资产领域正在进行结构性“重塑”。 1. **数字资产与传统资本市场加速整合**:趋势持续且快于预期。现货比特币ETP期权未平仓合约激增,代币化领域活跃,监管框架(如SEC/CFTC指南)趋于清晰,推动数字资产进一步融入主流金融体系。 2. **代币持有者权利受关注但仍不明朗**:生态内相关机制(如回购、治理重组)的试验在继续,但市场尚未对此形成明确的“权利溢价”定价,该趋势仍处早期。 3. **人工智能算力需求可能影响比特币挖矿**:比特币算力与挖矿难度出现下降,虽部分受季节性因素影响,但增长放缓的长期趋势与AI算力竞争加剧的预测相符,矿工可能正转向更有利可图的AI数据中心业务。 4. **比特币网络处于新的转折点**:OP_RETURN数据上限放宽未导致网络滥用或臃肿。当前焦点转向网络动态,Bitcoin Knots节点占比约17%,虽引发对潜在分裂风险的讨论,但Bitcoin Core(占比77%)仍主导共识。同时,抗量子计算等长期安全升级研究获得进展。 5. **空头暂时掌控市场局面**:年初至今,受清算去杠杆、高通胀及地缘政治不确定性影响,熊市情景占上风,比特币价格下跌。但近期在地缘冲突后,比特币展现出避险属性,跑赢部分传统资产,且机构参与、监管清晰度提升等结构性利好依然存在。 6. **黄金保持强势,去美元化趋势显现**:黄金在央行购金及去美元化趋势支撑下表现强劲。有证据显示比特币开始在一些国际贸易场景(如伊朗)作为支付手段被使用,但比特币紧随黄金优异表现的情景尚未出现。 **结论**:当前数字资产市场呈现短期压力与长期结构性进展并存的局面。投资者需超越价格波动,关注机构融合、监管、基础设施等领域的实质推进,这些正为下一阶段增长积蓄力量。

marsbit3小时前

富达年中复盘:2026 年数字资产的 6 大关键趋势

marsbit3小时前

富达年中复盘:2026 年数字资产的 6 大关键趋势

富达数字资产在年中复盘中,梳理了其在《2026年展望》中提出的六大关键趋势的当前进展: 1. **数字资产与资本市场加速整合**:传统金融渠道对数字资产的敞口需求坚挺,现货比特币ETP期权等产品发展迅速,反映出机构和主流投资者采用率持续上升。代币化势头增强,监管框架也趋于清晰,推动数字资产进一步融入金融体系。 2. **代币持有者权利逐渐受关注**:生态内正在试验更多机制以绑定持有者利益,如基于储备的回购和治理结构更新。但相关的“权利溢价”尚未完全体现在市场定价中,趋势仍处早期。 3. **人工智能与挖矿的潜在转变**:比特币算力增长呈现放缓趋势,部分原因可能是矿工将能源和基础设施转向利润率可能更高的AI算力需求。这符合此前关于结构性转变的判断。 4. **比特币处于新的转折点**:提高OP_RETURN数据上限并未导致区块链明显膨胀或网络压力。当前焦点转向网络动态,如Bitcoin Knots节点的波动可能带来潜在分裂风险,但Bitcoin Core节点仍主导共识。同时,抗量子计算等长期安全升级的准备工作也在推进。 5. **空头暂时掌控局面**:受去杠杆、高通胀及地缘政治不确定性影响,比特币价格承压,熊市情景占上风。但在压力时期,比特币也展现出作为高流动性中立资产的韧性,且机构参与、监管清晰度提升等结构性利好依然存在。 6. **黄金保持强势**:受央行购金及全球“去美元化”趋势支撑,黄金年初表现强劲。央行需求持续,黄金已成为全球主要储备资产。然而,此前预期的比特币紧随黄金的优异表现尚未出现。 **结论**:当前数字资产市场呈现短期压力与长期结构性进展并存的局面。机构化、监管和基础设施等趋势正按预期推进,为下一阶段增长积蓄力量,投资者需关注这些底层转变而非短期价格波动。

链捕手3小时前

富达年中复盘:2026 年数字资产的 6 大关键趋势

链捕手3小时前

Crypto GP 的中年危机:没有 PMF,就没有 LP 的下一张支票

**Crypto GP的中年危机:没有PMF,就没有LP的下一张支票** 当前加密货币市场,有限合伙人(LP)已不再愿意为虚无的梦想买单,普通合伙人(GP)必须拿出具有产品市场契合度(PMF)的具体产品才能持续获得融资。市场环境已从“购买未来愿景”转向“购买具体产品”阶段,LP要求立即、相对确定的赚钱机会。 文章将当前加密募资产品分为三大类:一级市场(Primary)、流动性市场(Liquid)以及中心化/去中心化金融原生收益(CeFi/DeFi Native Yield)。本文上篇重点分析一级市场。 **一级市场现状与挑战:** 过去,LP投资加密VC的主要理由包括:捕捉行业增长红利、获取项目投资渠道、信赖GP的卓越判断力、看重GP的“攒局”资源整合能力,或是进行声誉投资。然而,这些理由如今已大大削弱: 1. 获取加密资产曝险的途径(如ETF、托管账户等)已非常丰富,不再依赖VC盲池基金。 2. LP自身学习能力增强,或已建立内部团队,对GP渠道的依赖降低。 3. 多数GP在上个周期未能证明其判断力优于市场。 4. 市场下行时,“攒局”与退出变得困难。 **谁能留在牌桌上?** 在当前环境下,能继续在一级市场募资的GP主要包括: 1. 管理规模足以进入捐赠基金等长期耐心资本配置范围的基金。 2. 使用自有资金投资的家族办公室、公司或高净值人士。 3. 在本周期内真正为LP创造了超额回报的少数基金。 4. 具备明确生态资源和利益置换能力的“攒局型”基金。 对于其他大多数GP而言,行业信任已然受损,需要心态归零,在细分领域重新证明自己创造超额回报的能力,或提供具体的服务价值,以此重建信任并寻求发展。

marsbit4小时前

Crypto GP 的中年危机:没有 PMF,就没有 LP 的下一张支票

marsbit4小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.4k人学过发布于 2025.01.15更新于 2026.06.01

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片