AI 巨头,走入黑暗森林

marsbit发布于2026-04-25更新于2026-04-25

文章摘要

2026年春季,AI巨头们陷入“黑暗森林”博弈状态,Anthropic、OpenAI和DeepSeek三家顶级实验室均未完全释放其最强模型能力,而是选择策略性保留。 Anthropic发布Claude Opus 4.7,公开承认其性能不及未发布的Mythos模型,并以安全为由暂不推出。同期Claude Code因多次优化调整导致用户体验下滑,引发社区批评,但Anthropic直到OpenAI发布新品前后才公开回应。 OpenAI推出GPT-5.5,虽为重训基础模型,但被评测认为并非突破性升级。用户发现其高速模式在高负载下性能下降,OpenAI亦承认存在“能力悬隔”(capability overhang),暗示手中握有多个未公开模型。 DeepSeek发布V4 Preview版,性能接近GPT-5.4,价格极具竞争力,但并非满血版本。其完全体V4 Pro Max需等待华为昇腾950超节点下半年量产后方能释放全部能力,旨在实现更低成本的智能平权。 三家公司均通过控制技术释放节奏,避免成为行业靶心,形成“黑暗森林”中的理性博弈。当前用户所使用的模型,均非其完整形态。

文  | 象先志

大刘在《三体》中写过一个后来被无数次引用的意象——黑暗森林。每个文明都是带枪的猎人,谁先暴露自己,谁先死。森林里不是没有人,是每个人都知道亮灯会招来子弹,所以大家都熄灯。

2026年春天,顶级AI实验室们,走入了这样的黑暗森林。

4月16日,Anthropic 率先发布 Claude Opus 4.7。同一天,他们做了一个反常的动作——公开承认 Opus 4.7 的性能并不及一个尚未发布的模型 Mythos,理由是 safety concerns。(安全考量)

4月23 日,OpenAI 在官网挂出 GPT-5.5。同一天,Anthropic 又在官方博客发了一篇叫 “An update on recent Claude Code quality reports” 的事故复盘报告,承认过去一个多月 Claude Code 确实变笨了——一个放新牌,一个补认错。但这位“新晋王者”几乎是在炫耀:我们承认 Claude 暂时变笨——但你别忘了,我们手里还藏着一把 Mythos 没出。

4月24 日,“神秘的东方力量” DeepSeek V4 Preview 上线,梁文锋团队第一次把模型和华为昇腾 950PR 深度绑定做官宣;但所有人都看明白了——真正“满血”的 V4 Pro Max,要等昇腾 950 超节点下半年量产之后才能放出来。

三家公司,三个动作。表面是各自的产品节奏,但拼在一起看,一件事浮出来:

每一家手里都握着至少一把“枪”——一个比公开版本更强的模型、一个还没轮到公众的下一代架构、一片还没大规模铺开的芯片超节点。但没有一家敢先把这把枪举起来

因为在这个行业里,“先亮”的代价从来都不止泄密那么简单。先亮,意味着把自己的能力上限亲手交给对手做参照系;意味着率先承担安全审视、监管收紧、舆论压力的全部火力;意味着把自己变成下一轮所有竞对都要瞄准的那个移动靶子。森林里没有英雄主义——每一个先开枪的人,都把自己变成了下一个被瞄准的人。

所以猎人们最理性的选择,是熄灯、屏息、把武器藏在背后。

这就是博弈的最优解。

Anthropic的有恃无恐

Claude 这一边,在过去的一个月,几乎上演了最糟糕的一次版本发布。

早早更新完 Opus 4.7,Anthropic 仍旧霸榜各种榜单,而且手里还藏着只提供给企业客户的 Mythos——俨然一副不紧不慢的姿态。

但 Opus 4.7 的这一周期,几乎是 Claude 用户体验最差的一次,“差评如潮”。

3 月初,Anthropic 改了 Claude Code 的默认推理深度,从 high 调到 medium。这个决定的出发点可以理解:high 模式下 UI 经常看起来像卡死了一样,响应慢得让付费用户抓狂。但问题是,他们当时没有公布。

3 月底,又上线了一个“效率优化”——如果 Claude Code 会话空闲超过一小时,系统就会清掉旧的 reasoning block。按设计,这是为了省算力。实际跑起来的效果,是每一轮对话之后 Claude 都像失忆,把上下文忘得干干净净。开发者社区那几周涌进大量吐槽:“Claude 开始不记得我上一轮让它干什么了。”

直到近期,第三件事发生了——在系统提示里加了一条压缩 verbosity 的指令。按 Anthropic 后来自己承认的说法,这条指令让 Claude Code 的编码质量直接跌了 3%。

三件事叠在一起,才有了 AMD 的一位 senior director 在 GitHub 上写下的那句话——“Claude has regressed to the point it cannot be trusted to perform complex engineering”(Claude 已经退化到无法再被信任去完成复杂工程类任务)。Axios 4 月 16 日那篇 “Anthropic's AI downgrade stings power users” 把它抬到了主流视野。

然后 Anthropic 才承认,确实有点问题。

4月7 日,他们悄悄回滚了 reasoning effort 的调整;4 月 10 日修掉了 cache 的 bug;4 月 20 日撤掉了压缩 verbosity 的系统提示。但真正的事故复盘报告,等到了 4 月 23 日才发出来——而这恰好是 GPT-5.5 公开发布的当天。

这种带着一丝“哦,我的工程策略有点 bug,修复就好了”的轻蔑感,和 OpenAI 的重量级发布只在前后脚之间。很难说这是巧合。

更耐人寻味的是, Opus 4.7 发布的时候,Anthropic 顺带做了一个反常的动作:公开承认 Opus 4.7 的性能不及一个尚未发布的模型——Mythos。这很明显是一种“战略性退守”——Anthropic 把最强能力留在企业端、不急于推向大众,因为团队还没准备好把 Mythos 放出去

这个说法可以信。但从商业叙事的角度看,另一半同样真实:Anthropic 等了六周才公开承认 Claude Code 在退化,等到 OpenAI 要放新牌的那一天才把问题端出来。如果不是同行压力足够大,如果不是 Opus 4.7 已经证明了“我们还有后手”,这份声明可能永远都不会到来。

在 Claude 这一侧,挤牙膏不是指刻意阉割能力,而是:能力的释放节奏、对问题的披露节奏,都跟着竞对的节奏走。

拿出自己最前沿的能力,注定会被当做靶子打。又或者说,在 Anthropic 看来,4.6 对竞争对手造成的压力都还没散去——既然如此,更强的牌没必要现在就打出来。

OpenAI 的故技重施

如果 Anthropic 是“藏着一个 Mythos 不发”,那 OpenAI 这一侧的挤牙膏更隐蔽——它把能力的释放权,留在了自己服务器的负载曲线和一个叫 auto-router 的分档机制里。

4月23 日 GPT-5.5 发布的同一天,Simon Willison(Django 框架共同创始人、AI 圈知名独立评测者)在自己的博客里写了一句审慎的话:“It's not a dramatic departure from what we've had before.”(这不是一次戏剧性的飞跃)

他顺手补了一条信息很关键:GPT-5.5 是自 GPT-4.5 之后 OpenAI 第一次完全重训的基础模型;也就是说,过去半年发出去的 5.1、5.2、5.3、5.4,全部只是增量更新。换言之,过去的四次小版本更新,OpenAI 都是收着力气发布的——因为他们不清楚竞争对手会放出什么东西。

“收着劲儿更新”有一个更容易理解的说法:挤牙膏。

但更值得记住的一幕发生在 GPT-5.5 上线几个小时之后。Codex 用户在 GitHub 提了 Issue #19241,投诉 Fast mode 一开始真的很快,等更多用户被放进来之后肉眼可见变慢,而计费还按 Fast 档结算。措辞很熟悉:“请 OpenAI 调查 GPT-5.5 Fast mode 是否在高负载下被降级。”

这几乎就是 2025 年 8 月 7 日 GPT-5 首发当天那一幕的精确重演——那一次,Reddit r/ChatGPT 把 “GPT-5 is horrible” 顶到 4600+ upvotes,Sam Altman 第二天在 AMA 上亲口承认 “the autoswitcher broke... GPT-5 seemed way dumber”——承认了 router 在幕后替用户做了降档这件事。

同一个剧本,八个月后再度上演。

更戏谑的是,在 GPT-5.5 正式发布的前一天,OpenAI 的 Codex 把内部 staging 环境误推到了生产环境,被几个 Pro 用户截图截了下来,几分钟之内修掉,但泄漏的内容已经四处流传。当时出现在选择器里的,除了 GPT-5.5 本身,还有一个叫 Glacier 的系列(tooltip 写着 “Intelligence that moves continents”)、一个叫 Heisenberg 的生命科学模型、一个叫 Arcanine 的未知用途模型,以及代号 oai-2.1 等多个版本。

也就是说,就在 OpenAI 把 GPT-5.5 作为“下一代”放出来的同一时间,内部至少跑着 5 到 6 条平行的产品线,每一条都还没轮到公众。

OpenAI 自己倒是认了。在 2026 年官方的年度路线图里,他们用了一个学术圈讨论已久的词——capability overhang——承认当前大模型的真实能力和用户实际能用出的效果之间,存在一个巨大的 gap。

熟悉吗?和 Anthropic 对待 Mythos 的话术几乎是同一句话。就算 4 月 22 日那次 Codex 泄露真的是误操作,OpenAI 主动把 capability overhang 这个词放进路线图,传递的信号已经写得很清楚——我们手里还多得很,你们看着办。

你手里有远多于卖给用户的东西,你才有的挤。GPT-5.5 的 24 小时,把这个前提再一次变成了现场直播。

Deepseek 的耐心等待

DeepSeek 这一边,“挤”的方式彻底变了——它不是在藏能力,而是在等一个更合适的交付时机。

1.6T MoE、1M 上下文、Pro/Flash 双规格,定价  3.48 per 1M tokens——是 GPT-5.5 的几十分之一,是 Opus 4.7 的量级差。海外独立评测者给出的结论是两句话:性能贴近但略低于 GPT-5.4 / Gemini 3.1-Pro,价格“把前沿实验室的经济学打穿了”。

但放在 DeepSeek 自己的坐标系里,V4 Preview 已经比 V3 那种“便宜到诡异”的价格贵了不止一点。所有人都知道——这不是满血版。

DeepSeek V4 的完整故事,不以发布为终点,更不以发布为起点。

要从 2025 年 R2 那次没发出来的发布讲起。R2 原定于 2025 年 5 月发布,但最终被延后到秋冬。整个中国Deepseek 的基础设施迁向华为的 CANN 生态。对于任何一个实验室实验室,这都不可能是一个季度能完成的工程——编译器、算子、通信库、推理框架、MoE 路由,全部要重写。

而 V4 这一次,是 DeepSeek 第一次把昇腾正式写进训练硬件清单。V4 是混合训练的第一个版本——昇腾首次入场

但专门为大规模训练优化的下一代芯片昇腾 950DT,按华为路线图要 2026 年 Q4 才量产。也就是说,V4 训练能跑起来,是用上一代的 950PR 拼出来的;要让 V4 Pro Max 这种 1.6T MoE 的满血版本既能训得彻底又能大规模推得起来,还要等下一代到位。

真正的工程难点不是“V4 能不能训出来”——已经训出来了——而是“V4怎样在昇腾上跑得满、跑得稳、跑得便宜”。

昇腾 950PR 在 2026 年 Q1 量产,FP4 算力 1.56 PFLOPS、片上内存 112GB,纸面规格对标并超过英伟达 H20。但从一颗芯片跑得起,到一整片超节点能稳定服务数百万 token/秒的推理请求,是两回事。V4 Pro Max 的满血版,锁的就是这个“超节点”——昇腾 950 系列的大规模集群版本,2026 年下半年陆续到位。

这构成了一个和前两家完全不同的策略。Anthropic 和 OpenAI 挤牙膏的逻辑,是我手里有更强的,先不给你;DeepSeek 挤牙膏的逻辑,是我满血的那一版,要等一个让价格再下一个台阶的时刻。

这个差别很重要。

DeepSeek 真正的杀手锏从来不是“性能最前沿”,而是“在性能够用的前提下,把 token 价格砍到别人不敢砍的位置”。V4 Preview 在英伟达卡和昇腾 950PR 上做了适配,但要做到量产规模的满血推理,必须等超节点到位。一旦等到那一刻,两件事会同时发生:一是 V4 Pro Max 的能力可以释放到顶;二是推理成本、API 定价会再落一阶——对一家靠价格打穿市场的公司,后者比前者更致命。

人们真正期待的、在 2025 年初发生过的那个“DeepSeek 时刻”,没有在这次发布里再次上演。而 V4 Preview 的发布其实是一段预告片,真正的重头戏,是下半年的“DeepSeek + 华为昇腾”时刻。

从这个角度看,梁文锋团队现在做的不是被迫的“藏”,而是一次商业上克制的“选择”——选择把最强版本的首发,交到一个它最有话语权的场景里:国产超节点大规模部署后的第一天。在那之前,先用 V4 Preview 把性价比的叙事再巩固一轮。

DeepSeek 背负的从来不是让国产大模型在某个榜单上拔到第一的“长板叙事”,而是让芯片、训练、推理、定价四条线同时跑通的“系统性叙事”——后者比前者重要得多。

就在前几天,黄仁勋在 Dwarkesh Patel 的播客上说,如果 DeepSeek 在华为芯片上首发,“那对我们美国来说是个可怕的结果”(“a horrible outcome for our nation”)。

现在英伟达还把控着顶尖算力。但按照黄仁勋自己抛出的那块“AI 五层蛋糕”——能源、芯片、基础设施、模型、应用——国产大模型产业在每一层都已经有了能跑通的国产方案,差距正在以肉眼可见的速度缩小。补上芯片这块最后的拼图,DeepSeek 的开源大模型故事,才是一个比美国大模型更大的故事:这是一场不用消耗过多成本、让全球实现智能平权的重要一步。

让全世界都可以绕过某些被霸权掌控的先进算力,走入高效的智能社会。

尾声

Anthropic 的“藏”——是主动的。他们有 Mythos,没发,理由是 safety。

OpenAI 的“藏”——是结构的。他们有 Pro 档,不常给你,理由是 infrastructure 和价格分层。

DeepSeek 的“藏”——是必要的。它关乎一整套社会智能跃迁的叙事范本。

但从另一个侧面来看,这又像极了大刘描绘的黑暗森林:在这片漆黑的智能森林里,每一个顶尖猎人都不会率先开出自己的那一枪。

暴露意味着毫无保留,意味着没有底牌,会成为另一个猎人的活靶子。

没人知道谁会率先打出最致命的一枪。但可以确定的是,今天你用的每一个模型,都不是它真正的样子。

相关问答

Q为什么文章将AI巨头之间的竞争比作“黑暗森林”?

A文章借用《三体》中的“黑暗森林”概念,比喻AI巨头们像带枪的猎人一样,谁先暴露自己的真实能力(如未发布的强大模型或技术),谁就可能成为竞争对手的靶子,面临安全审视、监管压力和舆论攻击,因此各家都选择隐藏实力,避免率先亮出底牌。

QAnthropic在发布Opus 4.7时做了什么反常动作?其目的是什么?

AAnthropic在发布Opus 4.7时,公开承认其性能不及未发布的模型Mythos,理由是出于安全考量(safety concerns)。这是一种战略性退守,目的是将最强能力保留在企业端,不急于推向大众,同时避免过早暴露实力成为竞争对手的瞄准目标。

QOpenAI的“挤牙膏”策略具体体现在哪些方面?

AOpenAI的“挤牙膏”策略体现在:1. GPT-5.1至5.4版本均为增量更新而非完全重训,收着力气发布;2. 通过auto-router分档机制在后台控制能力释放,高负载时自动降级模型性能;3. 内部同时研发多条产品线(如Glacier、Heisenberg等),但仅选择性公开部分模型,保留大量未发布能力。

QDeepSeek V4 Preview为何被看作“非满血版”?其满血版依赖什么条件?

ADeepSeek V4 Preview是混合训练版本,使用了华为昇腾950PR芯片,但并非最终优化状态。其满血版V4 Pro Max需要等待华为昇腾950超节点在2026年下半年量产才能实现大规模稳定推理,从而释放全部性能并进一步降低推理成本,实现“价格打穿”的战略目标。

Q文章中提到AI巨头“藏能力”的动机有何异同?

A三家巨头的“藏能力”动机表面相似(避免成为靶子),但深层原因不同:Anthropic是主动藏(以安全为由保留Mythos模型);OpenAI是结构性藏(通过基础设施和分层定价控制能力释放);DeepSeek是必要性藏(等待国产芯片超节点量产以实现成本与性能的双重突破,支撑全球智能平权的宏大叙事)。

你可能也喜欢

富达年中复盘:2026 年数字资产的 6 大关键趋势

富达数字资产研究团队在2026年年中复盘报告中,梳理了年初展望中提出的六大关键趋势进展,认为数字资产领域正在进行结构性“重塑”。 1. **数字资产与传统资本市场加速整合**:趋势持续且快于预期。现货比特币ETP期权未平仓合约激增,代币化领域活跃,监管框架(如SEC/CFTC指南)趋于清晰,推动数字资产进一步融入主流金融体系。 2. **代币持有者权利受关注但仍不明朗**:生态内相关机制(如回购、治理重组)的试验在继续,但市场尚未对此形成明确的“权利溢价”定价,该趋势仍处早期。 3. **人工智能算力需求可能影响比特币挖矿**:比特币算力与挖矿难度出现下降,虽部分受季节性因素影响,但增长放缓的长期趋势与AI算力竞争加剧的预测相符,矿工可能正转向更有利可图的AI数据中心业务。 4. **比特币网络处于新的转折点**:OP_RETURN数据上限放宽未导致网络滥用或臃肿。当前焦点转向网络动态,Bitcoin Knots节点占比约17%,虽引发对潜在分裂风险的讨论,但Bitcoin Core(占比77%)仍主导共识。同时,抗量子计算等长期安全升级研究获得进展。 5. **空头暂时掌控市场局面**:年初至今,受清算去杠杆、高通胀及地缘政治不确定性影响,熊市情景占上风,比特币价格下跌。但近期在地缘冲突后,比特币展现出避险属性,跑赢部分传统资产,且机构参与、监管清晰度提升等结构性利好依然存在。 6. **黄金保持强势,去美元化趋势显现**:黄金在央行购金及去美元化趋势支撑下表现强劲。有证据显示比特币开始在一些国际贸易场景(如伊朗)作为支付手段被使用,但比特币紧随黄金优异表现的情景尚未出现。 **结论**:当前数字资产市场呈现短期压力与长期结构性进展并存的局面。投资者需超越价格波动,关注机构融合、监管、基础设施等领域的实质推进,这些正为下一阶段增长积蓄力量。

marsbit34分钟前

富达年中复盘:2026 年数字资产的 6 大关键趋势

marsbit34分钟前

富达年中复盘:2026 年数字资产的 6 大关键趋势

富达数字资产在年中复盘中,梳理了其在《2026年展望》中提出的六大关键趋势的当前进展: 1. **数字资产与资本市场加速整合**:传统金融渠道对数字资产的敞口需求坚挺,现货比特币ETP期权等产品发展迅速,反映出机构和主流投资者采用率持续上升。代币化势头增强,监管框架也趋于清晰,推动数字资产进一步融入金融体系。 2. **代币持有者权利逐渐受关注**:生态内正在试验更多机制以绑定持有者利益,如基于储备的回购和治理结构更新。但相关的“权利溢价”尚未完全体现在市场定价中,趋势仍处早期。 3. **人工智能与挖矿的潜在转变**:比特币算力增长呈现放缓趋势,部分原因可能是矿工将能源和基础设施转向利润率可能更高的AI算力需求。这符合此前关于结构性转变的判断。 4. **比特币处于新的转折点**:提高OP_RETURN数据上限并未导致区块链明显膨胀或网络压力。当前焦点转向网络动态,如Bitcoin Knots节点的波动可能带来潜在分裂风险,但Bitcoin Core节点仍主导共识。同时,抗量子计算等长期安全升级的准备工作也在推进。 5. **空头暂时掌控局面**:受去杠杆、高通胀及地缘政治不确定性影响,比特币价格承压,熊市情景占上风。但在压力时期,比特币也展现出作为高流动性中立资产的韧性,且机构参与、监管清晰度提升等结构性利好依然存在。 6. **黄金保持强势**:受央行购金及全球“去美元化”趋势支撑,黄金年初表现强劲。央行需求持续,黄金已成为全球主要储备资产。然而,此前预期的比特币紧随黄金的优异表现尚未出现。 **结论**:当前数字资产市场呈现短期压力与长期结构性进展并存的局面。机构化、监管和基础设施等趋势正按预期推进,为下一阶段增长积蓄力量,投资者需关注这些底层转变而非短期价格波动。

链捕手41分钟前

富达年中复盘:2026 年数字资产的 6 大关键趋势

链捕手41分钟前

Crypto GP 的中年危机:没有 PMF,就没有 LP 的下一张支票

**Crypto GP的中年危机:没有PMF,就没有LP的下一张支票** 当前加密货币市场,有限合伙人(LP)已不再愿意为虚无的梦想买单,普通合伙人(GP)必须拿出具有产品市场契合度(PMF)的具体产品才能持续获得融资。市场环境已从“购买未来愿景”转向“购买具体产品”阶段,LP要求立即、相对确定的赚钱机会。 文章将当前加密募资产品分为三大类:一级市场(Primary)、流动性市场(Liquid)以及中心化/去中心化金融原生收益(CeFi/DeFi Native Yield)。本文上篇重点分析一级市场。 **一级市场现状与挑战:** 过去,LP投资加密VC的主要理由包括:捕捉行业增长红利、获取项目投资渠道、信赖GP的卓越判断力、看重GP的“攒局”资源整合能力,或是进行声誉投资。然而,这些理由如今已大大削弱: 1. 获取加密资产曝险的途径(如ETF、托管账户等)已非常丰富,不再依赖VC盲池基金。 2. LP自身学习能力增强,或已建立内部团队,对GP渠道的依赖降低。 3. 多数GP在上个周期未能证明其判断力优于市场。 4. 市场下行时,“攒局”与退出变得困难。 **谁能留在牌桌上?** 在当前环境下,能继续在一级市场募资的GP主要包括: 1. 管理规模足以进入捐赠基金等长期耐心资本配置范围的基金。 2. 使用自有资金投资的家族办公室、公司或高净值人士。 3. 在本周期内真正为LP创造了超额回报的少数基金。 4. 具备明确生态资源和利益置换能力的“攒局型”基金。 对于其他大多数GP而言,行业信任已然受损,需要心态归零,在细分领域重新证明自己创造超额回报的能力,或提供具体的服务价值,以此重建信任并寻求发展。

marsbit1小时前

Crypto GP 的中年危机:没有 PMF,就没有 LP 的下一张支票

marsbit1小时前

脱钩时代来临,比特币不再是加密的唯一罗盘

文章指出,加密市场正告别以比特币为单一风向标的时代,分化为“内生型”和“外生型”两大资产阵营。 内生型资产(如比特币和多数传统加密货币)的价值仍与加密市场整体行情深度绑定。而外生型资产的崛起成为新趋势,其价值主要依托自身业务的真实需求和基本面,日益独立于比特币价格波动。 例如,Hyperliquid作为混合型案例,其部分合约交易已转向非加密资产。Venice等项目则完全脱离加密市场,其商业模式更接近消费级AI服务,收入来自用户为AI推理付费。Figure公司利用区块链技术提升贷款效率,其核心价值在于金融科技业务本身。 此外,稳定币等赛道的企业收购与高增长(如BVNK、Bridge),也显示了其发展与加密牛熊周期的脱钩。 这一转变意味着行业分析逻辑的根本改变:研究外生型资产需要像分析传统企业一样,专注于用户群体、经济模型和行业护城河等基本面,而非紧盯比特币价格。文章列举了多个具备潜力的外生型赛道,包括链上金融服务、AI与加密融合、新型数字银行、支付、非金融消费产品等。 目前,投资相关企业股权仍是主要途径,代币机制仍需优化。但核心趋势已定:加密市场的驱动力正变得多元,行业研究重心将从解读比特币图表转向深耕企业基本面。未来,加密市场齐涨共跌的局面或将不再。

marsbit2小时前

脱钩时代来临,比特币不再是加密的唯一罗盘

marsbit2小时前

交易

现货
合约
活动图片