Claude故意降智,模型也开始“看人下菜碟”?

marsbit发布于2026-04-14更新于2026-04-14

文章摘要

近日,Anthropic公司旗下的AI助手Claude被曝出现明显“降智”行为。AMD AI高级总监Stella Laurenzo通过分析大量生产数据发现,自2月中旬起,Claude的思考长度中位数下降67%–73%,文件阅读次数锐减,甚至三分之一修改操作不再预先阅读文件。用户普遍反馈模型响应变慢、推理能力下降。 Anthropic回应称,这是其“adaptive thinking”功能的“有意优化”,旨在根据任务复杂度动态调整思考深度,并建议用户手动调高effort设置以改善效果。然而,此举被批评缺乏透明度,付费用户未获通知却遭遇服务降级。 背后原因指向商业成本压力。数据显示,企业级API调用成本远高于订阅费用,Anthropic可能通过降低默认推理深度来控制算力消耗。公司正测试为企业用户默认开启高性能模式,释放出模型能力分层信号:B端客户将获得更强推理能力,而C端用户只能使用“够用就好”的降级版本。 这一事件反映出AI行业普遍趋势:厂商在商业化过程中暗中降低C端服务质量,推动资源向高价值企业客户倾斜。信任损耗与能力分层可能成为AI普惠叙事下的新挑战。

文 | 世界模型工场

Claude降智了?

近日,AMD AI集团高级总监Stella Laurenzo向Anthropic开炮。

她用团队真实生产日志,对6,852 个会话文件中的17,871个思考块、234,760次工具调用做了回溯分析。

数据显示,Claude从2月中旬开始出现了明显的行为退化。

Claude的思考中位数从2200字符暴跌至600字符,下降67%-73%;

编辑前阅读文件次数从6.6次锐减到2次,甚至三分之一的修改完全不读文件就直接动手。

Stella在分析中指出,由于推理能力下降,模型在修改代码之前逐渐不再完整阅读代码。

她写道:"当思考流于表面时,模型会默认采取成本最低的操作"。

这不是个例,早在3月份,开发者们的不满已经开始集中爆发。

在X上,有用户写道:“我还以为最近几周Claude是我自己疯了。它感觉更慢、更懒,像回答前就不思考了,结果我没幻觉”。

Reddit上也有用户抱怨:“Claude感觉没那么有意识了,像被做了脑叶切除术。除了变笨,它还开始不问就擅自做极端操作……”。

还有人表示这是Anthropic对用户赤裸裸的背刺:“他们只是把问题对我们所有用户变得不可见,就是觉得‘你量不到我就不给你看’……这就是AI实验室优化利润而不是输出质量的下场”。

从用户吐槽到数据实锤,基本坐实了Claude的降智行为。

而Anthropic的官方回应,也默认了思考深度和effort确实在被持续调整。

如果这是Anthropic有意而为之,那是不是意味着,以后模型能力会在不知不觉中“缩水”?

又或者,最强的模型能力,将不再平等地提供给所有人?

Claude降智“有意为之”

Claude Opus 4.6和其编码专用模式Claude Code,在2026年1月推出时,曾被开发者奉为编码天花板。

它思考深度惊人、research-first(先调研再动手),长上下文处理稳定,多文件重构几乎无敌。

AMD内部团队甚至用它在周末就把19万行遗留代码全部merge上线,生产力直接拉满。

然而转折发生在2月初。

Anthropic低调推出“adaptive thinking”功能,官方描述是“让模型根据任务复杂度智能调整思考深度”。

表面上看是用户友好,实则开启了全局节流开关。

3月初,模型默认effort值被悄然降至medium,同时思考过程摘要被快速隐藏,用户再也无法一眼看出模型到底想了多深。

同一时期,Anthropic连续发布14个小版本更新,却遭遇5次大规模宕机,显示出算力和负载压力已经逼近极限。

开发者反馈开始集中爆发,有人注意到高峰期(美东下午)表现尤其差,怀疑是负载动态节流。

直到4月份AMD AI总监亲自下场,用数据实锤彻底引爆了舆论。

至此,Anthropic的Claude Code负责人Boris Cherny才不得不发布了一条官方回复。

他表示,“adaptive thinking”影响的是thinking的显示,而不是底层推理,并坚持这是“有意优化”而非bug。用户若想改善效果,可以手动把effort调到high。

Anthropic的潜台词很清楚:降智不是bug,是我们特意做的产品优化,你们自己调参数就行。

这番回应瞬间点燃了更大的怒火。

关键在于,从2月中旬到4月初,Anthropic从未提前公告任何重大变更。

大量付费用户在毫不知情的情况下,订阅费用一分没少,模型却被悄然节流。

所以Claude的降智并不是模型“脑子坏了”,而是Anthropic在做一种更隐蔽、也更商业化的动作:

通过调低默认思考深度,去换更快的速度、更低的负载和GPU成本。

模型能力分层

这场降智风暴的背后,其实有一个值得警惕的现象:

模型能力已经开始分层。

Stella的测算很直白:按AWS Bedrock的on-demand定价口径,她团队3月的实际推理成本约为42,121美元,而同月实际支付的Claude Code订阅费只有400美元。

这个差额至少说明,在极端重度使用场景下,订阅制收费与真实算力消耗之间存在巨大缺口。

这很有可能是Anthropic用资本烧钱换来的市场份额,但这种补贴是有边界的。

当重度用户的推理消耗达到某个阈值,商业模式的可持续性就开始动摇。

Boris Cherny在回应中透露了一个关键信号:Anthropic正在测试为Teams和Enterprise用户默认开启high effort模式。

换句话说,更强的推理正在被当成一种更昂贵的资源来分层配置,不再是人人默认平等获得的能力。

这意味着大模型的商业模式将进一步分化。

如今Anthropic公司80%营收来自企业服务和API调用,高粘性B端才是真正的命脉。

当下Anthropic的种种动作,都是为了把企业使用往自己的第一方平台里收。

对于高价值的B端客户,Anthropic大概率会加速推出更强的企业级版本,为支付真实成本的企业客户提供完整的模型能力。

而C端月付用户,只能继续享用“够用就好”的降智版,满足聊天、写文案、代码补全等轻量化需求,但绝不触及成本红线。

至于中间地带,那些既需要复杂推理、又无力承担企业定价的独立开发者、小型团队,将成为最受挤压的群体。

有用户在X上发帖证实:

“Claude企业版API的表现比Pro/Max订阅好得多。用同一个测试框架测试,企业版和Pro/Max的行为方式就是不一样。但这也意味着现在每个月要花4-12k美元,具体取决于我同时运行多少个线程”。

也就是说,未来大模型的商业化路径,大概率是B端优先、C端降本。

谁来为降智买单?

Claude的降智事件,绝非孤例,而是整个AI行业进入商业化下半场的缩影。

无论是OpenAI对GPT系列多次暗地缩水降级,还是Google对Gemini静默限流,都在重复同一个剧本:

先用高性能吸引用户上钩,再通过软件节流控制成本。

必然的结果就是,B端能用高价买到更强模型,外加SLA保障,而C端则拿到蒸馏版、低effort版的平民模型。

C端模型增智的速度,已经明显落后于B端。

更严重的是,这种分化是隐性的。

Anthropic等厂商正在以一种难以察觉的方式降低推理预算,普通用户不会收到任何提示。

这种选择在短期内或许能缓解算力成本压力,但长期代价是品牌信任度的丧失。

当Claude会偷偷降智成为用户共识,Anthropic失去的将不仅仅是几个重度用户,而是整个生态系统对AI普惠、透明叙事的信心。

更宏观地看,Claude事件是AI行业从野蛮生长转向精耕细作的缩影。

补贴期结束了,真实成本开始显现,谁来承担这些成本?

是像这样压缩C端体验、提高B端定价,还是等待软硬件革命带来效率突破,这都将决定未来五年AI应用的格局。

未来趋势已初见苗头,AI不再是越来越聪明的普惠神话,而是走向精英化分层。

相关问答

QClaude模型从何时开始出现明显的行为退化?

A根据AMD AI集团高级总监Stella Laurenzo的分析,Claude从2月中旬开始出现了明显的行为退化。

QClaude模型的行为退化具体表现在哪些方面?

AClaude的思考中位数从2200字符暴跌至600字符,下降67%-73%;编辑前阅读文件次数从6.6次锐减到2次,甚至三分之一的修改完全不读文件就直接动手。

QAnthropic官方如何回应Claude的降智问题?

AAnthropic的Claude Code负责人Boris Cherny表示,'adaptive thinking'影响的是thinking的显示而不是底层推理,并坚持这是'有意优化'而非bug。用户若想改善效果,可以手动把effort调到high。

Q为什么Anthropic要对Claude进行降智处理?

A通过调低默认思考深度,可以换取更快的速度、更低的负载和GPU成本,以应对商业模式的可持续性问题。重度用户的推理消耗与订阅费用之间存在巨大缺口,导致Anthropic需要控制成本。

QClaude降智事件反映了AI行业的什么趋势?

A这反映了AI行业从野蛮生长转向精耕细作,模型能力开始分层:B端客户能用高价买到更强模型,而C端用户只能获得降智版模型。AI不再是普惠神话,而是走向精英化分层。

你可能也喜欢

韩国交易所“大战”监管机构,挑战执法、立法边界

韩国加密行业正与金融监管机构FIU(金融情报分析院)爆发正面冲突。过去FIU通过反洗钱法规对交易所严格处罚,但近期交易所开始通过法律诉讼和行业倡议系统性挑战其监管依据。 首尔行政法院在一审中撤销了FIU对Upbit运营公司Dunamu的部分营业停止处分,认为FIU对违规标准和处罚依据说明不足。法院强调,监管机构实施重罚必须证明交易所在明确规则下存在故意或重大过失。FIU已就此案提出上诉。同样,法院也暂停了FIU对Bithumb的六个月营业停止处分,以避免审理期间造成不可逆的损失。 在立法层面,韩国拟修订《特定金融信息法》,计划将1000万韩元以上加密资产转移一律纳入可疑交易报告范围。行业自律组织DAXA强烈反对,指出该“毒丸条款”可能违反法律保留原则,并将导致STR报告量暴增85倍,淹没真正的高风险信号,反而削弱反洗钱效率。 深层矛盾在于,韩国加密市场活跃但综合监管框架尚未成熟,目前主要依赖FIU的执法。交易所从被动接受转向通过司法和立法程序挑战监管,标志着韩国加密监管进入新阶段,监管规则本身的正当性将受到更严格审视。这场冲突短期内可能升级,但长期或有助于推动韩国建立更成熟、可持续的加密监管体系。

marsbit30分钟前

韩国交易所“大战”监管机构,挑战执法、立法边界

marsbit30分钟前

50倍存储后,孙宇晨永远在看下一个十年

孙宇晨以拍下巴菲特午餐、吃下天价香蕉等出位行为闻名,也面临SEC诉讼等争议,但其投资眼光常被忽略。早在2016年,他就建议年轻人投资比特币、英伟达、特斯拉等。以英伟达为例,若当时投资1万元,至2026年5月价值约240万元。 2025年底,他预言“存储是新的石油”,随后西部数据分拆的闪迪(SNDK)股价一年内大涨近50倍。当市场狂热追逐存储概念时,孙宇晨已将目光投向更具未来感的赛道:具身智能、无人机、空间计算和太空探索。 他认为,具身智能(如人形机器人)正从执行代码转向“看世界做事”,是AI在物理世界落地的关键。无人机已在军事、农业、物流等领域跑通商业闭环。空间计算(如苹果Vision Pro)旨在让AI理解物理空间,是机器人、自动驾驶等的基础。在太空领域,他本人于2025年乘坐蓝色起源飞船完成亚轨道飞行,并看好太空经济与区块链的结合。 他的投资逻辑是:押注确定性的赛道,两端布局,不赌单家公司。例如在机器人领域,既押注特斯拉(身体/制造),也押注英伟达(大脑/AI芯片);在无人机领域,看好其在军事应用中替代传统装备的趋势;在太空领域,关注即将IPO的SpaceX及其产业链。 孙宇晨将这些趋势串联起来,描绘出一幅“物理AI”改变现实世界运行方式的图景:从工厂机器人到自动驾驶,从无人机蜂群到星际探索。他认为,过去互联网改变了信息流动,而未来AI将重塑物理世界本身。

marsbit1小时前

50倍存储后,孙宇晨永远在看下一个十年

marsbit1小时前

史上最昂贵中期选举背后的亿万富翁们

彭博社分析指出,2026年美国中期选举已成为史上最昂贵的一选战,联邦政治委员会已募集超47亿美元,预计政治广告支出将达108亿美元。亿万富豪成为关键资金力量,其捐款不仅争夺国会控制权,也直接影响与自身利益密切相关的政策走向,如财富税、加密货币与人工智能监管等。 目前巨额资金多流向共和党阵营。顶级个人捐赠者包括:乔治·索罗斯(1.026亿美元)主要支持进步主义事业;埃隆·马斯克(8480万美元)大力支持特朗普阵营及共和党竞选委员会;Jeff Yass(8180万美元)是特朗普MAGA Inc.的最大金主之一,关注择校权等议题;OpenAI联合创始人Greg Brockman夫妇(5000万美元)支持特朗普及人工智能议题。 其他重要捐赠者有:Richard Uihlein(4530万美元)资助保守派议程;风投家Marc Andreessen(4470万美元)和Ben Horowitz(4440万美元)聚焦加密货币与人工智能政策;Miriam Adelson(4260万美元)长期支持特朗普及亲以色列政策;对冲基金大佬Paul Singer(3392万美元)转向支持特朗普对以强硬立场;建材巨头Diane Hendricks(2579万美元)亦是特朗普的坚定支持者。 匿名政治捐款的占比持续攀升。随着11月选举日临近,预计将有更多富豪加入顶级捐赠者行列。这场选举的结果将深刻影响美国未来两年的政策方向。

marsbit1小时前

史上最昂贵中期选举背后的亿万富翁们

marsbit1小时前

交易

现货
合约
活动图片