实锤，GPT-5.5「降智」被抓，OpenAI官方文档认了

marsbit发布于2026-05-27更新于2026-05-27

文章摘要

GPT-5.5近期被用户频繁投诉存在“降智”问题。用户发现，在使用一两个小时后，尽管界面仍显示为“GPT-5.5 Extended Thinking”，但模型响应速度变快，输出质量却断崖式下跌，仿佛被偷偷换成了更小、能力更弱的模型。开发者通过询问模型训练数据截止日期等测试发现，实际运行的模型版本与用户选择的版本不符。OpenAI官方帮助文档承认，在达到使用限额（如Plus用户每3小时160条消息）或服务器高负载时，系统会静默切换至更低成本的模型（如mini版），且不会在用户界面给出任何提示。这一问题并非首次出现。自GPT-5发布以来，几乎每次主要版本更新后都会伴随类似的“性能下降”投诉。用户抱怨包括回复变短、拒绝执行指令、代码质量下降等。此前也有Pro用户通过追踪命令实锤，其请求的GPT-5.3 Codex被静默降级为GPT-5.2基础版。尽管OpenAI在5月中旬曾将相关状态标记为“已解决”，但5月下旬的投诉反而更加集中。分析认为，这背后是算力成本与盈利能力之间的平衡压力。与此同时，下一代模型GPT-5.6已出现在后台日志中。评论指出，AI竞赛中模型迭代速度越来越快，但付费用户所获得的稳定、高质量服务体验却似乎难以保障。

【导读】GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?

ChatGPT又被爆「降智」了!

就在这两天,X上率先炸锅。

网友Lisan al Gaib发现,GPT-5.5用了一两个小时后突然变傻,每个请求都是秒回,质量断崖式下跌。

但界面上显示的,依然还是「GPT-5.5 Extended Thinking」。

也就是说,思考的标签还挂着,但思考本身已经消失了。

200美元/月,买了个「薛定谔的模型」

OpenAI开发者论坛上,一篇投诉帖同步爆了。

Agentify.sh表示,GPT-5.5用着用着会突然丧失遵循指令的能力。

眼瞧着它兴冲冲地宣布「修好了」,结果代码质量差到引发大面积回退。

之前5.5-med就能轻松搞定的UI任务,现在连最简单的改动都搞不定。

升到5.5-high,没用。再升到xhigh,还是不行。

而且xhigh以前能跑好几个小时,现在明显缩短了。

帖子一出,回复区瞬间炸了。

有人直接退回了5.4。

有人用的是xhigh最高档,但「跟上周比明显拉胯,长任务频繁出错,完全不遵循工作流」。

有人反映更离谱的情况,「简单查询也要转很久,你打断它纠正方向,它直接无视你,继续按之前错误的计划走」。

没错,所有人都在描述同一个现象——GPT的脑子,不知道什么时候被偷偷换掉了。

GPT-5.5目前的表现跟5.3差不多,毫不夸张。头几天还惊艳得不行,现在完全找不到当初那个模型的影子了。

不是错觉,OpenAI自己白纸黑字写着

为了验证,Lisan al Gaib专门做了一个对比测试。

同一个账号,ChatGPT端用Extended Thinking跑出来的全是垃圾,转头到Codex端用xhigh,立刻恢复正常。

用他的原话说就是,Codex「简直比这玩意儿聪明40亿倍」。

开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么?」

模型回答,August 2025。

问题是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!

也就是说,他选的是Thinking,系统实际给他跑的是Instant。

界面上模型标签一个字都没变,但背后的模型已经被偷偷换掉了......

搞笑的是,这次OpenAI竟然在自己的帮助文档里替用户做了实锤。

根据OpenAI Help Center的官方说明,Plus用户每3小时最多发送160条GPT-5.5消息。

用完之后,系统会静默切换到mini模型,直到额度重置。

注意「静默」两个字。

没有弹窗提示,没有模型标签变化,没有任何视觉反馈。

你还以为自己在用旗舰模型,对面已经悄悄换成了mini。

Pro用户也别高兴太早。

Heavy思考模式,那个Pro独享的最高推理档位,在服务器负载高的时候,同样会被容量限流。同样没有预警。

换句话说,200美元/月的Pro订阅,买到的是一个随时可能被「偷梁换柱」的服务。

而这种「标签没变,脑子换了」的操作,在Codex端更早就被人抓包了。

今年2月,GitHub上出现了一个issue,一个Pro用户用trace命令抓到,自己请求的是GPT-5.3 Codex,实际返回的模型是GPT-5.2。

连5.2 Codex都不是,是更低的基础版5.2。

他贴出了复现命令:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
输出:gpt-5.2-2025-12-11
预期:gpt-5.3-codex

多个Pro用户在同一个issue下确认了同样的降级。

而且这种降级是「粘性的」,不会自己恢复,也没有任何解释。

甚至,在4月GPT-5.5发布当天,还有用户报告Fast模式的速度跟Standard差不多,但计费还是按Fast来的。

简单任务跑了7分49秒,正常应该5-6分钟。

OpenAI承认了,然后就没有然后了

5月15日,OpenAI的status页面出现了一条记录。

GPT5.5 Performance Degradation,我们正在调查部分用户反映的GPT-5.5性能下降问题。

5月17日,状态更新为「已解决」。

但从论坛帖子的时间线来看,5月24-26日的降智投诉比5月15日那波更猛。

要么「解决」了的问题又回来了,要么压根就没真正解决。

每次升级都是一次「降智争议」

虽然各家都会遇到「模型变蠢」的吐槽,但OpenAI从GPT-5到GPT-5.5的每个更新,一次都没缺席。

每一次OpenAI都说在调查,每一次都说已解决,然后下一个版本继续。

2025年8月,GPT-5首发。Reddit的热帖标题直接就是「GPT-5太烂了」。用户投诉短回复、更多拒绝、更少人格感。

OpenAI被迫紧急恢复GPT-4o选项。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。

2025年12月,GPT-5.2。翻译质量倒退,编造不存在的API,拒绝执行5.1能轻松完成的风格指令。

2026年2月,GPT-5.3-Codex。Pro用户被静默降级到5.2,trace命令实锤。

2026年3月,GPT-5.4。OpenAI社区论坛出现「GPT-5.4在Codex里明显退化了」帖子,网友回复全部确认。

2026年5月初,GPT-5.5 Instant上线。回复长度缩短30%,emoji几乎消失。网友总结:精度提升了,但温度消失了。

2026年5月下旬,也就是现在。Thinking模式的降智投诉再次爆发。

Lisan al Gaib透露,自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后,「每周都会收到这样的私信」。

最新一条是有人求他帮忙把xhigh/heavy thinking要回来。

跑分最强的那天,是发布日

chatgptdisaster.com整理了1087条经过验证的用户投诉,其中一类被反复提到的场景叫「路由层失灵」,UI显示GPT-5.5 Pro,输出完全是另一个档次的东西。

用户描述了一个可复现的模式,长会话后模型开始「完全无视你说的话」,但模型选择器上还挂着顶配标签。

最荒诞的注脚是,Plus用户160条/3小时用完后自动切换mini的机制,在OpenAI官方文档里被描述为一项「功能」。

为什么会这样?Lisan al Gaib分析认为,答案就两个字,省钱。

算力与盈利能力的紧缩正影响着每一个人。处处精打细算,不放过任何省钱的机会。

然而,就在GPT-5.5用户集体投诉的同一周,GPT-5.6的身影已经出现在了Codex后台日志里。

内部代号iris-alpha,150万Token上下文,Polymarket给出的6月发布概率超过85%。

一边是5.5用户连基础体验都保不住,一边是5.6已经在后台悄悄跑真实流量。

这就是2026年的ASI竞赛。

造新模型的速度越来越快,但让旧模型好好跑完一个会话却越来越难。

跑分最强的那一天永远是发布日,之后每一天都是薛定谔的GPT。

参考资料:https://x.com/scaling01/status/2058643470357590058?s=20

本文来自微信公众号“新智元”,作者:ASI启示录;编辑:摩西

你可能也喜欢

散户“带头大哥”Serenity vs 新晋股神Leopold：两大顶级猎手如何掘金AI“物理极限”？

过去两年，单纯买入英伟达的策略已逐渐失效。如今，两位风格迥异的投资者成为AI投资领域的新风向标。一位是匿名交易者Serenity，他隐藏在社交媒体背后，通过拆解AI供应链最底层的“卡脖子”环节进行投资。他提出“紫苏叶理论”，专注于寻找那些市值小、技术垄断性强、对产业链不可或缺的隐形厂商，例如在光电共封装（CPO）等领域的关键材料供应商。据称，其投资年内获得了惊人收益。另一位是年仅24岁的Leopold Aschenbrenner，他曾是OpenAI研究员，后创办规模超百亿美元的对冲基金。他的核心理念是，AI发展的真正瓶颈在于电网、土地、数据中心等物理基础设施，而非算法本身。其投资策略是“基础设施套利”：一方面重仓押注存储硬件、算力云和比特币矿企等物理资源；另一方面，大规模做空半导体板块，认为芯片估值已严重脱离基础设施的实际建设速度。两人策略的核心共同点是：抛弃软件层叙事，重仓受物理法则约束的硬件和基础设施。他们都认为，谁掌握了物理世界的稀缺资源，谁就掌握了AI时代的“算力买路财”。然而，两种策略也各有风险。Serenity推荐的微盘股面临流动性低、波动性巨大的风险，且其个人背景未经证实，跟单需谨慎。Leopold的宏观押注则面临市场情绪滞后和巨头股价持续强势的挑战，可能导致其空头头寸承受巨大压力。他们的走红标志着AI投资逻辑的转变：产业价值正从半导体本身，向更底层的材料、设备、能源和土地等物理瓶颈环节迁移。

marsbit1小时前

散户“带头大哥”Serenity vs 新晋股神Leopold：两大顶级猎手如何掘金AI“物理极限”？

marsbit1小时前

Nocera更名为Nocera Holdings，全面跨足AI、数据中心、机器人、生技与数字资产

Nocera公司宣布更名为Nocera Holdings，转型为多元化控股公司，旨在全面进军人工智能（AI）、AI基础设施、数据中心、机器人、生物技术、区块链与数字资产等多个高增长科技领域。为支持此次转型，公司修改了此前最高3亿美元的融资协议，放宽资金使用条件，以便用于全球并购、战略投资、联盟及日常运营。公司认为AI、自动化、先进计算、机器人、区块链与数字资产等领域正相互融合，蕴含巨大商机。转型计划将积极寻求在AI基础设施、企业级应用及相关服务领域的并购与投资机会，并评估亚洲和东欧的数据中心及配套设施项目。此外，公司还关注生物技术与AI医疗科技，以及机器人、自动化等“实体AI”在亚洲市场的发展。原有的区块链与数字资产战略也将继续推进，作为长期布局的一部分。配合品牌重塑，公司正在进行全面的形象更新与国际市场沟通。同时，公司将持续优化资产负债表与运营效率，以确保符合纳斯达克上市规定。Nocera Holdings希望凭借其在亚洲等市场的现有资源与关系，投资于具有规模潜力的下一代科技，为股东创造长期价值。

marsbit2小时前

Nocera更名为Nocera Holdings，全面跨足AI、数据中心、机器人、生技与数字资产

marsbit2小时前

比特币风向标 #57

《比特币动态》第57期本文是一篇付费文章。如果您已经是订阅用户，请登录账户以阅读全文。本期文章主要探讨了比特币当前的市场动态和相关分析。然而，文章的详细内容仅为订阅者提供。非订阅用户只能访问到基本的标题和提示登录的信息，无法获取具体的市场数据、技术分析、行业见解或未来趋势预测等核心内容。要了解完整的深度分析，读者需要拥有有效的订阅账户。

insights.glassnode2小时前

insights.glassnode2小时前

谁能在 Agents 时代赚到钱？

文章探讨在区块链Agents（智能体）时代，价值捕获理论的演变。传统加密领域的“胖协议”理论认为底层协议因稀缺性而捕获价值，但随着基础设施竞争加剧，协议定价权减弱。“胖应用”理论则强调应用层通过掌握用户关系（如钱包、交易所）获得优势。然而，Agents作为自动化软件用户，改变了游戏规则：它们不看重用户体验或品牌忠诚度，而是直接调用API并追求最低成本。这可能导致几种情景：一是现有应用“无头化”，转为面向Agents的后端服务；二是Agents跳过中间层，直接与协议交互，使“胖协议”理论复兴；三是整个技术栈利润率压缩，价值流向Agents所有者或其服务对象；四是Agents激发全新的链上经济活动，扩大整体规模。最终，人类用户和Agents可能长期共存，形成不同的价值捕获模式。对于构建者，关键在于思考除价格外，如何通过流动性、延迟或结算保证等要素吸引Agents持续使用。

marsbit2小时前

marsbit2小时前

6,000名投资者因Solana迷因币血本无归——韩国采取行动

韩国检方首次对去中心化交易所“拉地毯”骗局提起刑事指控，并对五人进行起诉，这是该国《虚拟资产用户保护法》中欺诈交易罪名首次被应用，为监管Solana等区块链上的DEX市场操纵行为树立了重要的法律先例。该骗局围绕在Solana代币发行平台pump.fun上推出的MEME币CATFI展开。主谋以“EtherFather”的化名在社交媒体上伪装成独立第三方，向粉丝推荐该代币，同时其团队操控项目官方账号，通过伪造关注度和虚假宣传吸引散户。团队通过多钱包分散持仓并进行循环交易以掩盖其对代币流动性的控制，最终卷款跑路，非法获利约40亿韩元。 CATFI价格在推出后26小时内暴涨1001倍，吸引了约6000名投资者。其中，256人确认遭受财务损失，总额约90亿韩元（约合65万美元）。此案首次将《虚拟资产用户保护法》的欺诈交易罪名应用于去中心化交易所活动，标志着韩国执法机构正将监管范围扩展至中心化交易所以外的加密欺诈领域，显示出其应对复杂加密货币欺诈行为的技术能力和法律框架正在完善。

bitcoinist3小时前

bitcoinist3小时前

交易

现货

合约

实锤，GPT-5.5「降智」被抓，OpenAI官方文档认了

文章摘要

200美元/月,买了个「薛定谔的模型」

不是错觉,OpenAI自己白纸黑字写着

OpenAI承认了,然后就没有然后了

每次升级都是一次「降智争议」

跑分最强的那天,是发布日

相关问答

你可能也喜欢

散户“带头大哥”Serenity vs 新晋股神Leopold：两大顶级猎手如何掘金AI“物理极限”？

Nocera更名为Nocera Holdings，全面跨足AI、数据中心、机器人、生技与数字资产

比特币风向标 #57

谁能在 Agents 时代赚到钱？

6,000名投资者因Solana迷因币血本无归——韩国采取行动

交易

热门分类

热门标签