实锤,GPT-5.5「降智」被抓,OpenAI官方文档认了

marsbit發佈於 2026-05-27更新於 2026-05-27

文章摘要

GPT-5.5近期被用户频繁投诉存在“降智”问题。用户发现,在使用一两个小时后,尽管界面仍显示为“GPT-5.5 Extended Thinking”,但模型响应速度变快,输出质量却断崖式下跌,仿佛被偷偷换成了更小、能力更弱的模型。 开发者通过询问模型训练数据截止日期等测试发现,实际运行的模型版本与用户选择的版本不符。OpenAI官方帮助文档承认,在达到使用限额(如Plus用户每3小时160条消息)或服务器高负载时,系统会静默切换至更低成本的模型(如mini版),且不会在用户界面给出任何提示。 这一问题并非首次出现。自GPT-5发布以来,几乎每次主要版本更新后都会伴随类似的“性能下降”投诉。用户抱怨包括回复变短、拒绝执行指令、代码质量下降等。此前也有Pro用户通过追踪命令实锤,其请求的GPT-5.3 Codex被静默降级为GPT-5.2基础版。 尽管OpenAI在5月中旬曾将相关状态标记为“已解决”,但5月下旬的投诉反而更加集中。分析认为,这背后是算力成本与盈利能力之间的平衡压力。与此同时,下一代模型GPT-5.6已出现在后台日志中。评论指出,AI竞赛中模型迭代速度越来越快,但付费用户所获得的稳定、高质量服务体验却似乎难以保障。

【导读】GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?

ChatGPT又被爆「降智」了!

就在这两天,X上率先炸锅。

网友Lisan al Gaib发现,GPT-5.5用了一两个小时后突然变傻,每个请求都是秒回,质量断崖式下跌。

但界面上显示的,依然还是「GPT-5.5 Extended Thinking」。

也就是说,思考的标签还挂着,但思考本身已经消失了。

200美元/月,买了个「薛定谔的模型」

OpenAI开发者论坛上,一篇投诉帖同步爆了。

Agentify.sh表示,GPT-5.5用着用着会突然丧失遵循指令的能力。

眼瞧着它兴冲冲地宣布「修好了」,结果代码质量差到引发大面积回退。

之前5.5-med就能轻松搞定的UI任务,现在连最简单的改动都搞不定。

升到5.5-high,没用。再升到xhigh,还是不行。

而且xhigh以前能跑好几个小时,现在明显缩短了。

帖子一出,回复区瞬间炸了。

有人直接退回了5.4。

有人用的是xhigh最高档,但「跟上周比明显拉胯,长任务频繁出错,完全不遵循工作流」。

有人反映更离谱的情况,「简单查询也要转很久,你打断它纠正方向,它直接无视你,继续按之前错误的计划走」。

没错,所有人都在描述同一个现象——GPT的脑子,不知道什么时候被偷偷换掉了。

GPT-5.5目前的表现跟5.3差不多,毫不夸张。头几天还惊艳得不行,现在完全找不到当初那个模型的影子了。

不是错觉,OpenAI自己白纸黑字写着

为了验证,Lisan al Gaib专门做了一个对比测试。

同一个账号,ChatGPT端用Extended Thinking跑出来的全是垃圾,转头到Codex端用xhigh,立刻恢复正常。

用他的原话说就是,Codex「简直比这玩意儿聪明40亿倍」。

开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么?」

模型回答,August 2025。

问题是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!

也就是说,他选的是Thinking,系统实际给他跑的是Instant

界面上模型标签一个字都没变,但背后的模型已经被偷偷换掉了......

搞笑的是,这次OpenAI竟然在自己的帮助文档里替用户做了实锤。

根据OpenAI Help Center的官方说明,Plus用户每3小时最多发送160条GPT-5.5消息。

用完之后,系统会静默切换到mini模型,直到额度重置

注意「静默」两个字。

没有弹窗提示,没有模型标签变化,没有任何视觉反馈。

你还以为自己在用旗舰模型,对面已经悄悄换成了mini。

Pro用户也别高兴太早。

Heavy思考模式,那个Pro独享的最高推理档位,在服务器负载高的时候,同样会被容量限流。同样没有预警。

换句话说,200美元/月的Pro订阅,买到的是一个随时可能被「偷梁换柱」的服务。

而这种「标签没变,脑子换了」的操作,在Codex端更早就被人抓包了。

今年2月,GitHub上出现了一个issue,一个Pro用户用trace命令抓到,自己请求的是GPT-5.3 Codex,实际返回的模型是GPT-5.2。

连5.2 Codex都不是,是更低的基础版5.2。

他贴出了复现命令:

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • 输出:gpt-5.2-2025-12-11
  • 预期:gpt-5.3-codex

多个Pro用户在同一个issue下确认了同样的降级。

而且这种降级是「粘性的」,不会自己恢复,也没有任何解释。

甚至,在4月GPT-5.5发布当天,还有用户报告Fast模式的速度跟Standard差不多,但计费还是按Fast来的。

简单任务跑了7分49秒,正常应该5-6分钟。

OpenAI承认了,然后就没有然后了

5月15日,OpenAI的status页面出现了一条记录。

GPT5.5 Performance Degradation,我们正在调查部分用户反映的GPT-5.5性能下降问题。

5月17日,状态更新为「已解决」。

但从论坛帖子的时间线来看,5月24-26日的降智投诉比5月15日那波更猛。

要么「解决」了的问题又回来了,要么压根就没真正解决。

每次升级都是一次「降智争议」

虽然各家都会遇到「模型变蠢」的吐槽,但OpenAI从GPT-5到GPT-5.5的每个更新,一次都没缺席。

每一次OpenAI都说在调查,每一次都说已解决,然后下一个版本继续。

2025年8月,GPT-5首发。Reddit的热帖标题直接就是「GPT-5太烂了」。用户投诉短回复、更多拒绝、更少人格感。

OpenAI被迫紧急恢复GPT-4o选项。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。

2025年12月,GPT-5.2。翻译质量倒退,编造不存在的API,拒绝执行5.1能轻松完成的风格指令。

2026年2月,GPT-5.3-Codex。Pro用户被静默降级到5.2,trace命令实锤。

2026年3月,GPT-5.4。OpenAI社区论坛出现「GPT-5.4在Codex里明显退化了」帖子,网友回复全部确认。

2026年5月初,GPT-5.5 Instant上线。回复长度缩短30%,emoji几乎消失。网友总结:精度提升了,但温度消失了。

2026年5月下旬,也就是现在。Thinking模式的降智投诉再次爆发。

Lisan al Gaib透露,自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后,「每周都会收到这样的私信」。

最新一条是有人求他帮忙把xhigh/heavy thinking要回来。

跑分最强的那天,是发布日

chatgptdisaster.com整理了1087条经过验证的用户投诉,其中一类被反复提到的场景叫「路由层失灵」,UI显示GPT-5.5 Pro,输出完全是另一个档次的东西。

用户描述了一个可复现的模式,长会话后模型开始「完全无视你说的话」,但模型选择器上还挂着顶配标签。

最荒诞的注脚是,Plus用户160条/3小时用完后自动切换mini的机制,在OpenAI官方文档里被描述为一项「功能」

为什么会这样?Lisan al Gaib分析认为,答案就两个字,省钱。

算力与盈利能力的紧缩正影响着每一个人。处处精打细算,不放过任何省钱的机会。

然而,就在GPT-5.5用户集体投诉的同一周,GPT-5.6的身影已经出现在了Codex后台日志里。

内部代号iris-alpha,150万Token上下文,Polymarket给出的6月发布概率超过85%。

一边是5.5用户连基础体验都保不住,一边是5.6已经在后台悄悄跑真实流量。

这就是2026年的ASI竞赛。

造新模型的速度越来越快,但让旧模型好好跑完一个会话却越来越难。

跑分最强的那一天永远是发布日,之后每一天都是薛定谔的GPT。

参考资料:https://x.com/scaling01/status/2058643470357590058?s=20

本文来自微信公众号“新智元”,作者:ASI启示录;编辑:摩西

相關問答

Q根据文章,用户在使用GPT-5.5时遇到了什么主要问题?

A用户发现,在使用GPT-5.5的“Extended Thinking”或“xhigh”等高级思考模式一两个小时后,模型的响应质量和遵循指令的能力会断崖式下跌,变得反应快速但内容“降智”,而用户界面上的模型标签并未改变。官方文档也承认,在达到使用限额后,系统会静默切换到性能较弱的“mini”模型,且没有任何提示。

QOpenAI官方文档是如何“实锤”GPT-5.5服务降级行为的?

AOpenAI的帮助中心文档明确指出,对于Plus订阅用户,每3小时最多发送160条GPT-5.5消息。额度用尽后,系统会“静默”切换到“mini”模型,且没有任何视觉提示或模型标签变化。这意味着用户界面仍显示为原模型,但实际上已在使用性能更低的模型。

Q文章中提到,开发者Andrew Curran用什么方法验证了模型被暗中切换?

A开发者Andrew Curran通过直接询问模型“你的训练数据截止日期是什么?”来验证。模型回答是“August 2025”,但这其实是“GPT-5.5 Instant”版本的截止日期,而非他选择的“GPT-5.5 Thinking”版本应有的“December 2025”。这证明了他请求的是Thinking版本,但系统实际给他运行的却是Instant版本。

Q在用户投诉历史上,GPT-5系列哪些版本也出现过类似的“降智”争议?

A根据文章梳理,GPT-5系列几乎每个主要版本更新后都出现了“降智”争议: 1. 2025年8月,GPT-5首发,因质量不佳被迫恢复GPT-4o选项。 2. 2025年12月,GPT-5.2出现翻译质量倒退等问题。 3. 2026年2月,GPT-5.3-Codex被用户抓包静默降级到5.2。 4. 2026年3月,GPT-5.4在Codex中性能退化。 5. 2026年5月,GPT-5.5 Instant和Thinking模式均被投诉质量下降。

Q文章分析,造成这种“标签不变,脑子被换”现象的根本原因可能是什么?

A文章引述网友Lisan al Gaib的分析,认为根本原因是“省钱”。在算力成本与盈利压力下,OpenAI通过静默切换至更小、更便宜的模型(如mini),并隐藏这一行为来节省运营成本。这导致了用户付费购买高端服务,却可能无法获得承诺的性能,即所谓的“薛定谔的模型”。

你可能也喜歡

孙宇晨接受《胡润百富》专访:变革周期里,价值流动的新秩序与确定性

在Web3行业深入发展和全球金融基础设施重构的背景下,波场TRON创始人孙宇晨接受《胡润百富》专访,系统阐述了对行业发展的判断。他指出,区块链技术正从早期探索走向规模化应用,核心目标是构建开放、普惠的价值互联网,让全球任何人都能低成本、高效地转移和使用资金。 孙宇晨强调,能够穿越行业周期的项目必须基于真实需求。目前,以稳定币为核心的链上支付已成为最成熟且具备规模化能力的应用场景。波场TRON已发展成为全球最大的稳定币流通网络之一,其链上USDT流通量超过863亿美元,增长动力来源于跨境转账、价值存储等真实用户需求,体现了技术对传统金融体系的“自然替代”。 在战略层面,他总结了“数据驱动迭代、快速执行与用户导向”相结合的方法论,以及“方向清晰、分层支撑与全员主人翁意识”的管理框架。他以波场TRON与Tether合作推出TRC-20 USDT为例,说明基于对市场趋势和风险回报的综合判断是关键。同时,他强调了全球化布局中本地合规与文化适配的重要性。 对于技术融合趋势,孙宇晨认为人工智能(AI)是对“思考与决策能力”的重构,AI与区块链在数据、算力及智能执行层面的结合是重要方向。区块链可为AI提供去中心化基础设施,AI则能提升区块链的智能化与用户体验。 最后,他建议行业参与者和年轻创业者,在不确定的环境中应持续学习、快速适应,并在理解全局的基础上聚焦核心优势,打造不可替代的竞争力。波场TRON正通过完善基础设施、推进全球化战略和前瞻技术布局,持续推动价值互联网的落地演进。

marsbit18 分鐘前

孙宇晨接受《胡润百富》专访:变革周期里,价值流动的新秩序与确定性

marsbit18 分鐘前

三星靠技术周期,海力士靠 HBM,美光凭什么赢了万亿市值?

美光科技凭借独特生存策略与硬核制造能力,成为全球三大内存芯片巨头之一。其发展历程充满争议:在行业危机中,美光多次诉诸政治与法律手段破局,例如早年投诉日企倾销、在反垄断调查中充当“污点证人”,以及通过游说打压竞争对手(如中国福建晋华),因而被贴上“政治投机者”标签。这些策略为其赢得了关键的喘息时间。 然而,美光的真正核心竞争力在于极致的制造成本控制。通过数十年工程积累,其DRAM芯片单位面积小于三星和SK海力士,同一晶圆可产出更多芯片,从而在价格战中具备更强韧性。 但美光也因战略误判付出了代价。2013年收购尔必达后,陷入技术整合困境,错失了布局HBM(高带宽存储器)的黄金十年。当AI浪潮推动HBM需求爆发时,美光已大幅落后,目前HBM3市场份额仅约3%,远低于SK海力士。同时,公司还面临三重挤压:在高端HBM市场追赶乏力;中低端DRAM市场受到中国长鑫存储低价侵蚀;加之中国对其产品实施采购禁令,导致其在中国市场份额从曾经的高位骤降至7.1%,并错失了中国AI基建高峰期的订单。 如今,美光正全力追赶,其HBM3E已获英伟达认证,并加紧研发HBM4。但竞争对手已领跑下一代技术。美光的故事揭示,政治杠杆与制造效率能助其穿越周期,却无法弥补因错失技术趋势而落后的“时间债”。未来,这家巨头能否在高端赛道实现反超,仍是一场关于技术与耐心的考验。

marsbit37 分鐘前

三星靠技术周期,海力士靠 HBM,美光凭什么赢了万亿市值?

marsbit37 分鐘前

交易

現貨
合約
活动图片