实锤，GPT-5.5「降智」被抓，OpenAI官方文档认了

marsbit發佈於 2026-05-27更新於 2026-05-27

文章摘要

GPT-5.5近期被用户频繁投诉存在“降智”问题。用户发现，在使用一两个小时后，尽管界面仍显示为“GPT-5.5 Extended Thinking”，但模型响应速度变快，输出质量却断崖式下跌，仿佛被偷偷换成了更小、能力更弱的模型。开发者通过询问模型训练数据截止日期等测试发现，实际运行的模型版本与用户选择的版本不符。OpenAI官方帮助文档承认，在达到使用限额（如Plus用户每3小时160条消息）或服务器高负载时，系统会静默切换至更低成本的模型（如mini版），且不会在用户界面给出任何提示。这一问题并非首次出现。自GPT-5发布以来，几乎每次主要版本更新后都会伴随类似的“性能下降”投诉。用户抱怨包括回复变短、拒绝执行指令、代码质量下降等。此前也有Pro用户通过追踪命令实锤，其请求的GPT-5.3 Codex被静默降级为GPT-5.2基础版。尽管OpenAI在5月中旬曾将相关状态标记为“已解决”，但5月下旬的投诉反而更加集中。分析认为，这背后是算力成本与盈利能力之间的平衡压力。与此同时，下一代模型GPT-5.6已出现在后台日志中。评论指出，AI竞赛中模型迭代速度越来越快，但付费用户所获得的稳定、高质量服务体验却似乎难以保障。

【导读】GPT-5.5被扒出「假思考」,用两小时就被偷偷换成mini,200美元月费买了个「薛定谔的脑子」。Trace命令实锤,官方文档亲自认领。往后有纷纷吐槽:OpenAI,你糊弄谁呢?

ChatGPT又被爆「降智」了!

就在这两天,X上率先炸锅。

网友Lisan al Gaib发现,GPT-5.5用了一两个小时后突然变傻,每个请求都是秒回,质量断崖式下跌。

但界面上显示的,依然还是「GPT-5.5 Extended Thinking」。

也就是说,思考的标签还挂着,但思考本身已经消失了。

200美元/月,买了个「薛定谔的模型」

OpenAI开发者论坛上,一篇投诉帖同步爆了。

Agentify.sh表示,GPT-5.5用着用着会突然丧失遵循指令的能力。

眼瞧着它兴冲冲地宣布「修好了」,结果代码质量差到引发大面积回退。

之前5.5-med就能轻松搞定的UI任务,现在连最简单的改动都搞不定。

升到5.5-high,没用。再升到xhigh,还是不行。

而且xhigh以前能跑好几个小时,现在明显缩短了。

帖子一出,回复区瞬间炸了。

有人直接退回了5.4。

有人用的是xhigh最高档,但「跟上周比明显拉胯,长任务频繁出错,完全不遵循工作流」。

有人反映更离谱的情况,「简单查询也要转很久,你打断它纠正方向,它直接无视你,继续按之前错误的计划走」。

没错,所有人都在描述同一个现象——GPT的脑子,不知道什么时候被偷偷换掉了。

GPT-5.5目前的表现跟5.3差不多,毫不夸张。头几天还惊艳得不行,现在完全找不到当初那个模型的影子了。

不是错觉,OpenAI自己白纸黑字写着

为了验证,Lisan al Gaib专门做了一个对比测试。

同一个账号,ChatGPT端用Extended Thinking跑出来的全是垃圾,转头到Codex端用xhigh,立刻恢复正常。

用他的原话说就是,Codex「简直比这玩意儿聪明40亿倍」。

开发者Andrew Curran则想了个妙招——直接问模型「你的训练数据截止日期是什么?」

模型回答,August 2025。

问题是,GPT-5.5 Thinking的截止日期是12月。8月,是Instant版本的截止日期!

也就是说,他选的是Thinking,系统实际给他跑的是Instant。

界面上模型标签一个字都没变,但背后的模型已经被偷偷换掉了......

搞笑的是,这次OpenAI竟然在自己的帮助文档里替用户做了实锤。

根据OpenAI Help Center的官方说明,Plus用户每3小时最多发送160条GPT-5.5消息。

用完之后,系统会静默切换到mini模型,直到额度重置。

注意「静默」两个字。

没有弹窗提示,没有模型标签变化,没有任何视觉反馈。

你还以为自己在用旗舰模型,对面已经悄悄换成了mini。

Pro用户也别高兴太早。

Heavy思考模式,那个Pro独享的最高推理档位,在服务器负载高的时候,同样会被容量限流。同样没有预警。

换句话说,200美元/月的Pro订阅,买到的是一个随时可能被「偷梁换柱」的服务。

而这种「标签没变,脑子换了」的操作,在Codex端更早就被人抓包了。

今年2月,GitHub上出现了一个issue,一个Pro用户用trace命令抓到,自己请求的是GPT-5.3 Codex,实际返回的模型是GPT-5.2。

连5.2 Codex都不是,是更低的基础版5.2。

他贴出了复现命令:

RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
输出:gpt-5.2-2025-12-11
预期:gpt-5.3-codex

多个Pro用户在同一个issue下确认了同样的降级。

而且这种降级是「粘性的」,不会自己恢复,也没有任何解释。

甚至,在4月GPT-5.5发布当天,还有用户报告Fast模式的速度跟Standard差不多,但计费还是按Fast来的。

简单任务跑了7分49秒,正常应该5-6分钟。

OpenAI承认了,然后就没有然后了

5月15日,OpenAI的status页面出现了一条记录。

GPT5.5 Performance Degradation,我们正在调查部分用户反映的GPT-5.5性能下降问题。

5月17日,状态更新为「已解决」。

但从论坛帖子的时间线来看,5月24-26日的降智投诉比5月15日那波更猛。

要么「解决」了的问题又回来了,要么压根就没真正解决。

每次升级都是一次「降智争议」

虽然各家都会遇到「模型变蠢」的吐槽,但OpenAI从GPT-5到GPT-5.5的每个更新,一次都没缺席。

每一次OpenAI都说在调查,每一次都说已解决,然后下一个版本继续。

2025年8月,GPT-5首发。Reddit的热帖标题直接就是「GPT-5太烂了」。用户投诉短回复、更多拒绝、更少人格感。

OpenAI被迫紧急恢复GPT-4o选项。奥特曼在Reddit AMA上亲自承认「比我们预期的颠簸」。

2025年12月,GPT-5.2。翻译质量倒退,编造不存在的API,拒绝执行5.1能轻松完成的风格指令。

2026年2月,GPT-5.3-Codex。Pro用户被静默降级到5.2,trace命令实锤。

2026年3月,GPT-5.4。OpenAI社区论坛出现「GPT-5.4在Codex里明显退化了」帖子,网友回复全部确认。

2026年5月初,GPT-5.5 Instant上线。回复长度缩短30%,emoji几乎消失。网友总结:精度提升了,但温度消失了。

2026年5月下旬,也就是现在。Thinking模式的降智投诉再次爆发。

Lisan al Gaib透露,自从GPT-5发布时他带头打了那场ChatGPT Plus额度争夺战之后,「每周都会收到这样的私信」。

最新一条是有人求他帮忙把xhigh/heavy thinking要回来。

跑分最强的那天,是发布日

chatgptdisaster.com整理了1087条经过验证的用户投诉,其中一类被反复提到的场景叫「路由层失灵」,UI显示GPT-5.5 Pro,输出完全是另一个档次的东西。

用户描述了一个可复现的模式,长会话后模型开始「完全无视你说的话」,但模型选择器上还挂着顶配标签。

最荒诞的注脚是,Plus用户160条/3小时用完后自动切换mini的机制,在OpenAI官方文档里被描述为一项「功能」。

为什么会这样?Lisan al Gaib分析认为,答案就两个字,省钱。

算力与盈利能力的紧缩正影响着每一个人。处处精打细算,不放过任何省钱的机会。

然而,就在GPT-5.5用户集体投诉的同一周,GPT-5.6的身影已经出现在了Codex后台日志里。

内部代号iris-alpha,150万Token上下文,Polymarket给出的6月发布概率超过85%。

一边是5.5用户连基础体验都保不住,一边是5.6已经在后台悄悄跑真实流量。

这就是2026年的ASI竞赛。

造新模型的速度越来越快,但让旧模型好好跑完一个会话却越来越难。

跑分最强的那一天永远是发布日,之后每一天都是薛定谔的GPT。

参考资料:https://x.com/scaling01/status/2058643470357590058?s=20

本文来自微信公众号“新智元”,作者:ASI启示录;编辑:摩西

你可能也喜歡

连续三季下跌后，加密市场第三季度能否迎来企稳窗口？

加密市场在连续两季下跌后，第二季度表现疲软，总市值缩水12.6%至2.1万亿美元，日均交易量下滑，稳定币规模也出现三年来首次收缩。比特币和以太坊价格均创阶段新低，与美股的传统联动逻辑瓦解，主要受现货ETF资金持续流出、美联储政策预期以及企业抛售等因素影响。市场关注焦点高度集中于美联储7月底的议息会议结果，其政策信号将直接影响比特币能否企稳。同时，关键监管法案《CLARITY Act》在国会推进停滞，不确定性持续压制市场风险偏好。尽管整体低迷，少数板块显现增长：预测市场交易量同比大幅上升，代币化收藏品和现实世界资产（RWA）代币化领域也逆势扩张，显示出结构性需求转变。综合来看，市场虽缺乏全面上涨动力，但极端下跌的基础较弱。比特币价格贴近长期均线，交易逻辑已从叙事炒作转向对宏观政策、利率和价格的理性博弈。第三季度能否企稳，将主要取决于美联储政策动向与监管立法的进展。

marsbit3 小時前

marsbit3 小時前

SpaceX交易权限现已开放：WEEX上线SPCXON交易对

2026年6月，SpaceX完成了史上最大规模的IPO，但大量投资者因券商限制、开户障碍和地域壁垒而无法参与。加密货币交易所WEEX推出了解决方案SPCXON/USDT现货交易对。SPCXON是一种基于Ondo代币化股票框架构建的产品，旨在为美国以外的合格交易者提供追踪SpaceX经济收益的途径，以USDT结算，交易便捷，无传统券商门槛。 SpaceX IPO定价为135美元，首日收盘接近161美元，随后一度冲高至225美元，公司估值约1.75万亿美元。看涨理由基于星链收入增长、无可匹敌的发射频率以及星舰里程碑。看跌观点则认为，其估值已达营收的90-110倍，且存在流通股稀少和即将到来的内部持股解锁等风险。需注意，SPCXON提供的是价格敞口，而非股票所有权，不包含投票权和直接股息。其价格可能相对净资产价值出现溢价或折价，交易者需关注价差。 WEEX平台整合了包括SpaceX、MicroStrategy和Micron在内的多种代币化股权产品，用户可在统一账户内交易加密货币和股权敞口。平台还提供高达400倍杠杆的加密货币期货交易。 WEEX成立于2018年，全球用户超过620万，提供超过1200个现货交易对，并设有1000 BTC保护基金。平台亦提供跟单交易和AI工具等功能。免责声明：本文内容不构成投资建议。

TheNewsCrypto3 小時前

TheNewsCrypto3 小時前

BIT交易时刻：BTC仍受压于周线200 EMA，被拒后或将重启下跌，昨夜大涨的存储和半导体夜盘开跌

比特币价格维持在66000美元附近，反弹超15%，但正面临68000美元附近的强阻力区，该位置存在大量套牢盘。技术面关注周线200MA（约63333美元）和200EMA（约68328美元）关键位，需突破68000美元或跌破55000美元才能确认方向。市场整体流动性偏低，反弹性质偏谨慎。美股方面，三大股指期货下跌，昨夜暴涨的半导体和存储板块在夜盘普遍回落。超微电脑（SMCI）因订单强劲而逆势大涨。市场关注AI硬件需求是否持续，但原油价格上涨和美债收益率走高带来通胀和利率担忧，给股市施加压力。亚洲市场跟随科技股反弹，但走势不稳。韩国股市冲高回落，半导体股波动；日本股市收跌，日元汇率创多年新低，干预风险值得警惕。接下来需重点关注：AMD的AI活动、谷歌及特斯拉等科技巨头的财报、欧洲央行利率决议以及英特尔财报，这些事件可能影响市场对AI叙事、经济前景和半导体板块的判断。

marsbit3 小時前

BIT交易时刻：BTC仍受压于周线200 EMA，被拒后或将重启下跌，昨夜大涨的存储和半导体夜盘开跌

marsbit3 小時前

前CFTC主席、Circle总裁Tarbert：一边劝你长期主义，一边自己套现3000万美元

前CFTC主席、Circle总裁希思·塔伯特近期因言行不一引发争议。在公开场合，他多次强调Circle专注于长期发展，呼吁投资者对下跌的股价保持耐心。然而，自Circle上市以来，他持续抛售公司股票，累计套现约3000万美元，且从未增持。塔伯特在加入Circle前，曾于卸任CFTC主席仅27天后便加入做市商城堡证券，后又转至Circle，其职业生涯被指善于利用监管履历和人脉资源，在政商“旋转门”中为金融企业铺路。在城堡证券期间，他处理的业务与其先前监管职责存在潜在利益关联。分析认为，塔伯特精于把握政策与市场时机，将个人资源转化为职业筹码，但投资者却需承担其公开倡导“长期主义”背后的实际风险。

marsbit4 小時前

前CFTC主席、Circle总裁Tarbert：一边劝你长期主义，一边自己套现3000万美元

marsbit4 小時前

Gate 研究院：加密金融产品掀起“华尔街化”浪潮，是竞争还是融合？

2009年比特币的创世区块暗含对传统金融体系的批判，其理想是建立去中心化、去中介、去银行的点对点金融系统。然而十七年后，比特币现货ETF获批、贝莱德等巨头发行相关产品、CME推出受监管衍生品、RWA（真实世界资产）和代币化国债市场快速增长等现象，显示传统金融正系统性地介入加密资产的发行、定价、托管和分销环节，引发了加密市场是否“华尔街化”的讨论。文章认为，这并非单方面的吞并，而是加密体系与传统金融的双向融合与互补。加密领域提供无许可开放性、24小时交易和可编程结算，但缺乏合规通道、机构级托管和主流分销网络；传统金融则拥有牌照、信任、资金和渠道，但受限于交易时间、跨境门槛和结算效率。双方正朝彼此的核心优势靠拢。这种融合体现为两条路径：一是以Gate为代表的加密交易所，逐步从提供代币化美股、CFD差价合约，发展到接入真实股票、港股、韩股交易，成为连接加密账户与传统券商基础设施的前端入口；二是以Robinhood为代表的传统券商，通过收购加密交易所、推出股票代币和建设自有Layer 2，将加密资产和链上代币化产品整合进其平台。两者的共同目标是争夺下一代综合金融账户的入口，让用户在一个界面内交易多种资产。同时，RWA和链上国债作为资产层的融合正在加速。尽管规模尚小，但代币化国债等产品为链上提供了低波动收益资产，并吸引JP摩根、贝莱德等传统机构参与，测试未来资本市场的底层结算方式。最终，加密与华尔街并非谁征服谁，而是在共同塑造一个更高效、全球化的统一资本市场。用户未来或将在同一个账户中自由交易比特币、股票、ETF、链上国债等多种资产，体验无缝的跨资产配置。去中心化的理想仍在底层协议中延续，而在应用层，一个融合了双方优势的新金融形态正在形成。

marsbit4 小時前

marsbit4 小時前

交易

現貨

实锤，GPT-5.5「降智」被抓，OpenAI官方文档认了

文章摘要

200美元/月,买了个「薛定谔的模型」

不是错觉,OpenAI自己白纸黑字写着

OpenAI承认了,然后就没有然后了

每次升级都是一次「降智争议」

跑分最强的那天,是发布日

相關問答

你可能也喜歡

连续三季下跌后，加密市场第三季度能否迎来企稳窗口？

SpaceX交易权限现已开放：WEEX上线SPCXON交易对

BIT交易时刻：BTC仍受压于周线200 EMA，被拒后或将重启下跌，昨夜大涨的存储和半导体夜盘开跌

前CFTC主席、Circle总裁Tarbert：一边劝你长期主义，一边自己套现3000万美元

Gate 研究院：加密金融产品掀起“华尔街化”浪潮，是竞争还是融合？

交易

熱門分類

熱門標籤