Preuve flagrante, GPT-5.5 pris en flagrant délit de « perte d'intelligence », les documents officiels d'OpenAI l'admettent

marsbitPublié le 2026-05-27Dernière mise à jour le 2026-05-27

Résumé

**OpenAI accusé d'avoir "abaissé" l'intelligence du GPT-5.5, les documents officiels le confirment** Des utilisateurs de ChatGPT dénoncent une dégradation soudaine des performances du modèle GPT-5.5, en particulier dans son mode "Extended Thinking". Après une ou deux heures d'utilisation, les réponses deviennent instantanées et de moindre qualité, bien que l'interface continue d'afficher le même modèle. Des tests, dont l'interrogation du modèle sur sa date de formation (qui correspond à la version "Instant", non à "Thinking"), suggèrent un remplacement silencieux par un modèle moins puissant. La documentation officielle d'OpenAI confirme ce mécanisme : après 160 messages/3 heures pour les utilisateurs Plus, le système bascule automatiquement et sans avertissement vers un modèle "mini". Les utilisateurs Pro du mode "Heavy" peuvent également être limités en cas de forte charge serveur. Ce phénomène n'est pas nouveau ; des utilisateurs de Codex avaient déjà signalé en février, via des commandes de trace, une rétrogradation silencieuse du GPT-5.3 vers le GPT-5.2. Cette controverse s'inscrit dans une série de plaintes similaires après chaque mise à jour majeure, de GPT-5 à GPT-5.5. OpenAI a reconnu et marqué comme "résolu" un incident de dégradation des performances mi-mai, mais les signalements ont repris de plus belle fin mai. Pour certains observateurs, cette pratique viserait à optimiser les coûts de calcul. Ironiquement, tandis que les utilisateurs de GPT-5.5 luttent pour ...

【Introduction】GPT-5.5 démasqué pour sa « fausse réflexion », remplacé secrètement par mini après deux heures d'utilisation. Un abonnement à 200 dollars par mois pour un « cerveau de Schrödinger ». La commande trace apporte la preuve flagrante, les documents officiels l'admettent eux-mêmes. Les plaintes affluent : OpenAI, à qui tu veux faire croire ça ?

ChatGPT est à nouveau accusé de « perte d'intelligence » !

C'est ces derniers jours que X a explosé le premier.

L'utilisateur Lisan al Gaib a découvert qu'après une ou deux heures d'utilisation, GPT-5.5 devenait soudainement stupide, chaque requête obtenant une réponse immédiate, avec une qualité en chute libre.

Mais l'interface affichait toujours « GPT-5.5 Extended Thinking ».

En d'autres termes, l'étiquette de réflexion était toujours là, mais la réflexion elle-même avait disparu.

200 dollars/mois, pour un « modèle de Schrödinger »

Sur le forum des développeurs d'OpenAI, un post de plainte a fait exploser les discussions.

Agentify.sh a déclaré que GPT-5.5 perdait soudainement sa capacité à suivre les instructions après une certaine utilisation.

On le voyait annoncer avec enthousiasme qu'il avait « réparé » quelque chose, mais la qualité du code était si mauvaise qu'elle provoquait des retours en arrière massifs.

Des tâches d'interface utilisateur que 5.5-med gérait facilement auparavant, maintenant il ne parvient même pas à faire les modifications les plus simples.

Passer à 5.5-high, inutile. Monter encore à xhigh, toujours pas.

Et là où xhigh pouvait tourner pendant plusieurs heures auparavant, la durée est maintenant clairement raccourcie.

Dès la publication du post, la section des commentaires a explosé.

Certains sont directement revenus à la version 5.4.

D'autres utilisaient le niveau le plus élevé, xhigh, mais constataient une « baisse notable par rapport à la semaine dernière, des erreurs fréquentes dans les tâches longues, ne suit pas du tout le flux de travail ».

D'autres rapportaient des situations encore plus absurdes : « même les requêtes simples mettent une éternité, si tu l'interromps pour corriger la direction, il t'ignore complètement et continue son plan erroné précédent ».

Exactement, tout le monde décrivait le même phénomène – le cerveau de GPT avait été discrètement remplacé, sans qu'on sache quand.

La performance actuelle de GPT-5.5 est similaire à celle de 5.3, sans exagérer. Les premiers jours étaient incroyables, maintenant on ne retrouve plus aucune trace du modèle d'origine.

Ce n'est pas une impression, OpenAI l'écrit noir sur blanc

Pour vérifier, Lisan al Gaib a réalisé un test comparatif.

Avec le même compte, l'utilisation d'Extended Thinking côté ChatGPT donnait des résultats médiocres, alors que le passage à Codex avec xhigh rétablissait immédiatement des performances normales.

Ses mots exacts furent que Codex est « littéralement 4 milliards de fois plus intelligent que ce truc ».

Le développeur Andrew Curran a eu une idée ingénieuse – demander directement au modèle « Quelle est la date limite de tes données d'entraînement ? »

Le modèle a répondu : août 2025.

Problème : la date limite de GPT-5.5 Thinking est décembre. Août, c'est la date limite de la version Instant !

Autrement dit, il avait sélectionné Thinking, mais le système exécutait en réalité Instant.

L'étiquette du modèle sur l'interface n'avait pas changé d'un seul mot, mais le modèle en arrière-plan avait été discrètement remplacé...

Le plus drôle, c'est que cette fois, OpenAI a lui-même fourni la preuve dans sa documentation d'aide.

Selon les explications officielles de l'OpenAI Help Center, les utilisateurs Plus peuvent envoyer un maximum de 160 messages GPT-5.5 toutes les 3 heures.

Une fois ce quota épuisé, le système bascule silencieusement vers le modèle mini, jusqu'au réinitialisation du quota.

Notez le mot « silencieusement ».

Aucune alerte contextuelle, aucun changement d'étiquette de modèle, aucun retour visuel.

Vous pensez toujours utiliser le modèle phare, alors que de l'autre côté, on vous a discrètement passé au mini.

Les utilisateurs Pro ne doivent pas non plus trop se réjouir.

Le mode de réflexion Heavy, le niveau de raisonnement le plus élevé réservé aux Pro, est également soumis à une limitation de capacité lorsque la charge du serveur est élevée. Là aussi, sans avertissement.

En d'autres termes, un abonnement Pro à 200 dollars/mois achète un service qui peut à tout moment être victime d'un « échange de têtes ».

Cette opération de « l'étiquette reste, le cerveau change » avait été repérée encore plus tôt côté Codex.

En février de cette année, un problème (issue) est apparu sur GitHub : un utilisateur Pro utilisant la commande trace a découvert qu'il demandait GPT-5.3 Codex, mais que le modèle réellement renvoyé était GPT-5.2.

Pas même 5.2 Codex, mais la version de base inférieure, 5.2.

Il a partagé la commande de reproduction :

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Sortie : gpt-5.2-2025-12-11
  • Attendu : gpt-5.3-codex

Plusieurs utilisateurs Pro ont confirmé la même dégradation sous le même issue.

Et cette dégradation est « collante », elle ne se rétablit pas d'elle-même, et il n'y a aucune explication.

Mieux encore, le jour même du lancement de GPT-5.5 en avril, des utilisateurs ont signalé que la vitesse du mode Fast était similaire à celle du Standard, mais que la facturation se faisait toujours au tarif Fast.

Une tâche simple a pris 7 minutes 49 secondes, alors que normalement cela devrait prendre 5 à 6 minutes.

OpenAI a reconnu, et puis... plus rien

Le 15 mai, une entrée est apparue sur la page de statut d'OpenAI.

Dégradation des performances GPT5.5 : Nous enquêtons sur les problèmes de dégradation des performances de GPT-5.5 signalés par certains utilisateurs.

Le 17 mai, le statut a été mis à jour à « Résolu ».

Mais d'après la chronologie des posts sur le forum, les plaintes de perte d'intelligence des 24-26 mai étaient encore plus fortes que celles de la vague du 15 mai.

Soit le problème « résolu » est revenu, soit il n'a jamais été vraiment résolu.

Chaque mise à niveau est une « controverse de perte d'intelligence »

Bien que toutes les entreprises fassent face à des critiques de « modèle qui devient stupide », OpenAI, de GPT-5 à GPT-5.5, n'a manqué aucune de ces controverses lors de chaque mise à jour.

À chaque fois OpenAI dit enquêter, à chaque fois il dit que c'est résolu, et puis la version suivante recommence.

Août 2025, lancement de GPT-5. Le titre du post populaire sur Reddit était directement « GPT-5 est trop nul ». Les utilisateurs se plaignaient de réponses courtes, de plus de refus, de moins de personnalité.

OpenAI a été contraint de restaurer d'urgence l'option GPT-4o. Altman a lui-même reconnu lors d'un AMA Reddit que c'était « plus cahoteux que prévu ».

Décembre 2025, GPT-5.2. Qualité de traduction en régression, invention d'API inexistantes, refus d'exécuter des instructions de style que 5.1 accomplissait facilement.

Février 2026, GPT-5.3-Codex. Les utilisateurs Pro ont été dégradés silencieusement vers la 5.2, preuve flagrante par la commande trace.

Mars 2026, GPT-5.4. Un post « GPT-5.4 a clairement régressé dans Codex » est apparu sur le forum communautaire d'OpenAI, toutes les réponses des internautes le confirmant.

Début mai 2026, GPT-5.5 Instant lancé. Longueur des réponses réduite de 30%, les emojis ont presque disparu. Résumé des internautes : la précision a augmenté, mais la chaleur (température) a disparu.

Fin mai 2026, c'est-à-dire maintenant. Les plaintes de perte d'intelligence du mode Thinking éclatent à nouveau.

Lisan al Gaib révèle que depuis qu'il a mené la bataille pour les quotas ChatGPT Plus lors du lancement de GPT-5, il « reçoit chaque semaine des messages privés comme celui-ci ».

Le dernier en date est une demande d'aide pour récupérer le xhigh/heavy thinking.

Le jour où il est le plus fort aux benchmarks, c'est le jour du lancement

chatgptdisaster.com a compilé 1087 plaintes vérifiées d'utilisateurs, dont un scénario mentionné de façon répétée appelé « défaillance de la couche de routage » : l'interface affiche GPT-5.5 Pro, mais la sortie est d'un tout autre niveau.

Les utilisateurs décrivent un modèle reproductible : après une longue session, le modèle commence à « ignorer complètement ce que vous dites », mais le sélecteur de modèle affiche toujours l'étiquette haut de gamme.

L'annotation la plus absurde est que le mécanisme de basculement automatique vers mini après épuisement des 160 messages/3 heures pour les utilisateurs Plus est décrit comme une « fonctionnalité » dans la documentation officielle d'OpenAI.

Pourquoi en est-il ainsi ? Lisan al Gaib analyse que la réponse tient en deux mots : économiser de l'argent.

Le resserrement entre puissance de calcul et rentabilité affecte tout le monde. On économise partout, on ne laisse passer aucune opportunité de réduire les coûts.

Pourtant, la même semaine où les utilisateurs de GPT-5.5 se plaignent collectivement, la silhouette de GPT-5.6 est déjà apparue dans les logs d'arrière-plan de Codex.

Nom de code interne iris-alpha, contexte de 150 millions de tokens, la probabilité de sortie en juin donnée par Polymarket dépasse les 85%.

D'un côté, les utilisateurs de 5.5 ne parviennent même pas à conserver une expérience de base, de l'autre, 5.6 exécute déjà discrètement du trafic réel en arrière-plan.

Telle est la course à l'ASI en 2026.

La vitesse de création de nouveaux modèles s'accélère, mais faire fonctionner correctement un ancien modèle pendant toute une session devient de plus en plus difficile.

Le jour où il est le plus fort aux benchmarks est toujours le jour du lancement, et chaque jour suivant est un GPT de Schrödinger.

Référence : https://x.com/scaling01/status/2058643470357590058?s=20

Cet article provient du compte public WeChat « New Zhiyuan », auteur : ASI Apocalypse ; éditeur : Moïse

Questions liées

QQuel est le principal problème signalé concernant GPT-5.5 dans cet article ?

AL'article signale que GPT-5.5 subit une 'détérioration de l'intelligence' ou un 'dumbing down' après une utilisation d'une à deux heures. L'interface utilisateur continue d'afficher l'étiquette 'GPT-5.5 Extended Thinking', mais le modèle derrière serait silencieusement remplacé par une version inférieure (comme GPT-5.5 Instant ou même GPT-5.2), entraînant des réponses de moindre qualité et des temps de réponse plus rapides.

QComment les utilisateurs ont-ils vérifié que le modèle avait été remplacé sans notification ?

ALes utilisateurs ont utilisé plusieurs méthodes pour vérifier : 1) En demandant au modèle sa date de coupure de données d'entraînement, qui correspondait à une version différente (Instant vs Thinking). 2) En utilisant la commande 'trace' dans Codex, qui a révélé que les requêtes pour GPT-5.3 Codex recevaient en réalité des réponses de GPT-5.2. 3) En comparant les performances entre l'interface ChatGPT et Codex pour le même compte.

QQue dit la documentation officielle d'OpenAI concernant le changement de modèle pour les utilisateurs Plus ?

ALa documentation officielle du centre d'aide d'OpenAI confirme que les utilisateurs ChatGPT Plus ont une limite de 160 messages GPT-5.5 par période de 3 heures. Une fois cette limite atteinte, le système bascule *silencieusement* vers le modèle 'mini' jusqu'au prochain reset. Aucune notification ou changement d'étiquette dans l'interface n'avertit l'utilisateur de ce changement.

QQuelle est la raison possible avancée par l'article pour expliquer ces pratiques d'OpenAI ?

AL'article suggère que la raison principale est économique : réduire les coûts en calcul (compute). La pression sur la rentabilité pousserait OpenAI à optimiser les dépenses en calcul en remplaçant discrètement les modèles plus coûteux (comme GPT-5.5 Thinking) par des versions moins chères (comme mini ou Instant) après un certain temps d'utilisation ou sous une charge serveur élevée.

QSelon l'article, comment la communauté a-t-elle réagi aux problèmes de performance à chaque mise à jour majeure de GPT ?

ALa communauté a systématiquement signalé des problèmes de 'détérioration de l'intelligence' à chaque mise à jour majeure, de GPT-5 à GPT-5.5. Les plaintes concernent des réponses plus courtes, un refus accru d'exécuter des tâches, une perte de personnalité, une dégradation de la qualité des traductions ou du code. OpenAI a généralement répondu en ouvrant des enquêtes et en marquant les problèmes comme 'résolus', mais les plaintes réapparaissent souvent avec les versions suivantes.

Lectures associées

Casper Lance une Boîte à Outils IA pour Agents Autonomes et Constructeurs

La Casper Association a lancé la Casper AI Toolkit, l'offre IA la plus complète sur une blockchain de Layer 1. Cette boîte à outils permet aux agents IA d'effectuer deux tâches principales : réaliser des transactions autonomes en tant qu'acteurs économiques, et créer, tester et déployer de nouvelles applications sans assistance humaine. Pour les transactions, le protocole x402 intègre le paiement directement dans la requête, permettant des micropaiements HTTP instantanés sans comptes de facturation ni intervention humaine. Les agents peuvent également interagir directement avec la blockchain via le Model Context Protocol (MCP) pour interroger des soldes ou soumettre des transactions. En tant que développeurs, les agents IA peuvent utiliser le cadre de travail Odra pour concevoir et déployer des contrats intelligents de manière autonome, un processus soutenu par le package CSPR.build Agent Skills. Ces composants forment un système cohérent où les agents peuvent à la fois construire des services et payer pour les utiliser, formant ainsi les bases d'une "économie machine". La prochaine étape, l'abstraction de compte, vise à donner aux agents leurs propres identités on-chain. Pour encourager le développement, la Casper Association organise un "Buildathon" avec 150 000 $ de prix et une utilisation gratuite parrainée du facilitateur x402 pour les équipes participantes.

TheNewsCryptoIl y a 1 h

Casper Lance une Boîte à Outils IA pour Agents Autonomes et Constructeurs

TheNewsCryptoIl y a 1 h

SpaceX, OpenAI, Anthropic : Les trois géants de l'IA dans la dernière ligne droite vers l'introduction en Bourse. Sur lequel faut-il miser ?

Les plus grandes introductions en bourse de l'histoire, SpaceX, OpenAI et Anthropic, se préparent à lever jusqu'à 1800 milliards de dollars, dépassant le total de la bulle internet. Cette ruée soudaine vers le marché public s'explique par l'énorme appétit en dépenses d'infrastructure pour l'IA (centres de données, GPU, électricité), que les flux de trésorerie actuels ne peuvent plus financer. SpaceX, avec son modèle commercial non éprouvé de centres de données spatiaux, redéfinit les règles d'entrée dans les indices pour attirer massivement les fonds de retraite passifs. Anthropic se distingue par une croissance explosive de ses revenus récurrents (450 milliards de dollars annualisés) et une profitabilité imminente, tirée par son adoption dans les grandes entreprises. OpenAI, comme Google qui lève 800 milliards de dollars séparément, a un besoin urgent de capitaux pour construire son infrastructure. Malgré les montants vertigineux et les ajustements de règles, les animateurs restent globalement optimistes. Ils estiment que ces investissements construisent la base physique essentielle de la prochaine ère technologique. La demande réelle dépasse l'offre de capacités de calcul, et les contraintes physiques (production de puces, construction) limitent les risques de bulle purement financière. Les trois sociétés représentent des paris à long terme sur les fondations de l'avenir.

marsbitIl y a 2 h

SpaceX, OpenAI, Anthropic : Les trois géants de l'IA dans la dernière ligne droite vers l'introduction en Bourse. Sur lequel faut-il miser ?

marsbitIl y a 2 h

Trading

Spot
Futures
活动图片