Preuve flagrante, GPT-5.5 pris en flagrant délit de « perte d'intelligence », les documents officiels d'OpenAI l'admettent

marsbitPublié le 2026-05-27Dernière mise à jour le 2026-05-27

Résumé

**OpenAI accusé d'avoir "abaissé" l'intelligence du GPT-5.5, les documents officiels le confirment** Des utilisateurs de ChatGPT dénoncent une dégradation soudaine des performances du modèle GPT-5.5, en particulier dans son mode "Extended Thinking". Après une ou deux heures d'utilisation, les réponses deviennent instantanées et de moindre qualité, bien que l'interface continue d'afficher le même modèle. Des tests, dont l'interrogation du modèle sur sa date de formation (qui correspond à la version "Instant", non à "Thinking"), suggèrent un remplacement silencieux par un modèle moins puissant. La documentation officielle d'OpenAI confirme ce mécanisme : après 160 messages/3 heures pour les utilisateurs Plus, le système bascule automatiquement et sans avertissement vers un modèle "mini". Les utilisateurs Pro du mode "Heavy" peuvent également être limités en cas de forte charge serveur. Ce phénomène n'est pas nouveau ; des utilisateurs de Codex avaient déjà signalé en février, via des commandes de trace, une rétrogradation silencieuse du GPT-5.3 vers le GPT-5.2. Cette controverse s'inscrit dans une série de plaintes similaires après chaque mise à jour majeure, de GPT-5 à GPT-5.5. OpenAI a reconnu et marqué comme "résolu" un incident de dégradation des performances mi-mai, mais les signalements ont repris de plus belle fin mai. Pour certains observateurs, cette pratique viserait à optimiser les coûts de calcul. Ironiquement, tandis que les utilisateurs de GPT-5.5 luttent pour ...

【Introduction】GPT-5.5 démasqué pour sa « fausse réflexion », remplacé secrètement par mini après deux heures d'utilisation. Un abonnement à 200 dollars par mois pour un « cerveau de Schrödinger ». La commande trace apporte la preuve flagrante, les documents officiels l'admettent eux-mêmes. Les plaintes affluent : OpenAI, à qui tu veux faire croire ça ?

ChatGPT est à nouveau accusé de « perte d'intelligence » !

C'est ces derniers jours que X a explosé le premier.

L'utilisateur Lisan al Gaib a découvert qu'après une ou deux heures d'utilisation, GPT-5.5 devenait soudainement stupide, chaque requête obtenant une réponse immédiate, avec une qualité en chute libre.

Mais l'interface affichait toujours « GPT-5.5 Extended Thinking ».

En d'autres termes, l'étiquette de réflexion était toujours là, mais la réflexion elle-même avait disparu.

200 dollars/mois, pour un « modèle de Schrödinger »

Sur le forum des développeurs d'OpenAI, un post de plainte a fait exploser les discussions.

Agentify.sh a déclaré que GPT-5.5 perdait soudainement sa capacité à suivre les instructions après une certaine utilisation.

On le voyait annoncer avec enthousiasme qu'il avait « réparé » quelque chose, mais la qualité du code était si mauvaise qu'elle provoquait des retours en arrière massifs.

Des tâches d'interface utilisateur que 5.5-med gérait facilement auparavant, maintenant il ne parvient même pas à faire les modifications les plus simples.

Passer à 5.5-high, inutile. Monter encore à xhigh, toujours pas.

Et là où xhigh pouvait tourner pendant plusieurs heures auparavant, la durée est maintenant clairement raccourcie.

Dès la publication du post, la section des commentaires a explosé.

Certains sont directement revenus à la version 5.4.

D'autres utilisaient le niveau le plus élevé, xhigh, mais constataient une « baisse notable par rapport à la semaine dernière, des erreurs fréquentes dans les tâches longues, ne suit pas du tout le flux de travail ».

D'autres rapportaient des situations encore plus absurdes : « même les requêtes simples mettent une éternité, si tu l'interromps pour corriger la direction, il t'ignore complètement et continue son plan erroné précédent ».

Exactement, tout le monde décrivait le même phénomène – le cerveau de GPT avait été discrètement remplacé, sans qu'on sache quand.

La performance actuelle de GPT-5.5 est similaire à celle de 5.3, sans exagérer. Les premiers jours étaient incroyables, maintenant on ne retrouve plus aucune trace du modèle d'origine.

Ce n'est pas une impression, OpenAI l'écrit noir sur blanc

Pour vérifier, Lisan al Gaib a réalisé un test comparatif.

Avec le même compte, l'utilisation d'Extended Thinking côté ChatGPT donnait des résultats médiocres, alors que le passage à Codex avec xhigh rétablissait immédiatement des performances normales.

Ses mots exacts furent que Codex est « littéralement 4 milliards de fois plus intelligent que ce truc ».

Le développeur Andrew Curran a eu une idée ingénieuse – demander directement au modèle « Quelle est la date limite de tes données d'entraînement ? »

Le modèle a répondu : août 2025.

Problème : la date limite de GPT-5.5 Thinking est décembre. Août, c'est la date limite de la version Instant !

Autrement dit, il avait sélectionné Thinking, mais le système exécutait en réalité Instant.

L'étiquette du modèle sur l'interface n'avait pas changé d'un seul mot, mais le modèle en arrière-plan avait été discrètement remplacé...

Le plus drôle, c'est que cette fois, OpenAI a lui-même fourni la preuve dans sa documentation d'aide.

Selon les explications officielles de l'OpenAI Help Center, les utilisateurs Plus peuvent envoyer un maximum de 160 messages GPT-5.5 toutes les 3 heures.

Une fois ce quota épuisé, le système bascule silencieusement vers le modèle mini, jusqu'au réinitialisation du quota.

Notez le mot « silencieusement ».

Aucune alerte contextuelle, aucun changement d'étiquette de modèle, aucun retour visuel.

Vous pensez toujours utiliser le modèle phare, alors que de l'autre côté, on vous a discrètement passé au mini.

Les utilisateurs Pro ne doivent pas non plus trop se réjouir.

Le mode de réflexion Heavy, le niveau de raisonnement le plus élevé réservé aux Pro, est également soumis à une limitation de capacité lorsque la charge du serveur est élevée. Là aussi, sans avertissement.

En d'autres termes, un abonnement Pro à 200 dollars/mois achète un service qui peut à tout moment être victime d'un « échange de têtes ».

Cette opération de « l'étiquette reste, le cerveau change » avait été repérée encore plus tôt côté Codex.

En février de cette année, un problème (issue) est apparu sur GitHub : un utilisateur Pro utilisant la commande trace a découvert qu'il demandait GPT-5.3 Codex, mais que le modèle réellement renvoyé était GPT-5.2.

Pas même 5.2 Codex, mais la version de base inférieure, 5.2.

Il a partagé la commande de reproduction :

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Sortie : gpt-5.2-2025-12-11
  • Attendu : gpt-5.3-codex

Plusieurs utilisateurs Pro ont confirmé la même dégradation sous le même issue.

Et cette dégradation est « collante », elle ne se rétablit pas d'elle-même, et il n'y a aucune explication.

Mieux encore, le jour même du lancement de GPT-5.5 en avril, des utilisateurs ont signalé que la vitesse du mode Fast était similaire à celle du Standard, mais que la facturation se faisait toujours au tarif Fast.

Une tâche simple a pris 7 minutes 49 secondes, alors que normalement cela devrait prendre 5 à 6 minutes.

OpenAI a reconnu, et puis... plus rien

Le 15 mai, une entrée est apparue sur la page de statut d'OpenAI.

Dégradation des performances GPT5.5 : Nous enquêtons sur les problèmes de dégradation des performances de GPT-5.5 signalés par certains utilisateurs.

Le 17 mai, le statut a été mis à jour à « Résolu ».

Mais d'après la chronologie des posts sur le forum, les plaintes de perte d'intelligence des 24-26 mai étaient encore plus fortes que celles de la vague du 15 mai.

Soit le problème « résolu » est revenu, soit il n'a jamais été vraiment résolu.

Chaque mise à niveau est une « controverse de perte d'intelligence »

Bien que toutes les entreprises fassent face à des critiques de « modèle qui devient stupide », OpenAI, de GPT-5 à GPT-5.5, n'a manqué aucune de ces controverses lors de chaque mise à jour.

À chaque fois OpenAI dit enquêter, à chaque fois il dit que c'est résolu, et puis la version suivante recommence.

Août 2025, lancement de GPT-5. Le titre du post populaire sur Reddit était directement « GPT-5 est trop nul ». Les utilisateurs se plaignaient de réponses courtes, de plus de refus, de moins de personnalité.

OpenAI a été contraint de restaurer d'urgence l'option GPT-4o. Altman a lui-même reconnu lors d'un AMA Reddit que c'était « plus cahoteux que prévu ».

Décembre 2025, GPT-5.2. Qualité de traduction en régression, invention d'API inexistantes, refus d'exécuter des instructions de style que 5.1 accomplissait facilement.

Février 2026, GPT-5.3-Codex. Les utilisateurs Pro ont été dégradés silencieusement vers la 5.2, preuve flagrante par la commande trace.

Mars 2026, GPT-5.4. Un post « GPT-5.4 a clairement régressé dans Codex » est apparu sur le forum communautaire d'OpenAI, toutes les réponses des internautes le confirmant.

Début mai 2026, GPT-5.5 Instant lancé. Longueur des réponses réduite de 30%, les emojis ont presque disparu. Résumé des internautes : la précision a augmenté, mais la chaleur (température) a disparu.

Fin mai 2026, c'est-à-dire maintenant. Les plaintes de perte d'intelligence du mode Thinking éclatent à nouveau.

Lisan al Gaib révèle que depuis qu'il a mené la bataille pour les quotas ChatGPT Plus lors du lancement de GPT-5, il « reçoit chaque semaine des messages privés comme celui-ci ».

Le dernier en date est une demande d'aide pour récupérer le xhigh/heavy thinking.

Le jour où il est le plus fort aux benchmarks, c'est le jour du lancement

chatgptdisaster.com a compilé 1087 plaintes vérifiées d'utilisateurs, dont un scénario mentionné de façon répétée appelé « défaillance de la couche de routage » : l'interface affiche GPT-5.5 Pro, mais la sortie est d'un tout autre niveau.

Les utilisateurs décrivent un modèle reproductible : après une longue session, le modèle commence à « ignorer complètement ce que vous dites », mais le sélecteur de modèle affiche toujours l'étiquette haut de gamme.

L'annotation la plus absurde est que le mécanisme de basculement automatique vers mini après épuisement des 160 messages/3 heures pour les utilisateurs Plus est décrit comme une « fonctionnalité » dans la documentation officielle d'OpenAI.

Pourquoi en est-il ainsi ? Lisan al Gaib analyse que la réponse tient en deux mots : économiser de l'argent.

Le resserrement entre puissance de calcul et rentabilité affecte tout le monde. On économise partout, on ne laisse passer aucune opportunité de réduire les coûts.

Pourtant, la même semaine où les utilisateurs de GPT-5.5 se plaignent collectivement, la silhouette de GPT-5.6 est déjà apparue dans les logs d'arrière-plan de Codex.

Nom de code interne iris-alpha, contexte de 150 millions de tokens, la probabilité de sortie en juin donnée par Polymarket dépasse les 85%.

D'un côté, les utilisateurs de 5.5 ne parviennent même pas à conserver une expérience de base, de l'autre, 5.6 exécute déjà discrètement du trafic réel en arrière-plan.

Telle est la course à l'ASI en 2026.

La vitesse de création de nouveaux modèles s'accélère, mais faire fonctionner correctement un ancien modèle pendant toute une session devient de plus en plus difficile.

Le jour où il est le plus fort aux benchmarks est toujours le jour du lancement, et chaque jour suivant est un GPT de Schrödinger.

Référence : https://x.com/scaling01/status/2058643470357590058?s=20

Cet article provient du compte public WeChat « New Zhiyuan », auteur : ASI Apocalypse ; éditeur : Moïse

Questions liées

QQuel est le principal problème signalé concernant GPT-5.5 dans cet article ?

AL'article signale que GPT-5.5 subit une 'détérioration de l'intelligence' ou un 'dumbing down' après une utilisation d'une à deux heures. L'interface utilisateur continue d'afficher l'étiquette 'GPT-5.5 Extended Thinking', mais le modèle derrière serait silencieusement remplacé par une version inférieure (comme GPT-5.5 Instant ou même GPT-5.2), entraînant des réponses de moindre qualité et des temps de réponse plus rapides.

QComment les utilisateurs ont-ils vérifié que le modèle avait été remplacé sans notification ?

ALes utilisateurs ont utilisé plusieurs méthodes pour vérifier : 1) En demandant au modèle sa date de coupure de données d'entraînement, qui correspondait à une version différente (Instant vs Thinking). 2) En utilisant la commande 'trace' dans Codex, qui a révélé que les requêtes pour GPT-5.3 Codex recevaient en réalité des réponses de GPT-5.2. 3) En comparant les performances entre l'interface ChatGPT et Codex pour le même compte.

QQue dit la documentation officielle d'OpenAI concernant le changement de modèle pour les utilisateurs Plus ?

ALa documentation officielle du centre d'aide d'OpenAI confirme que les utilisateurs ChatGPT Plus ont une limite de 160 messages GPT-5.5 par période de 3 heures. Une fois cette limite atteinte, le système bascule *silencieusement* vers le modèle 'mini' jusqu'au prochain reset. Aucune notification ou changement d'étiquette dans l'interface n'avertit l'utilisateur de ce changement.

QQuelle est la raison possible avancée par l'article pour expliquer ces pratiques d'OpenAI ?

AL'article suggère que la raison principale est économique : réduire les coûts en calcul (compute). La pression sur la rentabilité pousserait OpenAI à optimiser les dépenses en calcul en remplaçant discrètement les modèles plus coûteux (comme GPT-5.5 Thinking) par des versions moins chères (comme mini ou Instant) après un certain temps d'utilisation ou sous une charge serveur élevée.

QSelon l'article, comment la communauté a-t-elle réagi aux problèmes de performance à chaque mise à jour majeure de GPT ?

ALa communauté a systématiquement signalé des problèmes de 'détérioration de l'intelligence' à chaque mise à jour majeure, de GPT-5 à GPT-5.5. Les plaintes concernent des réponses plus courtes, un refus accru d'exécuter des tâches, une perte de personnalité, une dégradation de la qualité des traductions ou du code. OpenAI a généralement répondu en ouvrant des enquêtes et en marquant les problèmes comme 'résolus', mais les plaintes réapparaissent souvent avec les versions suivantes.

Lectures associées

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 3 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 3 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

Trois ans après ses prédictions sur le ChatGPT en mars 2023, Wang Jianshuo revient sur ses 20 affirmations initiales. Évaluées en mai 2026 par des agents IA, la plupart de ses intuitions sur les grandes tendances se sont révélées justes : le RAG est devenu l'architecture standard pour intégrer des connaissances, l'Interface Utilisateur en Langage Naturel (LUI) a créé un nouvel écosystème, et les modèles chinois ont presque rattrapé les leaders mondiaux. Des concepts comme les réseaux d'agents et la nature limitée du test de Turing se sont également matérialisés. Cependant, les prévisions quantitatives et les affirmations trop absolues ont souvent échoué. Le paramétrage supposé du GPT-4 (100T) était inexact, et les coûts de développement des modèles ont dépassé les estimations. Il a sous-estimé la vitesse de personnalisation des IA et l'impact distribué sur l'emploi des jeunes. La capture de valeur a surtout bénéficié à la couche matérielle (comme Nvidia), et non aux seules applications. Les leçons clés sont que les mécanismes et les directions sont plus fiables que les chiffres précis, que l'optimisme à court terme doit être tempéré, et que les nuances ("peut-être", "pour l'instant") rendent les prédictions plus robustes. Cette rétrospective souligne l'importance de distinguer les tendances confirmées des questions toujours ouvertes.

链捕手Il y a 5 h

Trois ans plus tard : un retour sur mes prédictions de 2023 concernant ChatGPT

链捕手Il y a 5 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

Alors que l'IA écrit du code, traite des tickets clients et révise des documents juridiques, elle ne se contente plus d'être un outil mais devient une source directe de travail. La commercialisation de l'IA évolue ainsi d'un marché de « jetons » (tokens) ou d'heures de GPU vers un nouveau marché : celui de la « main-d'œuvre machine ». Dans ce marché, le jeton n'est qu'une unité de mesure, le GPU un intrant, et le modèle un outil de production. L'objet véritablement tarifé et échangé est le travail économique accompli directement par le logiciel. Le mécanisme de prix de l'IA devrait évoluer des jetons bruts vers des capacités de modèles standardisées, puis vers une main-d'œuvre sectorielle, et enfin vers un marché de résultats programmables. À l'avenir, les entreprises pourraient ne plus se soucier du modèle ou du GPU spécifique utilisé, mais uniquement du fait que la tâche soit livrée dans des délais, avec un taux de précision, une fiabilité et un coût conformes aux standards. Ce changement ne signifie pas un simple remplacement du travail humain. Alors que la machine assume des tâches standardisées et vérifiables, le rôle humain pourrait se déplacer vers la supervision, la responsabilité finale, la gestion du contexte et les jugements critiques. Dans certains cas, les 1% de jugement humain final pourraient gagner en valeur, car ils permettent de débloquer les 99% d'automatisation à grande échelle. Le marché évolue donc vers une couche où le « travail » lui-même devient l'unité stable, standardisée, vérifiable et négociable. La prochaine phase de concurrence ne portera pas seulement sur la puissance des modèles ou le prix du calcul, mais sur la capacité à standardiser, vérifier et tarifer le « travail » accompli, faisant de la main-d'œuvre machine une nouvelle ressource productive que l'on peut acheter, facturer et échanger.

marsbitIl y a 6 h

Du Token à la main-d'œuvre machine : l'IA passe d'outil à « travailleur »

marsbitIl y a 6 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

Dans un article intitulé "La réduction de 99% du prix de MiMo de Xiaomi n'est pas du marketing ! Luo Fuli répond aux détracteurs sur X", Luo Fuli, responsable de MiMo, a publié un billet de blog technique de 5000 mots pour expliquer la baisse drastique des prix de l'API MiMo-V2.5. Contrairement aux interprétations initiales d'une guerre des prix ou d'une stratégie de perte, cette réduction de 99% concerne spécifiquement le coût des entrées en cache ("Input Cache Hit"), c'est-à-dire la relecture du contexte historique dans les conversations longues. Le billet détaille six piliers d'ingénierie ayant permis cette réduction : 1. **Architecture Hybride SWA** : Réduction du volume de la mémoire cache (KVCache) à 1/7 grâce à une attention par fenêtre glissante sur 60 des 70 couches du modèle. 2. **Gestion en double pool** : Allocation efficace de la mémoire pour matérialiser les gains théoriques du SWA, multipliant par 5 le nombre d'utilisateurs simultanés par GPU. 3. **Cache de préfixe optimisé** : Augmentation du taux de réussite du cache à 93-95% en moyenne, évitant de recalculer les contextes répétés. 4. **Système de cache distribué GCache** : Stockage des données sur les SSD des machines GPU existantes, réduisant les coûts de stockage additionnels à zéro. 5. **Système de routage LLM-Router** : Optimisation de l'acheminement des requêtes pour maximiser l'utilisation du cache et améliorer les performances. 6. **Prédiction Multi-Token (MTP)** : Accélération de la génération des réponses du modèle, réduisant également les coûts de sortie. Cette chaîne d'optimisations systémiques a réduit le temps GPU par requête d'un ordre de grandeur, permettant une baisse de prix de 99% tout en maintenant une marge positive. Luo Fuli souligne qu'il s'agit d'un accomplissement d'ingénierie validé en production, et non d'une simple manœuvre marketing, offrant une référence pour réduire les coûts dans le secteur de l'IA.

marsbitIl y a 8 h

La réduction de 99% du prix de Xiaomi MiMo n'est pas un coup marketing ! Luo Fuli répond aux détracteurs sur X

marsbitIl y a 8 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

Cathy Wood (ARK) a réalisé une opération exemplaire sur l'action Circle, démontrant une maîtrise des mouvements de marché à court terme malgré son approche d'investissement habituellement tournée vers le très long terme. Elle a d'abord acquis près de 4,5 millions d'actions au prix d'introduction de 31 dollars, profitant ainsi de l'envolée initiale due à une faible offre flottante et une forte demande. Lorsque le titre a été propulsé à près de 300 dollars en juin 2025, porté par l'adoption du projet de loi sur les stablecoins (GENIUS Act), Wood a systématiquement vendu par tranches environ 1,7 million d'actions à un prix moyen d'environ 210 dollars, réalisant ainsi des plus-values substantielles. Cette décision était motivée à la fois par des règles internes de rééquilibrage de portefeuille et par l'anticipation de l'augmentation future de l'offre d'actions. Par la suite, face à la chute de l'action (jusqu'à -83% depuis son pic), Wood a racheté progressivement sa position initiale à des prix bien inférieurs (entre environ 50 et 130 dollars), portant son portefeuille à nouveau à environ 4,5 millions d'actions fin mars 2026. L'opération illustre trois principes clés : une conviction forte sur le modèle économique à long terme de Circle (stablecoin USDC), une exécution disciplinée par tranches sans chercher à prédire les sommets ou les creux, et le respect strict de règles de gestion des risques limitant le poids d'un titre dans le portefeuille.

marsbitIl y a 12 h

Analyse rétrospective des opérations magistrales de Cathie Wood sur Circle

marsbitIl y a 12 h

Trading

Spot
Futures
活动图片