Preuve flagrante, GPT-5.5 pris en flagrant délit de « perte d'intelligence », les documents officiels d'OpenAI l'admettent

marsbitPublié le 2026-05-27Dernière mise à jour le 2026-05-27

Résumé

**OpenAI accusé d'avoir "abaissé" l'intelligence du GPT-5.5, les documents officiels le confirment** Des utilisateurs de ChatGPT dénoncent une dégradation soudaine des performances du modèle GPT-5.5, en particulier dans son mode "Extended Thinking". Après une ou deux heures d'utilisation, les réponses deviennent instantanées et de moindre qualité, bien que l'interface continue d'afficher le même modèle. Des tests, dont l'interrogation du modèle sur sa date de formation (qui correspond à la version "Instant", non à "Thinking"), suggèrent un remplacement silencieux par un modèle moins puissant. La documentation officielle d'OpenAI confirme ce mécanisme : après 160 messages/3 heures pour les utilisateurs Plus, le système bascule automatiquement et sans avertissement vers un modèle "mini". Les utilisateurs Pro du mode "Heavy" peuvent également être limités en cas de forte charge serveur. Ce phénomène n'est pas nouveau ; des utilisateurs de Codex avaient déjà signalé en février, via des commandes de trace, une rétrogradation silencieuse du GPT-5.3 vers le GPT-5.2. Cette controverse s'inscrit dans une série de plaintes similaires après chaque mise à jour majeure, de GPT-5 à GPT-5.5. OpenAI a reconnu et marqué comme "résolu" un incident de dégradation des performances mi-mai, mais les signalements ont repris de plus belle fin mai. Pour certains observateurs, cette pratique viserait à optimiser les coûts de calcul. Ironiquement, tandis que les utilisateurs de GPT-5.5 luttent pour ...

【Introduction】GPT-5.5 démasqué pour sa « fausse réflexion », remplacé secrètement par mini après deux heures d'utilisation. Un abonnement à 200 dollars par mois pour un « cerveau de Schrödinger ». La commande trace apporte la preuve flagrante, les documents officiels l'admettent eux-mêmes. Les plaintes affluent : OpenAI, à qui tu veux faire croire ça ?

ChatGPT est à nouveau accusé de « perte d'intelligence » !

C'est ces derniers jours que X a explosé le premier.

L'utilisateur Lisan al Gaib a découvert qu'après une ou deux heures d'utilisation, GPT-5.5 devenait soudainement stupide, chaque requête obtenant une réponse immédiate, avec une qualité en chute libre.

Mais l'interface affichait toujours « GPT-5.5 Extended Thinking ».

En d'autres termes, l'étiquette de réflexion était toujours là, mais la réflexion elle-même avait disparu.

200 dollars/mois, pour un « modèle de Schrödinger »

Sur le forum des développeurs d'OpenAI, un post de plainte a fait exploser les discussions.

Agentify.sh a déclaré que GPT-5.5 perdait soudainement sa capacité à suivre les instructions après une certaine utilisation.

On le voyait annoncer avec enthousiasme qu'il avait « réparé » quelque chose, mais la qualité du code était si mauvaise qu'elle provoquait des retours en arrière massifs.

Des tâches d'interface utilisateur que 5.5-med gérait facilement auparavant, maintenant il ne parvient même pas à faire les modifications les plus simples.

Passer à 5.5-high, inutile. Monter encore à xhigh, toujours pas.

Et là où xhigh pouvait tourner pendant plusieurs heures auparavant, la durée est maintenant clairement raccourcie.

Dès la publication du post, la section des commentaires a explosé.

Certains sont directement revenus à la version 5.4.

D'autres utilisaient le niveau le plus élevé, xhigh, mais constataient une « baisse notable par rapport à la semaine dernière, des erreurs fréquentes dans les tâches longues, ne suit pas du tout le flux de travail ».

D'autres rapportaient des situations encore plus absurdes : « même les requêtes simples mettent une éternité, si tu l'interromps pour corriger la direction, il t'ignore complètement et continue son plan erroné précédent ».

Exactement, tout le monde décrivait le même phénomène – le cerveau de GPT avait été discrètement remplacé, sans qu'on sache quand.

La performance actuelle de GPT-5.5 est similaire à celle de 5.3, sans exagérer. Les premiers jours étaient incroyables, maintenant on ne retrouve plus aucune trace du modèle d'origine.

Ce n'est pas une impression, OpenAI l'écrit noir sur blanc

Pour vérifier, Lisan al Gaib a réalisé un test comparatif.

Avec le même compte, l'utilisation d'Extended Thinking côté ChatGPT donnait des résultats médiocres, alors que le passage à Codex avec xhigh rétablissait immédiatement des performances normales.

Ses mots exacts furent que Codex est « littéralement 4 milliards de fois plus intelligent que ce truc ».

Le développeur Andrew Curran a eu une idée ingénieuse – demander directement au modèle « Quelle est la date limite de tes données d'entraînement ? »

Le modèle a répondu : août 2025.

Problème : la date limite de GPT-5.5 Thinking est décembre. Août, c'est la date limite de la version Instant !

Autrement dit, il avait sélectionné Thinking, mais le système exécutait en réalité Instant.

L'étiquette du modèle sur l'interface n'avait pas changé d'un seul mot, mais le modèle en arrière-plan avait été discrètement remplacé...

Le plus drôle, c'est que cette fois, OpenAI a lui-même fourni la preuve dans sa documentation d'aide.

Selon les explications officielles de l'OpenAI Help Center, les utilisateurs Plus peuvent envoyer un maximum de 160 messages GPT-5.5 toutes les 3 heures.

Une fois ce quota épuisé, le système bascule silencieusement vers le modèle mini, jusqu'au réinitialisation du quota.

Notez le mot « silencieusement ».

Aucune alerte contextuelle, aucun changement d'étiquette de modèle, aucun retour visuel.

Vous pensez toujours utiliser le modèle phare, alors que de l'autre côté, on vous a discrètement passé au mini.

Les utilisateurs Pro ne doivent pas non plus trop se réjouir.

Le mode de réflexion Heavy, le niveau de raisonnement le plus élevé réservé aux Pro, est également soumis à une limitation de capacité lorsque la charge du serveur est élevée. Là aussi, sans avertissement.

En d'autres termes, un abonnement Pro à 200 dollars/mois achète un service qui peut à tout moment être victime d'un « échange de têtes ».

Cette opération de « l'étiquette reste, le cerveau change » avait été repérée encore plus tôt côté Codex.

En février de cette année, un problème (issue) est apparu sur GitHub : un utilisateur Pro utilisant la commande trace a découvert qu'il demandait GPT-5.3 Codex, mais que le modèle réellement renvoyé était GPT-5.2.

Pas même 5.2 Codex, mais la version de base inférieure, 5.2.

Il a partagé la commande de reproduction :

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Sortie : gpt-5.2-2025-12-11
  • Attendu : gpt-5.3-codex

Plusieurs utilisateurs Pro ont confirmé la même dégradation sous le même issue.

Et cette dégradation est « collante », elle ne se rétablit pas d'elle-même, et il n'y a aucune explication.

Mieux encore, le jour même du lancement de GPT-5.5 en avril, des utilisateurs ont signalé que la vitesse du mode Fast était similaire à celle du Standard, mais que la facturation se faisait toujours au tarif Fast.

Une tâche simple a pris 7 minutes 49 secondes, alors que normalement cela devrait prendre 5 à 6 minutes.

OpenAI a reconnu, et puis... plus rien

Le 15 mai, une entrée est apparue sur la page de statut d'OpenAI.

Dégradation des performances GPT5.5 : Nous enquêtons sur les problèmes de dégradation des performances de GPT-5.5 signalés par certains utilisateurs.

Le 17 mai, le statut a été mis à jour à « Résolu ».

Mais d'après la chronologie des posts sur le forum, les plaintes de perte d'intelligence des 24-26 mai étaient encore plus fortes que celles de la vague du 15 mai.

Soit le problème « résolu » est revenu, soit il n'a jamais été vraiment résolu.

Chaque mise à niveau est une « controverse de perte d'intelligence »

Bien que toutes les entreprises fassent face à des critiques de « modèle qui devient stupide », OpenAI, de GPT-5 à GPT-5.5, n'a manqué aucune de ces controverses lors de chaque mise à jour.

À chaque fois OpenAI dit enquêter, à chaque fois il dit que c'est résolu, et puis la version suivante recommence.

Août 2025, lancement de GPT-5. Le titre du post populaire sur Reddit était directement « GPT-5 est trop nul ». Les utilisateurs se plaignaient de réponses courtes, de plus de refus, de moins de personnalité.

OpenAI a été contraint de restaurer d'urgence l'option GPT-4o. Altman a lui-même reconnu lors d'un AMA Reddit que c'était « plus cahoteux que prévu ».

Décembre 2025, GPT-5.2. Qualité de traduction en régression, invention d'API inexistantes, refus d'exécuter des instructions de style que 5.1 accomplissait facilement.

Février 2026, GPT-5.3-Codex. Les utilisateurs Pro ont été dégradés silencieusement vers la 5.2, preuve flagrante par la commande trace.

Mars 2026, GPT-5.4. Un post « GPT-5.4 a clairement régressé dans Codex » est apparu sur le forum communautaire d'OpenAI, toutes les réponses des internautes le confirmant.

Début mai 2026, GPT-5.5 Instant lancé. Longueur des réponses réduite de 30%, les emojis ont presque disparu. Résumé des internautes : la précision a augmenté, mais la chaleur (température) a disparu.

Fin mai 2026, c'est-à-dire maintenant. Les plaintes de perte d'intelligence du mode Thinking éclatent à nouveau.

Lisan al Gaib révèle que depuis qu'il a mené la bataille pour les quotas ChatGPT Plus lors du lancement de GPT-5, il « reçoit chaque semaine des messages privés comme celui-ci ».

Le dernier en date est une demande d'aide pour récupérer le xhigh/heavy thinking.

Le jour où il est le plus fort aux benchmarks, c'est le jour du lancement

chatgptdisaster.com a compilé 1087 plaintes vérifiées d'utilisateurs, dont un scénario mentionné de façon répétée appelé « défaillance de la couche de routage » : l'interface affiche GPT-5.5 Pro, mais la sortie est d'un tout autre niveau.

Les utilisateurs décrivent un modèle reproductible : après une longue session, le modèle commence à « ignorer complètement ce que vous dites », mais le sélecteur de modèle affiche toujours l'étiquette haut de gamme.

L'annotation la plus absurde est que le mécanisme de basculement automatique vers mini après épuisement des 160 messages/3 heures pour les utilisateurs Plus est décrit comme une « fonctionnalité » dans la documentation officielle d'OpenAI.

Pourquoi en est-il ainsi ? Lisan al Gaib analyse que la réponse tient en deux mots : économiser de l'argent.

Le resserrement entre puissance de calcul et rentabilité affecte tout le monde. On économise partout, on ne laisse passer aucune opportunité de réduire les coûts.

Pourtant, la même semaine où les utilisateurs de GPT-5.5 se plaignent collectivement, la silhouette de GPT-5.6 est déjà apparue dans les logs d'arrière-plan de Codex.

Nom de code interne iris-alpha, contexte de 150 millions de tokens, la probabilité de sortie en juin donnée par Polymarket dépasse les 85%.

D'un côté, les utilisateurs de 5.5 ne parviennent même pas à conserver une expérience de base, de l'autre, 5.6 exécute déjà discrètement du trafic réel en arrière-plan.

Telle est la course à l'ASI en 2026.

La vitesse de création de nouveaux modèles s'accélère, mais faire fonctionner correctement un ancien modèle pendant toute une session devient de plus en plus difficile.

Le jour où il est le plus fort aux benchmarks est toujours le jour du lancement, et chaque jour suivant est un GPT de Schrödinger.

Référence : https://x.com/scaling01/status/2058643470357590058?s=20

Cet article provient du compte public WeChat « New Zhiyuan », auteur : ASI Apocalypse ; éditeur : Moïse

Questions liées

QQuel est le principal problème signalé concernant GPT-5.5 dans cet article ?

AL'article signale que GPT-5.5 subit une 'détérioration de l'intelligence' ou un 'dumbing down' après une utilisation d'une à deux heures. L'interface utilisateur continue d'afficher l'étiquette 'GPT-5.5 Extended Thinking', mais le modèle derrière serait silencieusement remplacé par une version inférieure (comme GPT-5.5 Instant ou même GPT-5.2), entraînant des réponses de moindre qualité et des temps de réponse plus rapides.

QComment les utilisateurs ont-ils vérifié que le modèle avait été remplacé sans notification ?

ALes utilisateurs ont utilisé plusieurs méthodes pour vérifier : 1) En demandant au modèle sa date de coupure de données d'entraînement, qui correspondait à une version différente (Instant vs Thinking). 2) En utilisant la commande 'trace' dans Codex, qui a révélé que les requêtes pour GPT-5.3 Codex recevaient en réalité des réponses de GPT-5.2. 3) En comparant les performances entre l'interface ChatGPT et Codex pour le même compte.

QQue dit la documentation officielle d'OpenAI concernant le changement de modèle pour les utilisateurs Plus ?

ALa documentation officielle du centre d'aide d'OpenAI confirme que les utilisateurs ChatGPT Plus ont une limite de 160 messages GPT-5.5 par période de 3 heures. Une fois cette limite atteinte, le système bascule *silencieusement* vers le modèle 'mini' jusqu'au prochain reset. Aucune notification ou changement d'étiquette dans l'interface n'avertit l'utilisateur de ce changement.

QQuelle est la raison possible avancée par l'article pour expliquer ces pratiques d'OpenAI ?

AL'article suggère que la raison principale est économique : réduire les coûts en calcul (compute). La pression sur la rentabilité pousserait OpenAI à optimiser les dépenses en calcul en remplaçant discrètement les modèles plus coûteux (comme GPT-5.5 Thinking) par des versions moins chères (comme mini ou Instant) après un certain temps d'utilisation ou sous une charge serveur élevée.

QSelon l'article, comment la communauté a-t-elle réagi aux problèmes de performance à chaque mise à jour majeure de GPT ?

ALa communauté a systématiquement signalé des problèmes de 'détérioration de l'intelligence' à chaque mise à jour majeure, de GPT-5 à GPT-5.5. Les plaintes concernent des réponses plus courtes, un refus accru d'exécuter des tâches, une perte de personnalité, une dégradation de la qualité des traductions ou du code. OpenAI a généralement répondu en ouvrant des enquêtes et en marquant les problèmes comme 'résolus', mais les plaintes réapparaissent souvent avec les versions suivantes.

Lectures associées

La fête du trillion pour les vendeurs de mémoire, la chute des profits pour les acheteurs

Le marché de la mémoire vit une situation paradoxale : les fabricants de puces comme Micron (dont la valorisation a dépassé 1 000 milliards de dollars) connaissent une envolée historique, tandis que des acheteurs comme Xiaomi voient leurs profits s'effondrer. Cette divergence s'explique par une pénurie sévère et une stratification du marché. La demande explosive pour l'IA (HBM, DDR5 serveur) absorbe la priorité des capacités de production, poussant les prix à la hausse et incitant les géants du cloud à signer des accords d'approvisionnement à long terme (LTA). Ces contrats, selon des analystes comme ceux de UBS, pourraient atténuer la cyclicité traditionnelle du secteur. Cependant, d'autres segments subissent de plein fouet cette tension. Les fabricants de smartphones comme Xiaomi font face à des coûts mémoire multipliés par quatre sur un an, rognant drastiquement leurs marges et les contraignant à réduire leurs gammes d'entrée. Le marché PC grand public, lui, montre déjà des signes de correction sur les prix au détail, révélant des dynamiques contrastées. La question centrale est de savoir si les LTA peuvent véritablement éliminer le cycle. La valorisation record de Micron repose sur des profits atteints au sommet d'un cycle de prix et sur l'hypothèse d'une demande d'IA pérenne. Une inflexion de la croissance des investissements en IA ou un retour de la surcapacité pourrait rapidement inverser la tendance, rappelant que dans les matières premières, les périodes d'euphorie collective précèdent souvent des corrections brutales. La bulle Internet et le cas de Cisco servent de rappel historique.

marsbitIl y a 57 mins

La fête du trillion pour les vendeurs de mémoire, la chute des profits pour les acheteurs

marsbitIl y a 57 mins

Cette génération de dieux de la bourse américaine ne regarde plus les états financiers

En 2026, une nouvelle génération de « gourous » de la bourse américaine émerge sur Reddit, X et Substack, délaissant les méthodes d'investissement traditionnelles axées sur l'analyse des états financiers. Ils se concentrent plutôt sur la stratégie de « ciblage de la chaîne d'approvisionnement », en identifiant des actions de petite capitalisation (micro-caps), négligées par les analystes de Wall Street, qui sont pourtant cruciales dans la chaîne de valeur de l'IA. Des figures comme Serenity (de WallStreetBets) ont gagné en notoriété en ciblant avec succès des sociétés comme AXTI, un fournisseur monopolistique de substrats d'arséniure de gallium et de phosphure d'indium, essentiels à l'industrie de l'optique photonique pour l'IA. D'autres, comme KawzInvests, PhotonCap ou u/imacompnerd, adoptent une approche similaire, analysant l'infrastructure de l'IA, l'optique, les logiciels d'entreprise et les petites sociétés de croissance avec un angle thématique plutôt que financier. Ce mouvement représente un changement culturel par rapport à l'investissement de valeur à la Warren Buffett, qui s'appuie sur l'analyse approfondie des rapports financiers. Ces nouveaux investisseurs recherchent des signaux dans les cycles de certification des clients, la position dans la chaîne d'approvisionnement, les ruptures technologiques ou les opportunités de réévaluation. Leur terrain de jeu, les micro-caps, présente des caractéristiques d'une économie de l'attention : faible liquidité, narration puissante et diffusion communautaire, rappelant parfois la dynamique des meme coins. Ce créneau est souvent inaccessible aux grandes institutions en raison de contraintes de taille et de liquidité, laissant un espace pour les investisseurs individuels agiles. Cependant, la pérennité de cette stratégie dépend de la persistance de l'avantage informationnel, de la matérialisation des fondamentaux économiques sous-jacents et de la gestion des risques liés à la liquidité et à la volatilité propres à ces actifs. Cette tendance reflète aussi une migration des compétences narratives affûtées dans la crypto vers les marchés actions traditionnels.

marsbitIl y a 1 h

Cette génération de dieux de la bourse américaine ne regarde plus les états financiers

marsbitIl y a 1 h

L'euphorie du billion pour les vendeurs de mémoire, la chute des bénéfices pour les acheteurs

Le 26 mai, deux événements contrastés illustrent la fracture dans l'industrie de la mémoire : le fabricant de smartphones Xiaomi annonce une chute de 43 % de son bénéfice ajusté au premier trimestre 2026, citant le coût des modules mémoire multiplié par quatre et une augmentation de 1500 yuans par appareil, tandis que le fabricant de puces Micron voit sa valorisation dépasser 1000 milliards de dollars après une hausse de 19 % en une journée. La raison de cette divergence ? L'essor de l'IA. Les hyperscalers (Microsoft, Google, Amazon, Meta) signent désormais des contrats à long terme (LTA) avec prépaiements pour sécuriser l'approvisionnement en mémoire avancée (HBM, DDR5), inversant le rapport de force. Des analystes comme UBS estiment que ces LTA pourraient atténuer la cyclicité historique du secteur, justifiant une réévaluation des acteurs comme Micron. Cependant, le marché est à trois vitesses : 1) Mémoire pour IA (HBM, SSD entreprise) : pénurie extrême et hausses de prix massives. 2) Mémoire mobile (smartphones) : hausses de prix contraintes, pénalisant les fabricants comme Xiaomi. 3) Mémoire PC grand public : les prix spot reculent en raison des stocks des distributeurs. Malgré l'euphorie, des questions subsistent. La croissance de Micron repose davantage sur la hausse des prix que sur les volumes. Les LTA, censés lisser le cycle, pourraient être remis en cause si la demande d'IA ralentit. Évaluer Micron sur la base des profits actuels, au sommet du cycle, comporte un risque de "piège de valorisation". L'histoire des matières premières montre que les contrats à long terme sont souvent testés quand les marchés se retournent. Alors que Wall Street crie au "super-cycle", l'article invite à la prudence, rappelant qu'à chaque période d'euphorie collective, la question "et si cette fois était différente ?" mérite d'être posée.

链捕手Il y a 1 h

L'euphorie du billion pour les vendeurs de mémoire, la chute des bénéfices pour les acheteurs

链捕手Il y a 1 h

L'inclusion de l'entreprise DAT dans l'indice Russell ne sauvera pas Ethereum non plus

L'indice Russell 3000 ajoutera en 2026 plusieurs actions liées aux cryptomonnaies, dont BitMine et Galaxy Digital. Ces ajouts forceront les fonds indiciels passifs à les acheter, ce qui pourrait stimuler leurs cours. Cependant, cette dynamique pourrait ne pas profiter directement aux cryptomonnaies sous-jacentes comme l'Ether (ETH). David Hoffman de Bankless a récemment liquidé ses ETH, non par manque de confiance dans le réseau Ethereum, mais en raison de sa conviction que l'ETH est davantage une infrastructure publique qu'une monnaie destinée à prendre de la valeur. Il argue que la réussite du réseau et de ses applications ne se traduit que marginalement dans le prix de l'ETH, la majeure partie de la valeur étant captée par les couches applicatives et les solutions de mise à l'échelle (L2). Ainsi, si les introductions en bourse et les inclusions dans des indices peuvent créer un « effet de levier » pour les actions des sociétés de cryptomonnaies via des mécanismes de financement traditionnels, cet afflux de capitaux n'alimente pas nécessairement la demande pour les actifs cryptographiques eux-mêmes. L'exemple de BitMine, qui a acheté des millions d'ETH sans enrayer la baisse des cours, illustre cette déconnexion. L'inclusion dans le Russell marque une étape d'adoption par la finance traditionnelle, mais elle ne résout pas le défi fondamental de la valorisation des jetons de base des blockchains publiques.

marsbitIl y a 1 h

L'inclusion de l'entreprise DAT dans l'indice Russell ne sauvera pas Ethereum non plus

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片