Preuve flagrante, GPT-5.5 pris en flagrant délit de « perte d'intelligence », les documents officiels d'OpenAI l'admettent

marsbitPublié le 2026-05-27Dernière mise à jour le 2026-05-27

Résumé

**OpenAI accusé d'avoir "abaissé" l'intelligence du GPT-5.5, les documents officiels le confirment** Des utilisateurs de ChatGPT dénoncent une dégradation soudaine des performances du modèle GPT-5.5, en particulier dans son mode "Extended Thinking". Après une ou deux heures d'utilisation, les réponses deviennent instantanées et de moindre qualité, bien que l'interface continue d'afficher le même modèle. Des tests, dont l'interrogation du modèle sur sa date de formation (qui correspond à la version "Instant", non à "Thinking"), suggèrent un remplacement silencieux par un modèle moins puissant. La documentation officielle d'OpenAI confirme ce mécanisme : après 160 messages/3 heures pour les utilisateurs Plus, le système bascule automatiquement et sans avertissement vers un modèle "mini". Les utilisateurs Pro du mode "Heavy" peuvent également être limités en cas de forte charge serveur. Ce phénomène n'est pas nouveau ; des utilisateurs de Codex avaient déjà signalé en février, via des commandes de trace, une rétrogradation silencieuse du GPT-5.3 vers le GPT-5.2. Cette controverse s'inscrit dans une série de plaintes similaires après chaque mise à jour majeure, de GPT-5 à GPT-5.5. OpenAI a reconnu et marqué comme "résolu" un incident de dégradation des performances mi-mai, mais les signalements ont repris de plus belle fin mai. Pour certains observateurs, cette pratique viserait à optimiser les coûts de calcul. Ironiquement, tandis que les utilisateurs de GPT-5.5 luttent pour ...

【Introduction】GPT-5.5 démasqué pour sa « fausse réflexion », remplacé secrètement par mini après deux heures d'utilisation. Un abonnement à 200 dollars par mois pour un « cerveau de Schrödinger ». La commande trace apporte la preuve flagrante, les documents officiels l'admettent eux-mêmes. Les plaintes affluent : OpenAI, à qui tu veux faire croire ça ?

ChatGPT est à nouveau accusé de « perte d'intelligence » !

C'est ces derniers jours que X a explosé le premier.

L'utilisateur Lisan al Gaib a découvert qu'après une ou deux heures d'utilisation, GPT-5.5 devenait soudainement stupide, chaque requête obtenant une réponse immédiate, avec une qualité en chute libre.

Mais l'interface affichait toujours « GPT-5.5 Extended Thinking ».

En d'autres termes, l'étiquette de réflexion était toujours là, mais la réflexion elle-même avait disparu.

200 dollars/mois, pour un « modèle de Schrödinger »

Sur le forum des développeurs d'OpenAI, un post de plainte a fait exploser les discussions.

Agentify.sh a déclaré que GPT-5.5 perdait soudainement sa capacité à suivre les instructions après une certaine utilisation.

On le voyait annoncer avec enthousiasme qu'il avait « réparé » quelque chose, mais la qualité du code était si mauvaise qu'elle provoquait des retours en arrière massifs.

Des tâches d'interface utilisateur que 5.5-med gérait facilement auparavant, maintenant il ne parvient même pas à faire les modifications les plus simples.

Passer à 5.5-high, inutile. Monter encore à xhigh, toujours pas.

Et là où xhigh pouvait tourner pendant plusieurs heures auparavant, la durée est maintenant clairement raccourcie.

Dès la publication du post, la section des commentaires a explosé.

Certains sont directement revenus à la version 5.4.

D'autres utilisaient le niveau le plus élevé, xhigh, mais constataient une « baisse notable par rapport à la semaine dernière, des erreurs fréquentes dans les tâches longues, ne suit pas du tout le flux de travail ».

D'autres rapportaient des situations encore plus absurdes : « même les requêtes simples mettent une éternité, si tu l'interromps pour corriger la direction, il t'ignore complètement et continue son plan erroné précédent ».

Exactement, tout le monde décrivait le même phénomène – le cerveau de GPT avait été discrètement remplacé, sans qu'on sache quand.

La performance actuelle de GPT-5.5 est similaire à celle de 5.3, sans exagérer. Les premiers jours étaient incroyables, maintenant on ne retrouve plus aucune trace du modèle d'origine.

Ce n'est pas une impression, OpenAI l'écrit noir sur blanc

Pour vérifier, Lisan al Gaib a réalisé un test comparatif.

Avec le même compte, l'utilisation d'Extended Thinking côté ChatGPT donnait des résultats médiocres, alors que le passage à Codex avec xhigh rétablissait immédiatement des performances normales.

Ses mots exacts furent que Codex est « littéralement 4 milliards de fois plus intelligent que ce truc ».

Le développeur Andrew Curran a eu une idée ingénieuse – demander directement au modèle « Quelle est la date limite de tes données d'entraînement ? »

Le modèle a répondu : août 2025.

Problème : la date limite de GPT-5.5 Thinking est décembre. Août, c'est la date limite de la version Instant !

Autrement dit, il avait sélectionné Thinking, mais le système exécutait en réalité Instant.

L'étiquette du modèle sur l'interface n'avait pas changé d'un seul mot, mais le modèle en arrière-plan avait été discrètement remplacé...

Le plus drôle, c'est que cette fois, OpenAI a lui-même fourni la preuve dans sa documentation d'aide.

Selon les explications officielles de l'OpenAI Help Center, les utilisateurs Plus peuvent envoyer un maximum de 160 messages GPT-5.5 toutes les 3 heures.

Une fois ce quota épuisé, le système bascule silencieusement vers le modèle mini, jusqu'au réinitialisation du quota.

Notez le mot « silencieusement ».

Aucune alerte contextuelle, aucun changement d'étiquette de modèle, aucun retour visuel.

Vous pensez toujours utiliser le modèle phare, alors que de l'autre côté, on vous a discrètement passé au mini.

Les utilisateurs Pro ne doivent pas non plus trop se réjouir.

Le mode de réflexion Heavy, le niveau de raisonnement le plus élevé réservé aux Pro, est également soumis à une limitation de capacité lorsque la charge du serveur est élevée. Là aussi, sans avertissement.

En d'autres termes, un abonnement Pro à 200 dollars/mois achète un service qui peut à tout moment être victime d'un « échange de têtes ».

Cette opération de « l'étiquette reste, le cerveau change » avait été repérée encore plus tôt côté Codex.

En février de cette année, un problème (issue) est apparu sur GitHub : un utilisateur Pro utilisant la commande trace a découvert qu'il demandait GPT-5.3 Codex, mais que le modèle réellement renvoyé était GPT-5.2.

Pas même 5.2 Codex, mais la version de base inférieure, 5.2.

Il a partagé la commande de reproduction :

  • RUST_LOG='codex_api::sse::responses=trace' codex exec --skip-git-repo-check -s read-only -m 'gpt-5.3-codex' 'hi' 2>&1 >/dev/null | rg -o --replace '$1' '"model":"([^"]+)"' | head -n1
  • Sortie : gpt-5.2-2025-12-11
  • Attendu : gpt-5.3-codex

Plusieurs utilisateurs Pro ont confirmé la même dégradation sous le même issue.

Et cette dégradation est « collante », elle ne se rétablit pas d'elle-même, et il n'y a aucune explication.

Mieux encore, le jour même du lancement de GPT-5.5 en avril, des utilisateurs ont signalé que la vitesse du mode Fast était similaire à celle du Standard, mais que la facturation se faisait toujours au tarif Fast.

Une tâche simple a pris 7 minutes 49 secondes, alors que normalement cela devrait prendre 5 à 6 minutes.

OpenAI a reconnu, et puis... plus rien

Le 15 mai, une entrée est apparue sur la page de statut d'OpenAI.

Dégradation des performances GPT5.5 : Nous enquêtons sur les problèmes de dégradation des performances de GPT-5.5 signalés par certains utilisateurs.

Le 17 mai, le statut a été mis à jour à « Résolu ».

Mais d'après la chronologie des posts sur le forum, les plaintes de perte d'intelligence des 24-26 mai étaient encore plus fortes que celles de la vague du 15 mai.

Soit le problème « résolu » est revenu, soit il n'a jamais été vraiment résolu.

Chaque mise à niveau est une « controverse de perte d'intelligence »

Bien que toutes les entreprises fassent face à des critiques de « modèle qui devient stupide », OpenAI, de GPT-5 à GPT-5.5, n'a manqué aucune de ces controverses lors de chaque mise à jour.

À chaque fois OpenAI dit enquêter, à chaque fois il dit que c'est résolu, et puis la version suivante recommence.

Août 2025, lancement de GPT-5. Le titre du post populaire sur Reddit était directement « GPT-5 est trop nul ». Les utilisateurs se plaignaient de réponses courtes, de plus de refus, de moins de personnalité.

OpenAI a été contraint de restaurer d'urgence l'option GPT-4o. Altman a lui-même reconnu lors d'un AMA Reddit que c'était « plus cahoteux que prévu ».

Décembre 2025, GPT-5.2. Qualité de traduction en régression, invention d'API inexistantes, refus d'exécuter des instructions de style que 5.1 accomplissait facilement.

Février 2026, GPT-5.3-Codex. Les utilisateurs Pro ont été dégradés silencieusement vers la 5.2, preuve flagrante par la commande trace.

Mars 2026, GPT-5.4. Un post « GPT-5.4 a clairement régressé dans Codex » est apparu sur le forum communautaire d'OpenAI, toutes les réponses des internautes le confirmant.

Début mai 2026, GPT-5.5 Instant lancé. Longueur des réponses réduite de 30%, les emojis ont presque disparu. Résumé des internautes : la précision a augmenté, mais la chaleur (température) a disparu.

Fin mai 2026, c'est-à-dire maintenant. Les plaintes de perte d'intelligence du mode Thinking éclatent à nouveau.

Lisan al Gaib révèle que depuis qu'il a mené la bataille pour les quotas ChatGPT Plus lors du lancement de GPT-5, il « reçoit chaque semaine des messages privés comme celui-ci ».

Le dernier en date est une demande d'aide pour récupérer le xhigh/heavy thinking.

Le jour où il est le plus fort aux benchmarks, c'est le jour du lancement

chatgptdisaster.com a compilé 1087 plaintes vérifiées d'utilisateurs, dont un scénario mentionné de façon répétée appelé « défaillance de la couche de routage » : l'interface affiche GPT-5.5 Pro, mais la sortie est d'un tout autre niveau.

Les utilisateurs décrivent un modèle reproductible : après une longue session, le modèle commence à « ignorer complètement ce que vous dites », mais le sélecteur de modèle affiche toujours l'étiquette haut de gamme.

L'annotation la plus absurde est que le mécanisme de basculement automatique vers mini après épuisement des 160 messages/3 heures pour les utilisateurs Plus est décrit comme une « fonctionnalité » dans la documentation officielle d'OpenAI.

Pourquoi en est-il ainsi ? Lisan al Gaib analyse que la réponse tient en deux mots : économiser de l'argent.

Le resserrement entre puissance de calcul et rentabilité affecte tout le monde. On économise partout, on ne laisse passer aucune opportunité de réduire les coûts.

Pourtant, la même semaine où les utilisateurs de GPT-5.5 se plaignent collectivement, la silhouette de GPT-5.6 est déjà apparue dans les logs d'arrière-plan de Codex.

Nom de code interne iris-alpha, contexte de 150 millions de tokens, la probabilité de sortie en juin donnée par Polymarket dépasse les 85%.

D'un côté, les utilisateurs de 5.5 ne parviennent même pas à conserver une expérience de base, de l'autre, 5.6 exécute déjà discrètement du trafic réel en arrière-plan.

Telle est la course à l'ASI en 2026.

La vitesse de création de nouveaux modèles s'accélère, mais faire fonctionner correctement un ancien modèle pendant toute une session devient de plus en plus difficile.

Le jour où il est le plus fort aux benchmarks est toujours le jour du lancement, et chaque jour suivant est un GPT de Schrödinger.

Référence : https://x.com/scaling01/status/2058643470357590058?s=20

Cet article provient du compte public WeChat « New Zhiyuan », auteur : ASI Apocalypse ; éditeur : Moïse

Questions liées

QQuel est le principal problème signalé concernant GPT-5.5 dans cet article ?

AL'article signale que GPT-5.5 subit une 'détérioration de l'intelligence' ou un 'dumbing down' après une utilisation d'une à deux heures. L'interface utilisateur continue d'afficher l'étiquette 'GPT-5.5 Extended Thinking', mais le modèle derrière serait silencieusement remplacé par une version inférieure (comme GPT-5.5 Instant ou même GPT-5.2), entraînant des réponses de moindre qualité et des temps de réponse plus rapides.

QComment les utilisateurs ont-ils vérifié que le modèle avait été remplacé sans notification ?

ALes utilisateurs ont utilisé plusieurs méthodes pour vérifier : 1) En demandant au modèle sa date de coupure de données d'entraînement, qui correspondait à une version différente (Instant vs Thinking). 2) En utilisant la commande 'trace' dans Codex, qui a révélé que les requêtes pour GPT-5.3 Codex recevaient en réalité des réponses de GPT-5.2. 3) En comparant les performances entre l'interface ChatGPT et Codex pour le même compte.

QQue dit la documentation officielle d'OpenAI concernant le changement de modèle pour les utilisateurs Plus ?

ALa documentation officielle du centre d'aide d'OpenAI confirme que les utilisateurs ChatGPT Plus ont une limite de 160 messages GPT-5.5 par période de 3 heures. Une fois cette limite atteinte, le système bascule *silencieusement* vers le modèle 'mini' jusqu'au prochain reset. Aucune notification ou changement d'étiquette dans l'interface n'avertit l'utilisateur de ce changement.

QQuelle est la raison possible avancée par l'article pour expliquer ces pratiques d'OpenAI ?

AL'article suggère que la raison principale est économique : réduire les coûts en calcul (compute). La pression sur la rentabilité pousserait OpenAI à optimiser les dépenses en calcul en remplaçant discrètement les modèles plus coûteux (comme GPT-5.5 Thinking) par des versions moins chères (comme mini ou Instant) après un certain temps d'utilisation ou sous une charge serveur élevée.

QSelon l'article, comment la communauté a-t-elle réagi aux problèmes de performance à chaque mise à jour majeure de GPT ?

ALa communauté a systématiquement signalé des problèmes de 'détérioration de l'intelligence' à chaque mise à jour majeure, de GPT-5 à GPT-5.5. Les plaintes concernent des réponses plus courtes, un refus accru d'exécuter des tâches, une perte de personnalité, une dégradation de la qualité des traductions ou du code. OpenAI a généralement répondu en ouvrant des enquêtes et en marquant les problèmes comme 'résolus', mais les plaintes réapparaissent souvent avec les versions suivantes.

Lectures associées

Matinée | Michael Saylor diffuse les informations du Bitcoin Tracker ; Aave publie l'enquête post-incident de l'attaque du pont Kelp rsETH ; Gravity Bridge suspend son service après avoir été attaqué

**Résumé en français :** Ces dernières 24 heures dans l'écosystème crypto ont été marquées par des développements réglementaires, des incidents de sécurité et des analyses de marché. **Réglementation et Adoption Institutionnelle :** * La société numérique **Laser Digital** a obtenu une approbation préliminaire pour créer une banque fiduciaire régulée au niveau fédéral aux États-Unis. * Le **Vietnam** envisage de permettre aux PME d'utiliser des actifs numériques comme garantie pour les prêts bancaires. * Le président de la SFC de **Hong Kong** a annoncé une forte croissance du volume des transactions sur les plateformes d'actifs virtuels agréées. **Sécurité et Incidents :** * Le pont inter-chaînes **Gravity Bridge** (Cosmos) a été attaqué et a suspendu ses services. * **Aave** a publié l'enquête post-incident sur l'attaque du pont Kelp rsETH, soulignant que la vulnérabilité provenait de l'infrastructure tierce du pont (LayerZero) et non du protocole Aave lui-même. Les mesures de protection ont été activées et les fonctions affectées sont largement restaurées. * Aux **États-Unis**, la SEC a intenté un procès contre l'auteur présumé d'une escroquerie crypto de 12,3 millions de dollars promettant des rendements élevés via un faux robot de trading IA. **Actualités du Marché et Analyses :** * **Michael Saylor** a de nouveau publié des informations sur le Bitcoin Tracker, laissant présager une nouvelle annonce d'acquisition par MicroStrategy la semaine prochaine. * Un gouverneur de la **Fed** a commenté que l'adoption massive des stablecoins pourrait amplifier la portée de la politique monétaire américaine. * Santiment note un ratio long/court record sur Bitcoin, pouvant signaler un correctif à court terme, et un sentiment "FUD" sur Ethereum qui pourrait être un signal haussier contraire. * En **Chine**, un homme a été condamné à 10 ans de prison pour le vol de 107 BTC via l'appropriation de la phrase de récupération d'un portefeuille. **Tendances Meme :** Les jetons les plus populaires sur les réseaux ETH, Solana et Base au cours des dernières 24 heures sont également listés, avec HEX, SHIB, TROLL et toby en tête de leurs catégories respectives.

链捕手Il y a 36 mins

Matinée | Michael Saylor diffuse les informations du Bitcoin Tracker ; Aave publie l'enquête post-incident de l'attaque du pont Kelp rsETH ; Gravity Bridge suspend son service après avoir été attaqué

链捕手Il y a 36 mins

Alibaba « met en rayon », ByteDance « s’entraîne »

Durant la dernière semaine de mai, deux événements consécutifs dans l'industrie de l'IA ont révélé les stratégies divergentes des géants chinois Alibaba et ByteDance. Alibaba adopte une approche d'application immédiate et de monétisation. Son modèle Qwen est intégré à Taobao pour des fonctionnalités comme l'essayage virtuel et la comparaison de prix, visant à transformer l'expérience d'achat. L'entreprise se positionne comme l'infrastructure ("eau, électricité, gaz") et la "caisse enregistreuse" de l'ère IA, avec ses services cloud alimentant de nombreux modèles locaux. Cette stratégie, soutenue par des réorganisations internes et l'initiative "AI Credit", génère déjà des revenus, comme en témoigne la croissance de 40% des revenus cloud externes. Cependant, elle suppose que les capacités des modèles de base n'évolueront pas assez vite pour rendre ses applications obsolètes. ByteDance, via son département Seed, privilégie la recherche fondamentale à long terme. Son objectif est "d'explorer les limites de l'intelligence". Son modèle de génération vidéo Seedance 2.0, salué comme le plus performant au monde, et des publications académiques ambitieuses sur les "modèles du monde" illustrent cette voie. La société, qui n'est pas cotée en bourse, peut se permettre d'engager des dépenses d'investissement massives (jusqu'à 470 milliards de yuans en 2026 selon des rapports) et d'accorder à ses chercheurs le temps de publier sans pression commerciale immédiate. Mais cette approche "laboratoire Nobel" commence à être questionnée par des signes de commercialisation sur des produits comme Doubao. L'article suggère que cette divergence stratégique tient moins à une philosophie qu'à un statut : Alibaba, société cotée, est soumis à la pression des marchés pour montrer des retours rapides, tandis que ByteDance, privée, peut investir sur le très long terme. Le jour où ByteDance envisagera une introduction en bourse, la pérennité de sa stratégie de recherche pure sera véritablement mise à l'épreuve.

marsbitIl y a 2 h

Alibaba « met en rayon », ByteDance « s’entraîne »

marsbitIl y a 2 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

Trois ans après ses prédictions sur ChatGPT en mars 2023, Wang Jianshuo revient sur ses vingt affirmations initiales, évaluées en mai 2026 par des agents IA. Sur les vingt points, la majorité des tendances de fond étaient correctes : l'essor du RAG comme architecture dominante pour l'injection de connaissances, le rôle central de l'interface utilisateur en langage naturel (LUI), l'émergence de protocoles pour un "réseau d'agents", et le rattrapage technologique rapide des modèles chinois. Des erreurs notables portent sur des chiffres précis, comme les 100 billions de paramètres supposés de GPT-4 (en réalité environ 1,8 billion) ou une estimation trop basse des coûts de formation des grands modèles. Certaines prévisions se sont révélées trop absolues ("l'IA ne fera jamais de mathématiques pures") ou ont négligé les disparités (aucune vague de chômage massif, mais un impact sévère sur les jeunes diplômés). L'analyse révèle que les intuitions sur les mécanismes et les directions se sont avérées bien plus fiables que les prédictions numériques ou temporelles, souvent trop optimistes à court terme. La prudence dans les formulations et la reconnaissance des incertitudes se sont montrées précieuses avec le recul. Ce bilan offre des leçons pour les futurs pronostics : privilégier les tendances aux chiffres, anticiper les effets distributifs et accepter que certaines questions demandent plus de trois ans pour être tranchées.

marsbitIl y a 10 h

Trois ans plus tard : Retour sur mon jugement de 2023 concernant ChatGPT

marsbitIl y a 10 h

Trading

Spot
Futures
活动图片