Claude réduit délibérément son intelligence, les modèles commencent-ils aussi à « adapter leur comportement selon la personne » ?

marsbitPublié le 2026-04-14Dernière mise à jour le 2026-04-14

Résumé

Selon une analyse de l'équipe d'AMD AI dirigée par Stella Laurenzo, le modèle Claude d'Anthropic a subi une dégradation significative de ses performances depuis mi-février. Les données montrent une chute de 67 à 73% de la longueur médiane des processus de réflexion du modèle, ainsi qu'une réduction drastique du nombre de lectures des fichiers avant modification. Les développeurs se sont plaints d'un modèle "plus lent, plus paresseux", avec des réponses superficielles et parfois des actions non sollicitées. Anthropic a officiellement reconnu avoir ajusté les paramètres de "réflexion adaptive", présenté comme une optimisation délibérée pour ajuster l'effort cognitif en fonction de la complexité des tâches. Cette modification, non communiquée aux utilisateurs payants, a déclenché des critiques sur le manque de transparence. L'analyse économique révèle un écart important entre le coût réel de l'inférence (42 121 $ pour AMD) et les abonnements mensuels (400 $), suggérant une pression commerciale pour réduire les coûts. Anthropic testerait désormais un mode "high effort" par défaut pour les clients entreprises, creusant l'écart entre utilisateurs professionnels et grand public. Cet épisode reflète une tendance plus large dans l'IA : la fin de la période de subvention et l'émergence d'un modèle commercial stratifié, où les capacités maximales sont réservées aux clients payants premium, tandis que les utilisateurs grand public reçoivent des versions optimisées pour les coûts.

Par | Usine des Modèles du Monde

Claude est-il devenu moins intelligent ?

Récemment, Stella Laurenzo, Directrice Senior du groupe AI chez AMD, a critiqué Anthropic.

Elle a utilisé les journaux de production réels de son équipe pour effectuer une analyse rétrospective de 17 871 blocs de réflexion dans 6 852 fichiers de session, totalisant 234 760 appels d'outils.

Les données montrent que Claude a commencé à présenter une dégradation significative de son comportement à partir de la mi-février.

La médiane de la réflexion de Claude est passée de 2200 caractères à seulement 600 caractères, une baisse de 67% à 73% ;

Le nombre de lectures des fichiers avant édition est passé de 6,6 fois à seulement 2 fois, et un tiers des modifications étaient même effectuées sans lire le fichier du tout.

Stella a souligné dans son analyse qu'en raison de la baisse des capacités de raisonnement, le modèle a progressivement cessé de lire complètement le code avant de le modifier.

Elle a écrit : "Lorsque la réflexion est superficielle, le modèle adopte par défaut l'opération la moins coûteuse".

Ce n'est pas un cas isolé, dès le mois de mars, le mécontentement des développeurs avait commencé à exploser.

Sur X, un utilisateur a écrit : "Je pensais être devenu fou ces dernières semaines avec Claude. Il semble plus lent, plus paresseux, comme s'il ne réfléchissait pas avant de répondre, et le résultat est que je n'ai pas d'hallucinations".

Sur Reddit, un utilisateur s'est plaint : "Claude semble moins conscient, comme s'il avait subi une lobotomie. En plus d'être devenu plus bête, il commence aussi à effectuer des opérations extrêmes sans demander...".

D'autres ont exprimé que c'était une trahison flagrante d'Anthropic envers ses utilisateurs : "Ils ont simplement rendu le problème invisible pour nous tous les utilisateurs, comme s'ils pensaient 'si vous ne pouvez pas le mesurer, nous ne vous le montrerons pas'... C'est le résultat des laboratoires d'IA qui optimisent les profits plutôt que la qualité de la production".

Des plaintes des utilisateurs aux preuves données par les données, le comportement de réduction d'intelligence de Claude est pratiquement confirmé.

Et la réponse officielle d'Anthropic a également reconnu que la profondeur de réflexion et l'effort (effort) étaient continuellement ajustés.

Si cela est délibéré de la part d'Anthropic, cela signifie-t-il qu'à l'avenir, les capacités du modèle pourraient "rétrécir" à notre insu ?

Ou bien, les capacités du modèle le plus puissant ne seront plus offertes équitablement à tous ?

La réduction d'intelligence de Claude est "délibérée"

Claude Opus 4.6 et son mode dédié au codage Claude Code, lors de leur lancement en janvier 2026, étaient considérés par les développeurs comme le summum du codage.

Sa profondeur de réflexion était impressionnante, sa priorité (research-first - recherche d'abord), le traitement des contextes longs était stable, et la refactorisation multi-fichiers était presque imbattable.

L'équipe interne d'AMD l'a même utilisé pour fusionner et mettre en ligne 190 000 lignes de code legacy en un week-end, boostant directement la productivité.

Cependant, le tournant s'est produit début février.

Anthropic a discrètement lancé la fonctionnalité "adaptive thinking" (pensée adaptative), décrite officiellement comme "permettant au modèle d'ajuster intelligemment la profondeur de sa réflexion en fonction de la complexité de la tâche".

En apparence, c'est convivial pour l'utilisateur, mais en réalité, cela a activé un interrupteur global de rationnement.

Début mars, la valeur d'effort (effort) par défaut du modèle a été discrètement abaissée à "medium", tandis que le résumé du processus de réflexion était rapidement masqué, empêchant les utilisateurs de voir d'un coup d'œil à quel point le modèle avait réfléchi.

À la même période, Anthropic a publié 14 petites mises à jour successives, mais a subi 5 pannes à grande échelle, montrant que la pression sur la puissance de calcul et la charge atteignait ses limites.

Les retours des développeurs ont commencé à exploser, certains remarquant que les performances étaient particulièrement mauvaises aux heures de pointe (après-midi heure de l'Est), soupçonnant un rationnement dynamique dû à la charge.

Ce n'est qu'en avril que la directrice AI d'AMD est entrée personnellement en scène, confirmant la situation avec des données et déclenchant complètement la controverse.

À ce stade, Boris Cherny, responsable de Claude Code chez Anthropic, a dû publier une réponse officielle.

Il a déclaré que "l'adaptive thinking" affectait l'affichage de la pensée (thinking), et non le raisonnement sous-jacent, et a insisté sur le fait qu'il s'agissait d'une "optimisation délibérée" et non d'un bug. Il a suggéré aux utilisateurs de régler manuellement l'effort sur "high" pour améliorer les résultats.

Le sous-entendu d'Anthropic est clair : la réduction d'intelligence n'est pas un bug, c'est une optimisation produit que nous avons spécifiquement mise en place, il vous suffit de ajuster les paramètres vous-mêmes.

Cette réponse a instantanément attisé une colère encore plus grande.

Le point clé est que, de la mi-février à début avril, Anthropic n'a jamais annoncé à l'avance aucun changement majeur.

Un grand nombre d'utilisateurs payants, sans en avoir la moindre idée, ont payé un abonnement inchangé tandis que le modèle était discrètement rationné.

Ainsi, la réduction d'intelligence de Claude n'est pas due à un modèle "déréglé", mais à une action plus discrète et plus commerciale de la part d'Anthropic :

En réduisant la profondeur de réflexion par défaut, ils échangent contre une vitesse plus rapide, une charge réduite et des coûts GPU inférieurs.

Stratification des capacités des modèles

Derrière cette tempête de réduction d'intelligence se cache un phénomène alarmant :

Les capacités des modèles commencent déjà à être stratifiées.

Le calculs de Stella sont clairs : selon la tarification à la demande (on-demand) d'AWS Bedrock, le coût réel d'inférence de son équipe en mars était d'environ 42 121 dollars, alors que les frais d'abonnement mensuels réels à Claude Code payés le même mois n'étaient que de 400 dollars.

Cet écart montre au moins que, dans des scénarios d'utilisation extrêmement intensive, il existe un énorme fossé entre la tarification par abonnement et la consommation réelle de puissance de calcul.

Il est fort probable qu'Anthropic ait acquis des parts de marché en brûlant du capital, mais ces subventions ont des limites.

Lorsque la consommation d'inférence des utilisateurs intensifs atteint un certain seuil, la durabilité du modèle commercial commence à vaciller.

Boris Cherny, dans sa réponse, a révélé un signal clé : Anthropic teste l'activation par défaut du mode "high effort" pour les utilisateurs Teams et Enterprise.

En d'autres termes, un raisonnement plus puissant est en train d'être configuré comme une ressource plus coûteuse et stratifiée, ce n'est plus une capacité obtenue par défaut de manière égale pour tous.

Cela signifie que le modèle commercial des grands modèles va se diviser davantage.

Aujourd'hui, 80 % des revenus d'Anthropic proviennent des services aux entreprises et des appels d'API, les clients B2B à forte fidélité sont le véritable pilier.

Les actions actuelles d'Anthropic visent toutes à ramener l'utilisation par les entreprises vers sa propre plateforme de première partie.

Pour les clients B2B à haute valeur, Anthropic va probablement accélérer le lancement de versions entreprise plus puissantes, offrant les capacités complètes du modèle aux clients entreprises qui en paient le coût réel.

Quant aux utilisateurs grand public (C端) payant un abonnement mensuel, ils devront se contenter de la version à intelligence réduite "suffisante", satisfaisant des besoins allégés comme le chat, la rédaction de textes, la complétion de code, mais ne touchant jamais au seuil de coût critique.

Quant à la zone intermédiaire, ces développeurs indépendants et petites équipes qui ont besoin de raisonnements complexes mais ne peuvent pas supporter les tarifs entreprises, deviendront le groupe le plus squeezé.

Un utilisateur sur X a confirmé dans un post :

"Les performances de l'API entreprise de Claude sont bien meilleures que l'abonnement Pro/Max. En testant avec le même framework de test, le comportement de la version entreprise et de Pro/Max est simplement différent. Mais cela signifie aussi devoir dépenser maintenant 4 à 12k dollars par mois, selon le nombre de threads que je exécute simultanément".

En d'autres termes, le futur chemin de commercialisation des grands modèles sera probablement priorité B2B, réduction des coûts C端.

Qui paiera pour la réduction d'intelligence ?

L'événement de réduction d'intelligence de Claude n'est pas un cas isolé, mais le reflet de l'ensemble du secteur de l'IA entrant dans la seconde mi-temps de la commercialisation.

Que ce soit OpenAI avec ses réductions silencieuses et multiples de la série GPT, ou Google avec sa limitation de débit discrète pour Gemini, tous répètent le même scénario :

D'abord attirer les utilisateurs avec des hautes performances, puis contrôler les coûts via un rationnement logiciel.

Le résultat inévitable est que le secteur B2B peut acheter des modèles plus puissants à un prix élevé, avec des garanties SLA en plus, tandis que le grand public (C端) reçoit des modèles distillés, à faible effort.

La vitesse à laquelle les modèles grand public (C端) deviennent plus intelligents a déjà nettement pris du retard sur le secteur B2B.

Plus grave encore, cette différenciation est implicite.

Anthropic et autres fabricants réduisent le budget d'inférence d'une manière difficile à détecter, sans que l'utilisateur moyen ne reçoive aucune notification.

Ce choix peut peut-être soulager la pression des coûts de calcul à court terme, mais le prix à long terme est la perte de confiance dans la marque.

Lorsque "Claude réduit discrètement son intelligence" deviendra une conviction commune parmi les utilisateurs, Anthropic perdra non seulement quelques utilisateurs intensifs, mais aussi la confiance de tout l'écosystème dans le récit de l'IA universelle et transparente.

Plus宏观地看 (De manière plus宏观 - macro), l'événement Claude est le reflet du passage de l'industrie de l'IA d'une croissance sauvage à une culture intensive.

La période de subvention est terminée, les coûts réels commencent à apparaître, qui va assumer ces coûts ?

Est-ce en compressant l'expérience grand public (C端) et en augmentant les tarifs entreprises, ou en attendant une révolution logicielle/matérielle apportant une percée en efficacité, tout cela déterminera le paysage des applications d'IA pour les cinq prochaines années.

La tendance future est déjà visible, l'IA n'est plus le mythe universel de plus en plus intelligent, mais évolue vers une stratification élitiste.

Questions liées

QQuelles sont les principales preuves avancées dans l'article concernant la baisse d'intelligence de Claude ?

AL'analyse des logs de production d'AMD AI a révélé que la médiane de réflexion de Claude est passée de 2200 caractères à 600 caractères (baisse de 67-73%), et le nombre de lectures de fichiers avant modification est tombé de 6,6 à 2, avec un tiers des modifications effectuées sans lire le fichier.

QQuelle fonctionnalité Anthropic a-t-il introduite qui a marqué un tournant dans les performances de Claude ?

AAnthropic a introduit la fonctionnalité "adaptive thinking" (pensée adaptative) début février, décrite officiellement comme permettant au modèle d'ajuster intelligemment la profondeur de sa réflexion en fonction de la complexité de la tâche.

QComment Anthropic a-t-il justifié les changements de comportement de Claude ?

ALe responsable de Claude Code chez Anthropic, Boris Cherny, a déclaré que la "pensée adaptative" affectait l'affichage de la réflexion et non le raisonnement sous-jacent, et a insisté sur le fait qu'il s'agissait d'une "optimisation intentionnelle" et non d'un bug.

QSelon l'article, comment le modèle d'affaires d'Anthropic évolue-t-il face aux coûts de calcul ?

ALe modèle commercial évolue vers une stratification des capacités. Les entreprises (B2B) paieront un prix plus élevé pour des versions plus puissantes et des garanties de service, tandis que les utilisateurs grand public (B2C) recevront une version "réduite" aux capacités limitées pour contrôler les coûts.

QQuelle est la conséquence plus large de cet événement "Claude降智" pour l'industrie de l'IA selon l'article ?

ACet événement est le symbole du passage de l'industrie de l'IA d'une croissance sauvage à une culture intensive. La période de subvention est terminée, les coûts réels apparaissent, et l'IA n'est plus un mythe universel de plus en plus intelligent, mais évolue vers une stratification élitiste.

Lectures associées

94 billions, le plus grand financement de l'année pour les robots humanoïdes est apparu

Dans le secteur des robots humanoïdes, un tournant majeur est marqué par le financement record de 14 milliards de dollars (environ 94,9 milliards de yuans) levé par l'entreprise allemande Neura. Cette levée de fonds de série C, menée par des investisseurs industriels de renom comme Schaeffler et Bosch, ainsi que des géants technologiques (NVIDIA, Amazon), porte l'évaluation de Neura à environ 70 milliards de dollars. Cet investissement massif signale un changement profond : la filière passe d'une phase de démonstration technologique à une phase d'industrialisation et de déploiement concret en usine. Contrairement aux sociétés axées sur un robot humanoïde "universel" (comme Figure AI), Neura adopte une approche pragmatique, ciblant d'abord des applications industrielles verticales et spécifiques, comme en témoigne son partenariat avec BMW. La conjonction de plusieurs facteurs explique cet afflux de capitaux : les progrès de l'IA (modèles de grande taille) qui améliorent les capacités de perception et de décision des robots, et les pressions structurelles sur le marché du travail (vieillissement, pénurie de main-d'œuvre, coûts salariaux) qui créent une demande croissante dans la fabrication. Les principaux défis pour une adoption massive ne sont plus uniquement techniques. Ils concernent désormais les coûts d'adaptation aux lignes de production existantes, la formation des opérateurs et la mise en place d'un réseau de maintenance fiable. L'entrée en scène de capitaux industriels expérimentés démontre une confiance accrue dans la capacité du secteur à résoudre ces problèmes d'ingénierie et de modèle commercial, achevant ainsi la transition cruciale du laboratoire au sol de l'usine.

marsbitIl y a 3 h

94 billions, le plus grand financement de l'année pour les robots humanoïdes est apparu

marsbitIl y a 3 h

Le marché de la pré-introduction en bourse d'Anthropic chute après qu'une directive américaine force l'arrêt du modèle

Anthropic a annoncé avoir reçu une directive du gouvernement américain lui ordonnant de suspendre l'accès aux modèles Claude Fable 5 et Claude Mythos 5 pour les ressortissants étrangers, y compris ses propres employés étrangers. Cette mesure d'urgence, justifiée par des préoccupations de sécurité nationale liées au contrôle des exportations, a forcé la désactivation mondiale des deux modèles le 12 juin. Les autres modèles d'Anthropic, comme Claude Opus 4.8, restent opérationnels. La réaction du marché a été immédiate : le contrat perpétuel lié à Anthropic sur Hyperliquid a chuté de 3,7%, reflétant l'impact sur sa valorisation pré-IPO. Anthropic a contesté la base de cette directive, arguant que la vulnérabilité de "jailbreak" évoquée par le gouvernement était mineure, déjà connue et non exclusive à ses modèles. La société a averti qu'un tel seuil d'intervention, s'il était généralisé, pourrait stopper les déploiements de nouveaux modèles d'IA de pointe. Cet événement illustre comment la régulation de l'IA devient un facteur négociable sur les marchés financiers. Les instruments tokenisés et les contrats pré-IPO permettent désormais aux traders de réagir instantanément à ce type de nouvelles réglementaires, même en l'absence d'informations publiques détaillées. Cela intègre l'infrastructure d'IA dans une dynamique de marché spéculative similaire à celle de la cryptomonnaie, avec des risques de volatilité basée sur des informations incomplètes.

bitcoinistIl y a 9 h

Le marché de la pré-introduction en bourse d'Anthropic chute après qu'une directive américaine force l'arrêt du modèle

bitcoinistIl y a 9 h

Un portefeuille lié à une exploitation convertit des jetons volés en 18 510 ETH et 1 548 BNB

Un portefeuille lié à une exploitation a converti des actifs compromis en 18 510 ETH (évalués à environ 30,83 millions de dollars) et 1 548 BNB (environ 924 000 dollars), selon une alerte de suivi sur la chaîne partagée par WuBlockchain citant Lookonchain. L'attaquant, associé à des « jetons H » compromis, détient encore 111,36 millions de ces jetons d'une valeur d'environ 14 millions de dollars. Cette conversion vers des actifs plus liquides comme l'ETH et le BNB est une étape courante après une exploitation, souvent avant une tentative de retrait ou de mélange de fonds. Les grands échanges de ce type peuvent exercer une pression sur les liquidités, signaler les prochaines étapes de l'attaquant et offrir de nouvelles pistes de transaction à suivre pour les enquêteurs. Le suivi sur la chaîne, bien qu'utile pour visualiser les mouvements de fonds en temps réel, présente des limites : les portefeuilles peuvent fractionner les actifs rapidement, les déplacer entre différentes chaînes ou utiliser des adresses intermédiaires, compliquant le traçage. Les étiquettes attribuées aux portefeuilles peuvent également changer. Ces données représentent donc un instantané et non une estimation finale des pertes. Cet incident souligne l'utilité des comptes de surveillance sur la chaîne comme Lookonchain, qui peuvent révéler une activité avant la publication d'une enquête officielle. La conversion en actifs liquides rend également plus difficile et urgente toute tentative de récupération des fonds volés.

bitcoinistIl y a 12 h

Un portefeuille lié à une exploitation convertit des jetons volés en 18 510 ETH et 1 548 BNB

bitcoinistIl y a 12 h

« De 119 à 176 dollars » : Derrière l'entrée en bourse de SpaceX, MSX démontre à nouveau le circuit complet de son offre Pre-IPO

Après avoir livré un retour sur investissement de 300% pour Cerebras en mai, MSX a une nouvelle fois démontré l'efficacité de son modèle Pre-IPO avec l'introduction en bourse de SpaceX. Le 12 juin, SpaceX (SPCX) a fait son entrée sur le Nasdaq, atteignant un sommet de 176 dollars. Les utilisateurs de MSX ayant participé au projet Pre-IPO de SpaceX en mars à un prix de souscription de 119 dollars ont ainsi réalisé un gain allant jusqu'à 48%. Ce succès valide le parcours complet proposé par MSX : souscription, conservation, possibilité de rachat avant IPO, introduction en bourse, conversion en actif négociable et règlement. Cela distingue la plateforme d'autres acteurs du secteur, où certains utilisateurs ont dû être remboursés suite à des problèmes d'allocation. Ce résultat fait suite à la réussite similaire de Cerebras en mai, où les souscripteurs MSX avaient enregistré des rendements dépassant 300%. Deux introductions consécutives prouvent que MSX a établi un mécanisme fiable et reproductible pour l'accès à des actifs privés de qualité via la blockchain. Le véritable enjeu des produits Pre-IPO n'est pas seulement d'offrir un accès précoce, mais de garantir une voie de sortie claire après l'IPO. MSX continue d'élargir son portefeuille d'actifs Pre-IPO, ciblant notamment les secteurs de l'IA et des technologies de pointe, afin de permettre aux investisseurs de participer à la croissance des entreprises les plus prometteuses.

Odaily星球日报Il y a 16 h

« De 119 à 176 dollars » : Derrière l'entrée en bourse de SpaceX, MSX démontre à nouveau le circuit complet de son offre Pre-IPO

Odaily星球日报Il y a 16 h

Trading

Spot
Futures
活动图片