Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

Attention : un déblocage massif de tokens est prévu pour cette semaine sur 10 altcoins ! Voici le calendrier jour par jour et heure par heure

La semaine dernière, le marché des cryptomonnaies a subi une baisse en raison d'un incident de piratage récent et de l'influence d'événements géopolitiques. Cependant, cette semaine sera marquée par des déblocages importants de jetons pour plusieurs altcoins. Voici le calendrier des déblocages (heures UTC+3) : * **Lagrange (LGR)** : 4 août, 03h00. Valeur débloquée : 1,38 million USD (15,04% de la capitalisation). * **Briefly (PROOF)** : 5 août, 03h00. Valeur débloquée : 39,11 millions USD (119,59% de la capitalisation). * **Power Protocol (POWER)** : 5 août, 03h00. Valeur débloquée : 1,62 million USD (8,93% de la capitalisation). * **Verona (VERONA)** : 5 août, 03h00. Valeur débloquée : 1,37 million USD (12,61% de la capitalisation). * **Ethena (ENA)** : 5 août, 11h00. Valeur débloquée : 15,28 millions USD (1,80% de la capitalisation). * **Goldfinger (GF)** : 6 août, 03h00. Valeur débloquée : 11,52 millions USD (5,05% de la capitalisation). * **Infinity (INF)** : 7 août, 03h00. Valeur débloquée : 2,31 millions USD (20,30% de la capitalisation). * **Stable (STBL)** : 8 août, 03h00. Valeur débloquée : 28,75 millions USD (3,55% de la capitalisation). * **Name (NAME)** : 9 août, 03h00. Valeur débloquée : 48,47 millions USD (74,54% de la capitalisation). * **Move (MOVE)** : 9 août, 03h00. Valeur débloquée : 1,22 million USD (3,90% de la capitalisation). Ceci n'est pas une recommandation d'investissement.

cryptonews.ruIl y a 24 mins

Attention : un déblocage massif de tokens est prévu pour cette semaine sur 10 altcoins ! Voici le calendrier jour par jour et heure par heure

cryptonews.ruIl y a 24 mins

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

La plateforme CoinGecko a publié une liste des cryptomonnaies les plus recherchées par les utilisateurs au cours des dernières heures. Le jeton Pudgy Penguins ($PENGU) est en tête, suivi de Catecoin (CATE) et de Bless ($BLESS). Sur les 24 dernières heures, CATE a enregistré une hausse de prix impressionnante de 126,2%, tandis que $BLESS a augmenté de 86,1% et $PENGU de 3,9%. What IF (IF) a également progressé de 41,9%. Le classement complet des actifs les plus consultés sur CoinGecko, avec leur capitalisation boursière, est le suivant : 1. Pudgy Penguins ($PENGU) – 389,13 millions de dollars 2. Catecoin (CATE) – 19,62 millions de dollars 3. Bless ($BLESS) – 32,72 millions de dollars 4. Aerodrome Finance (AERO) – 385,03 millions de dollars 5. Hyperliquid (HYPE) – 11,43 milliards de dollars 6. Ethereum (ETH) – 224,17 milliards de dollars 7. Chainlink (LINK) – 6,17 milliards de dollars 8. Aave (AAVE) – 1,42 milliard de dollars 9. What IF (IF) – 31,24 millions de dollars 10. Polkadot (DOT) – 1,34 milliard de dollars 11. Bitcoin (BTC) – 1,27 trillion de dollars 12. Virtual Protocol (VIRTUAL) – 366,19 millions de dollars 13. Algorand (ALGO) – 758,15 millions de dollars 14. Cash Cat (CASHCAT) – 41,81 millions de dollars 15. Solana (SOL) – 42,38 milliards de dollars. *Ceci ne constitue pas un conseil en investissement.

cryptonews.ruIl y a 2 h

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

cryptonews.ruIl y a 2 h

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

Le groupe Trump Media and Technology Group (TMTG) a lancé le 1er août 2026 « Truth API », un service d’accès payant en temps réel aux publications des comptes les plus influents de Truth Social, notamment celui de l’ancien président Donald Trump. Destiné aux investisseurs institutionnels et aux firmes de trading haute fréquence, l’abonnement pourrait coûter jusqu’à 100 000 dollars par mois. TMTG justifie cette initiative par la création d’une source de revenus stable et la monétisation de ses actifs. Cette commercialisation d’un accès prioritaire aux posts présidentiels a suscité des critiques de la part de législateurs américains, dont des sénateurs démocrates et républicains, qui demandent des enquêtes sur d’éventuelles violations des règles de marché et dénoncent un accès privilégié vendu à prix d’or. L’analyse pointe un risque systémique similaire à celui observé en 2013, lorsqu’un tweet piraté avait provoqué une chute brutale des marchés. Le service Truth API, sans mécanisme avéré de vérification en temps réel, pourrait transformer le compte de Trump en une cible pour des manipulations, soulevant la question de la responsabilité en cas de diffusion de fausses informations influençant les marchés financiers.

cryptonews.ruIl y a 3 h

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

cryptonews.ruIl y a 3 h

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les actions préférées STRC de Strategy, dont le prix de clôture était de 89,46 $ fin juillet (bien en dessous de leur valeur nominale de 100 $), maintiendront leur dividende à 12 % pour le mois d'août. Le président exécutif Michael Saylor a confirmé cette information, notant que le dividende est désormais versé deux fois par mois. Malgré une perte nette importante au deuxième trimestre (8,22 milliards de $), principalement due à une perte non réalisée sur ses réserves de Bitcoin, Strategy a constitué une réserve de trésorerie de 3,75 milliards de $ pour garantir le paiement des dividendes préférés. La direction réitère son objectif de faire remonter le cours de STRC vers 99-100 $ à terme et continue de racheter ces titres tant qu'ils se négocient en dessous du pair. Parallèlement, Saylor a évoqué une annonce potentielle concernant les avoirs en Bitcoin de l'entreprise, laissant entendre une possible évolution de sa stratégie de trésorerie.

cointelegraphIl y a 4 h

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

cointelegraphIl y a 4 h

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

Le portefeuille matériel Coldcard a été compromis, entraînant une nouvelle vague de retraits depuis les appareils vulnérables. Selon Galaxy Research, environ 1 367,05 BTC (88,6 millions de dollars) ont été dérobés à partir de 4 585 adresses. Le problème ne réside pas dans le firmware, qui a été corrigé, mais dans les phrases seed générées entre mars 2021 et les mises à jour correctives. Ces phrases, créées en raison d'une erreur de programmation ayant conduit à l'utilisation d'un générateur de nombres aléatoires logiciel (Yasmarang) au lieu du générateur matériel STM32, sont prévisibles et vulnérables à une attaque par force brute hors ligne. Les propriétaires concernés doivent impérativement générer une nouvelle phrase seed sur un firmware corrigé et transférer leurs actifs, sous peine de rester exposés. L'histoire d'un investisseur de 39 ans illustre l'impact dévastateur : après avoir accumulé 2 BTC (130 000 dollars) sur huit ans via un travail physique, en les conservant comme protection contre l'hyperinflation dans son pays, il a tout perdu en quelques minutes. Son cas montre que même les stratégies de conservation à long terme les plus prudentes ("cold storage") ne sont pas infaillibles. D'un point de vue historique, cet incident rappelle les faiblesses passées des générateurs de nombres aléatoires dans la cryptographie. Il remet en question l'idée reçue selon laquelle le stockage hors ligne garantit automatiquement une sécurité absolue. La communauté espère que le fabricant pourra aider à récupérer les fonds volés.

cryptonews.ruIl y a 4 h

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

cryptonews.ruIl y a 4 h

Trading

Spot

Catégories populaires

Indepth Research1,444 actualités

Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

Résumé

Défense concurrentielle, déguisée en défense sécuritaire

La trilogie : créer le buzz, monétiser, récolter

OpenAI vend des outils, Anthropic vend de l'anxiété

Des excuses, juste le service après-vente de l'affaire

Questions liées

Lectures associées

Attention : un déblocage massif de tokens est prévu pour cette semaine sur 10 altcoins ! Voici le calendrier jour par jour et heure par heure

Liste des altcoins les plus populaires selon les recherches des dernières heures publiée !

Pour 100 000 $ par mois : Truth Social vend l'accès aux publications de Trump à des sociétés d'investissement

La stratégie maintient le dividende privilégié du STRC à 12 % alors que le prix reste encore en dessous du pair

Les retraits de Bitcoin se poursuivent : 8 ans de stockage en portefeuille froid Coldcard se sont terminés par un solde nul

Trading

Catégories populaires

Tags tendances