Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

L'affaire du piratage de Raydium révèle un nouveau risque pour la DeFi : des anciens contrats oubliés

L'incident de piratage de Raydium, où environ 1,34 million de dollars d'actifs ont été volés via d'anciens pools de marché automatique (AMM) V3 abandonnés, met en lumière un risque négligé dans le DeFi : les contrats intelligents obsolètes mais toujours actifs sur la blockchain. Ces "contrats zombies", officiellement mis hors service mais techniquement exploitables, constituent une nouvelle catégorie de vulnérabilités liée à la gestion du cycle de vie des contrats. Depuis mars 2025, au moins 8 incidents similaires ont été recensés, causant des pertes d'environ 22,5 millions de dollars. Le problème vient du fait que les projets se concentrent sur les versions actuelles, négligeant de sécuriser les anciens contrats qui conservent des actifs et restent accessibles. Le contrat V3 de Raydium, par exemple, avait été abandonné suite à l'arrêt de Serum mais n'avait pas été correctement désactivé, permettant aux pirates de contourner ses contrôles obsolètes. Les plateformes de sécurité classent généralement les incidents par type de faille technique (code, oracle, clés...), masquant ainsi cette faille de gestion. Une étude académique propose pourtant de distinguer clairement les vulnérabilités de gestion du cycle de vie des contrats. Pour remédier à ce problème, il est crucial de créer une catégorie dédiée aux "contrats zombies" et d'établir un processus standardisé de désactivation sécurisée. Ce processus devrait inclure le retrait des actifs, la révocation des autorisations, la désactivation des fonctions clés et une surveillance continue. Une simple note en documentation est insuffisante et reporte le risque sur les réserves du projet. La valeur des projets DeFi réside aussi dans leur historique et leur infrastructure passée, qui doivent être sécurisés pour éviter qu'ils ne deviennent une nouvelle cible privilégiée pour les attaquants.

Foresight NewsIl y a 11 mins

L'affaire du piratage de Raydium révèle un nouveau risque pour la DeFi : des anciens contrats oubliés

Foresight NewsIl y a 11 mins

Commentaire Cinglant | Michael Saylor tient des propos de « mauvais garçon » ; après le krach de ses contrats à effet de levier, une sexagénaire « arnaque un jeune homme »

L'article "Spicy Comments" de Foresight News présente trois anecdotes satiriques sur le monde des cryptomonnaies cette semaine. Premièrement, Michael Saylor, fondateur de MicroStrategy, a clarifié ses propos antérieurs sur le Bitcoin. Il a expliqué que son célèbre conseil "ne vendez jamais" s'adressait aux investisseurs individuels, et non à sa société, qui peut vendre ses BTC si nécessaire. Cette distinction a suscité de vives réactions et des accusations de double discours de la part de la communauté en ligne. Deuxièmement, une affaire judiciaire insolite a été rapportée à Pékin. Une retraitée de 60 ans a escroqué un jeune homme de plus de 200 000 yuans en se faisant passer pour une jeune femme lors d'une relation en ligne. L'argent, obtenu sous de faux prétextes, a été entièrement perdu après qu'elle l'ait investi avec un effet de levier de 10x sur des cryptomonnaies, subissant un "liquidation". Enfin, un trader anonyme a partagé son expérience amère sur Reddit. Après avoir atteint un patrimoine net record de 45 millions de dollars grâce aux meme coins, sa fortune se serait effondrée à environ 17 000 dollars. Son histoire, marquée par l'absence de prise de profits et une concentration excessive sur des actifs très spéculatifs, sert d'avertissement et a provoqué de nombreux commentaires à la fois compatissants et critiques. L'article conclut sur le ton de son titre, dépeignant un écosystème où s'entremêlent rhétorique habile, arnaques et risques extrêmes, le tout saupoudré d'une dose d'humour noir.

Foresight NewsIl y a 3 h

Commentaire Cinglant | Michael Saylor tient des propos de « mauvais garçon » ; après le krach de ses contrats à effet de levier, une sexagénaire « arnaque un jeune homme »

Foresight NewsIl y a 3 h

Tremblez, les humains, l'IA continue d'accélérer sa course effrénée

**Synthèse en français :** L’IA continue d’accélérer sa progression, passant de simples capacités de conversation à des applications pratiques concrètes. Lors de la conférence *BAAI 2026*, les experts ont souligné que la *Scaling Law* reste toujours efficace, malgré les craintes de stagnation. Les modèles de langage et multimodaux continuent de s’améliorer, notamment grâce à des données synthétiques et à l’apprentissage par renforcement, comme le montre l’exemple du modèle *Fable 5* d’Anthropic. L’auto-évolution de l’IA, notamment via l’*AI Coding*, permet désormais aux systèmes de générer et de mettre à jour du code de manière autonome, ouvrant la voie à une automatisation accrue dans le monde numérique. La prochaine frontière est celle des **modèles du monde** (*World Models*), qui visent à connecter l’IA au monde physique. Différentes approches coexistent (centrées sur le langage, les pixels, la 3D ou les représentations visuelles), mais aucun consensus technique n’est encore établi. Des défis majeurs persistent, notamment concernant les types de données nécessaires (vidéo, simulation, données réelles). Le *BAAI* travaille sur un modèle du monde unifié, *Physis-v0.1*, qui cherche à prédire les états physiques futurs avec précision. Parallèlement, les **agents intelligents** progressent rapidement, passant du stade *utilisable* à *fiable*. Des applications concrètes émergent dans la santé, la recherche ou l’assistance aux réunions. Pour optimiser leur performance, l’accent est mis sur le *Harness* – un cadre d’ingénierie qui affine la compréhension des tâches, planifie les actions et intègre des vérifications. En résumé, l’IA avance sur deux fronts : l’exploration des modèles du monde pour interagir avec le physique, et l’amélioration des agents pour des tâches complexes. La route reste longue, mais l’innovation, tant dans les modèles que dans les infrastructures matérielles et logicielles, continue de s’accélérer.

marsbitIl y a 3 h

Tremblez, les humains, l'IA continue d'accélérer sa course effrénée

marsbitIl y a 3 h

L'envers de la fortune de Musk de mille milliards de dollars : 85% ne peuvent pas être vendus

SpaceX, avec son introduction en bourse (IPO) record de 750 milliards de dollars et une valorisation de 1,77 trillion de dollars, propulse la fortune personnelle d'Elon Musk au-delà du seuil de 1 trillion de dollars, faisant de lui le premier « trillionnaire ». Cependant, cette richesse est en grande partie théorique. Musk, qui détient environ 85 % des droits de vote, possède probablement des actions à droit de vote multiples, extrêmement peu liquides et soumises à une période de blocage, limitant fortement sa capacité à les convertir en liquidités. Une conversion annuelle au même rythme que les ventes de Jeff Bezos représenterait moins de 2,5 % de sa fortune totale. L'IPO devrait générer environ 4 400 nouveaux millionnaires parmi les employés de SpaceX, grâce à leurs plans d'actions. Pourtant, leur richesse sur papier sera soumise à une période de blocage standard de 180 jours, à des prix d'exercice et à des obligations fiscales, différant ainsi l'accès aux liquidités réelles. La structure des capitaux révèle une vulnérabilité potentielle : seulement 4,2 % des 131,1 milliards d'actions totales seront librement négociables lors de l'introduction. Une telle concentration rend le cours particulièrement sensible à la faible pression d'achat ou de vente. Le vrai test interviendra à l'issue de la période de blocage, lorsque la grande majorité des actions, y compris celles des employés et des investisseurs précoces, pourront être vendues. Enfin, la valorisation s'appuie sur les revenus de location de puissance de calcul IA (260 milliards de dollars annuels via des contrats avec Anthropic et Google). Cependant, le secteur xAI de SpaceX a enregistré une perte nette de 6,4 milliards de dollars en 2025 et ses dépenses en immobilisations sont estimées à environ 31 milliards de dollars, dépassant ces revenus. Cette dynamique, associée aux éventuelles clauses contractuelles, soulève des questions sur la viabilité financière à long terme de ce pilier de croissance et sur la soutenabilité de la valorisation après le déblocage massif des actions.

链捕手Il y a 3 h

L'envers de la fortune de Musk de mille milliards de dollars : 85% ne peuvent pas être vendus

链捕手Il y a 3 h

Trading

Spot
Futures
活动图片