Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

« Je n’ai plus besoin de meilleurs modèles » : les réactions contrastées face à l’IA sur un post Reddit viral

Anthropic a récemment lancé Claude Fable 5, son premier modèle de niveau Mythos accessible au public. Bien qu'il affiche des performances record sur le benchmark SWE-Bench Pro, dépassant largement ses prédécesseurs, la réaction des utilisateurs sur Reddit est mitigée. Un post populaire sur r/artificial, intitulé "Claude Fable m'a fait réaliser que je n'ai pas besoin d'un meilleur modèle", résume un sentiment répandu : la fatigue face aux nouvelles versions. De nombreux utilisateurs estiment que les modèles précédents comme Opus 4.8 sont déjà "suffisants" pour leurs besoins quotidiens, évoquant un rapport coût-bénéfice défavorable, le prix de Fable 5 étant presque le double. Le principal point de critique concerne les "garde-fous" de sécurité de Fable 5. Les utilisateurs se plaignent que le modèle refuse trop fréquemment des requêtes liées à la sécurité ou à la programmation, les renvoyant vers Opus, ce qui nuit à son utilité pratique, surtout pour les abonnés payants. Cependant, une minorité d'utilisateurs aux tâches complexes (simulations physiques, code à très long contexte) font l'éloge de Fable 5, décrivant une différence de capacité "nuit et jour" pour leurs projets exigeants. Le débat soulève une question plus large : un fossé se creuse-t-il entre les modèles de pointe accessibles au public et les versions encore plus puissantes réservées aux entreprises et gouvernements ? Alors que les benchmarks montrent une progression constante, la perception des utilisateurs suggère que pour la majorité, le "suffisamment bon" pourrait être déjà atteint, laissant les gains marginaux aux seuls cas d'usage extrêmes. L'avenir de Fable 5 dépendra des ajustements d'Anthropic sur la sécurité et de l'adoption par les utilisateurs spécialisés.

marsbitIl y a 5 mins

« Je n’ai plus besoin de meilleurs modèles » : les réactions contrastées face à l’IA sur un post Reddit viral

marsbitIl y a 5 mins

Lorsque le trafic IA dépasse celui des humains, comment prouver que vous êtes réel ?

L'essor des agents IA génère désormais plus de trafic web que l'humanité, bouleversant les modèles économiques fondés sur l'attention humaine. Ces programmes, qui extraient des données sans cliquer sur des publicités ni acheter, privent les sites de revenus tout en accaparant leur contenu. Face à ce phénomène, environ 2,5 millions de sites bloquent désormais les robots d'IA. Les méthodes traditionnelles comme les CAPTCHA deviennent obsolètes face aux IA capables de les surpasser. La réponse émergente repose sur la biométrie comportementale : analyser les mouvements de souris, la cadence de frappe, les hésitations ou les erreurs de saisie – des caractéristiques humaines difficiles à reproduire pour une machine. Des entreprises comme IBM ou BioCatch développent ces systèmes, qui peuvent même détecter des fraudes en analysant les comportements. Deux approches s'opposent pour gérer cette vérification d'identité. La première, centralisée, est illustrée par Worldcoin qui scanne l'iris pour créer une preuve d'humanité unique, soulevant des inquiétudes quant à la collecte et au contrôle des données biométriques. La seconde, décentralisée, utilise des preuves à divulgation nulle de connaissance (zero-knowledge proofs), permettant de prouver son humanité sans révéler son identité. Cependant, cette dernière est vulnérable aux marchés noirs où des personnes louent leur identité. Si la solution centralisée se déploie rapidement, elle implique une surveillance biométrique permanente. La voie cryptographique, bien que perfectible, préserve la vie privée. Le choix se pose donc entre un système de surveillance efficace mais intrusif, et une alternative anonyme qui lutte contre les dérives économiques liées à la vérification d'identité.

marsbitIl y a 12 mins

Lorsque le trafic IA dépasse celui des humains, comment prouver que vous êtes réel ?

marsbitIl y a 12 mins

Carte Panoramique de l'IA Décentralisée en 2026 : Pourquoi la Blockchain est-elle l'« Antidote » Incontournable de l'IA ?

L'IA décentralisée émerge en réponse aux limites structurelles de l'IA centralisée : pénurie et coût élevé des ressources de calcul, contrôle excessivement concentré, résultats de modèles invérifiables et difficultés croissantes d'accès aux données d'entraînement. La blockchain apparaît comme une solution essentielle pour rendre l'intelligence ouverte, vérifiable et économiquement accessible. La pile technologique de l'IA décentralisée se structure en trois couches. La couche application est dominée par la finance agentielle (Agentic Finance), où des agents exécutent des actions sur chaîne à partir d'intentions en langage naturel, et par les paiements entre machines (Agentic Payments), utilisant la blockchain comme couche de règlement. La couche intermédiaire (middleware) aborde la coordination et l'identité des agents, avec des projets comme Bittensor, un réseau de sous-réseaux spécialisés fonctionnant comme des micro-économies. Enfin, la couche infrastructure fournit les ressources de base : calcul décentralisé (ex: Akash, Render), inférence vérifiable, entraînement distribué, stockage de données (ex: Filecoin) et des couches de confidentialité et de vérification (ex: Nillion, Phala Network) essentielles pour les cas d'usage sensibles. Les tendances pour 2026-2027 indiquent une croissance rapide, les agents IA devenant un moteur principal. Le calcul se transforme en une classe d'actifs, les marchés on-chain en étant la couche financière, et la tokenomics un avantage structurel pour coordonner capital, calcul et données. Bien que le domaine en soit à ses débuts et que l'adoption soit inégale, des projets comme Bittensor, NEAR ou Virtuals montrent que l'IA décentralisée évolue d'un récit spéculatif vers un nouveau modèle de coordination de l'intelligence.

marsbitIl y a 14 mins

Carte Panoramique de l'IA Décentralisée en 2026 : Pourquoi la Blockchain est-elle l'« Antidote » Incontournable de l'IA ?

marsbitIl y a 14 mins

Le partenaire de a16z Crypto : Les flux de trésorerie sont les fossés économiques

L'auteur, Jason Rosenthal d'a16z, soutient que les entreprises les plus performantes historiquement se sont bâties en se positionnant dans le "flux de trésorerie" - en facilitant la création et le transfert de valeur au sein d'un réseau et en en prélevant une partie. La cryptographie, conçue nativement pour cela, permet désormais à la valeur de circuler à la vitesse d'Internet via des stablecoins, de manière globale, continue et programmable. Les blockchains sont intrinsèquement des entreprises en réseau. Chaque transaction est réglée sur un registre partagé, et chaque nouveau participant renforce le réseau pour tous. Les jetons de réseau bien conçus alignent les incitations de tous les acteurs (utilisateurs, développeurs, validateurs) vers un seul objectif : développer le réseau, avec des récompenses proportionnelles aux contributions. Ce modèle n'est pas nouveau (ex: chemins de fer, Standard Oil, Google, AWS, Visa), mais la crypto le rend plus accessible. Il combine flux de valeur et effets de réseau pour créer des structures commerciales durables. Aujourd'hui, les services financiers traditionnels, avec leurs frais élevés (paiements, transferts, garde, etc.), représentent une cible majeure. Des entreprises comme Stripe ont montré la voie. L'opportunité pour les fondateurs crypto est de construire la version suivante : programmable, instantanée, mondiale et native du flux de trésorerie. Ce potentiel s'étend au-delà de la finance : calcul (GPU), données pour l'IA, énergie, robotique, espace, métaux rares. Ces marchés émergents, sans intermédiaires enracinés, sont des terrains ouverts. L'auteur invite les fondateurs à se demander : sont-ils déjà dans un flux de trésorerie ? Leurs revenus augmentent-ils avec la valeur générée sur leur produit ? Où les marges sont-elles les plus élevées dans leur marché cible ? L'opportunité est de saisir ces nouveaux flux et de laisser les effets de réseau s'accumuler.

marsbitIl y a 19 mins

Le partenaire de a16z Crypto : Les flux de trésorerie sont les fossés économiques

marsbitIl y a 19 mins

Les taux d'intérêt japonais pourraient atteindre un sommet en 30 ans ? L'inflation et la situation au Moyen-Orient, variables clés

La Banque du Japon pourrait relever son taux directeur à 1% en juin, ce qui représenterait son plus haut niveau depuis 1995. Cette anticipation, à environ 80% de probabilité selon le marché, fait suite à des signaux plus fermes de la part de ses responsables, notamment le gouverneur Ueda, qui a indiqué un recentrage de la politique sur la lutte contre l'inflation. La pression inflationniste, attisée par la hausse des prix de l'énergie due aux tensions au Moyen-Orient, est le principal moteur. Le Japon, fortement dépendant des importations énergétiques, craint une transmission des coûts élevés des entreprises aux consommateurs, risquant de maintenir l'inflation durablement au-dessus de l'objectif de 2%. Des données récentes sur l'inflation de gros et des commentaires de membres de la politique monétaire ont renforcé ces inquiétudes. Cependant, la situation au Moyen-Orient reste une variable critique. Une escalade significative du conflit, en provoquant des turbulences sur les marchés ou en menaçant la stabilité économique, pourrait perturber le calendrier de resserrement de la Banque du Japon. Les décideurs évaluent ce risque jusqu'au dernier moment avant leur réunion des 15-16 juin. À moins d'une telle aggravation, la trajectoire actuelle des politiques, visant à poursuivre la normalisation monétaire après des années de stimulation, devrait conduire à cette nouvelle hausse des taux.

marsbitIl y a 22 mins

Les taux d'intérêt japonais pourraient atteindre un sommet en 30 ans ? L'inflation et la situation au Moyen-Orient, variables clés