Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

**OpenAI provoque un séisme mathématique avec son nouveau modèle Astra** OpenAI a dévoilé des avancées mathématiques majeures réalisées par son modèle interne Astra, présenté par Sam Altman. L'IA aurait résolu ou fait progresser dix problèmes complexes dans des domaines variés comme la géométrie haute dimension, la théorie des groupes et la complexité quantique. Le résultat le plus marquant est la construction du premier groupe "non sofic" infini et finiment présenté, réfutant une conjecture de Mikhail Gromov vieille de 27 ans. Cette seule découverte est qualifiée de niveau "Prix Fields". Astra a également amélioré une borne fondamentale sur le problème de l'empilement des sphères en haute dimension, stagnant depuis 1978, et a réfuté la conjecture de rigidité d'Alain Connes en construisant une infinité de groupes non isomorphes partageant la même algèbre de von Neumann. Ces résultats, compilés dans un document de 249 pages, sont accompagnés de preuves formelles vérifiées par l'assistant Lean 4. OpenAI précise que le coût total de génération de ces démonstrations aurait été inférieur à 2000 dollars. La communauté mathématique réagit avec stupeur, certains experts y voyant un tournant historique où l'IA démontre une intuition et une capacité de raisonnement pouvant surpasser les meilleurs mathématiciens humains.

marsbitIl y a 53 mins

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

marsbitIl y a 53 mins

Comment se rendre impossible à remplacer par l'intelligence artificielle

Avec l'essor de l'IA, le vrai défi n'est pas la technologie elle-même, mais notre dépendance à un emploi traditionnel pour survivre. L'article propose de rompre avec cet « esclavage salarial » en devenant un individu autonome et « inemployable », capable de créer sa propre voie grâce à des compétences impossibles à automatiser. Pour réussir dans ce nouveau paradigme, cinq éléments clés sont essentiels : l'autonomie d'action, le goût, la persuasion, la persévérance et l'itération. Ces qualités s'acquièrent non par la théorie, mais en créant ses propres projets. L'auteur soutient que parmi les leviers disponibles, la création de contenu (médias) est plus cruciale que le code, car la valeur du contenu est subjective et nécessite un jugement humain affiné par l'expérience. Le chemin commence par une transformation profonde de son identité et de son environnement. Un exercice pratique en trois étapes est proposé pour trouver sa vocation : 1) Identifier ses connaissances uniques et passions naturelles, 2) Définir ses convictions contraires à la sagesse conventionnelle, 3) Publier immédiatement une première idée pour obtenir un retour réel du monde. L'objectif est de bâtir une œuvre de vie authentique, en utilisant les outils numériques et l'IA non comme une fin, mais comme un levier pour amplifier sa voix et son impact personnels.

marsbitIl y a 1 h

Comment se rendre impossible à remplacer par l'intelligence artificielle

marsbitIl y a 1 h

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

Le titre « Les clés Bitcoin protégées par des dés, mais la méthode reste marginale » introduit un article sur la génération manuelle de graines de portefeuille Bitcoin à l'aide de dés. L'article explique le concept d'entropie, illustré par Claude Shannon, où un dé à six faces génère environ 2,585 bits d'incertitude. Il aborde le scandale récent de Coldcard, où une vulnérabilité du générateur de nombres aléatoires matériel a compromis des fonds. Les utilisateurs ayant généré leur phrase de récupération avec des dés (environ 99 lancers pour une haute sécurité) n'étaient pas affectés pour leur seed principal. Cependant, l'analyse du chercheur Kevin Loaec montre que d'autres fonctions du portefeuille (clés de copie, portefeuilles papier, mots de passe, etc.) utilisaient ce générateur défectueux et restaient vulnérables. L'article souligne les défis pratiques de la méthode des dés : elle est longue, sujette aux erreurs de saisie, et peu adaptée aux nouveaux utilisateurs qui pourraient mal l'exécuter. Il conclut que si cette méthode manuelle est robuste pour les experts, l'objectif à long terme est d'avoir un matériel et des logiciels générant une entropie fiable de manière simple et sécurisée. Il conseille aux propriétaires de Coldcard de vérifier leur firmware et les fonctions utilisées, et rappelle l'intérêt des solutions multi-signatures avec différents fabricants pour limiter les risques.

cryptonews.ruIl y a 4 h

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

cryptonews.ruIl y a 4 h

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

Michael Saylor a expliqué qu'il était mathématiquement impossible que le BIP-110 atteigne le seuil de 55 % de soutien volontaire au cours du cycle actuel d'ajustement de la difficulté de minage de Bitcoin. Sur un total de 946 blocs générés jusqu'au bloc 960 561 pendant cette période, seuls 24 contenaient un signal de soutien au BIP-110 dans l'en-tête. Saylor affirme que tous ces signaux provenaient des mineurs DATUM via le pool de minage OCEAN, et qu'aucun soutien n'est venu de mineurs externes à OCEAN. Il conclut donc que le BIP-110 n'atteindra pas le niveau de consensus volontaire requis et que les signaux actuels ne représentent pas un consensus général des mineurs. Le BIP-110 est une proposition visant à restreindre l'ajout de données non financières (comme des images ou du texte) dans la blockchain Bitcoin, arguant que le réseau ne doit servir qu'aux transferts d'argent. Saylor s'y oppose, estimant que le réseau Bitcoin ne devrait pas décider quelles transactions sont légitimes et que les règles ne doivent pas changer selon les préférences de quelques-uns. Il souligne également que le niveau apparent de soutien pourrait être artificiellement gonflé par des processus de signalisation automatisés.

cryptonews.ruIl y a 5 h

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

cryptonews.ruIl y a 5 h

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

L'entreprise d'analyse crypto Santiment a annoncé que le sentiment négatif envers le Bitcoin sur les réseaux sociaux a atteint un niveau historiquement élevé. Le ratio entre commentaires positifs et négatifs sur des plateformes comme X, Reddit et Telegram est au plus bas depuis le début de son système de surveillance moderne. La principale raison de cette inquiétude est une vulnérabilité découverte dans le firmware des portefeuilles matériels Coldcard, ébranlant la confiance dans le stockage personnel et les portefeuilles froids, pourtant perçus comme les méthodes les plus sûres. Santiment souligne que, contrairement aux crises passées (FTX, Mt. Gox, "Jeudi noir" COVID), les discussions se concentrent désormais sur la sécurité du matériel et des portefeuilles froids plutôt que sur les plateformes centralisées. Les données montrent seulement 0,58 commentaire positif pour chaque commentaire négatif, indiquant que la peur dépasse historiquement la cupidité. Bien que basé sur un seul jour, ce niveau de panique serait plus élevé que lors des pics de crainte liés à la guerre cette année ou des précédentes grandes crises crypto. *Ceci n'est pas un conseil en investissement.

cryptonews.ruIl y a 5 h

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

cryptonews.ruIl y a 5 h

Trading

Spot

Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

Résumé

Défense concurrentielle, déguisée en défense sécuritaire

La trilogie : créer le buzz, monétiser, récolter

OpenAI vend des outils, Anthropic vend de l'anxiété

Des excuses, juste le service après-vente de l'affaire

Questions liées

Lectures associées

Choc ! La prochaine IA d'OpenAI résout 10 problèmes du calibre de la Médaille Fields

Comment se rendre impossible à remplacer par l'intelligence artificielle

Grâce aux lancers de dés, les clés Bitcoin sont stockées hors ligne, mais tout le monde ne s'y mettra pas

Michael Saylor a déclaré qu'il était devenu impossible d'adopter une mise à jour de Bitcoin à laquelle il s'opposait !

Le nombre de commentaires négatifs sur le Bitcoin atteint un niveau historique : qu'est-ce que cela signifie ?

Trading

Catégories populaires

Tags tendances