Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

Les taux d'intérêt japonais pourraient atteindre un sommet en 30 ans ? L'inflation et la situation au Moyen-Orient, variables clés

La Banque du Japon pourrait relever son taux directeur à 1% en juin, ce qui représenterait son plus haut niveau depuis 1995. Cette anticipation, à environ 80% de probabilité selon le marché, fait suite à des signaux plus fermes de la part de ses responsables, notamment le gouverneur Ueda, qui a indiqué un recentrage de la politique sur la lutte contre l'inflation. La pression inflationniste, attisée par la hausse des prix de l'énergie due aux tensions au Moyen-Orient, est le principal moteur. Le Japon, fortement dépendant des importations énergétiques, craint une transmission des coûts élevés des entreprises aux consommateurs, risquant de maintenir l'inflation durablement au-dessus de l'objectif de 2%. Des données récentes sur l'inflation de gros et des commentaires de membres de la politique monétaire ont renforcé ces inquiétudes. Cependant, la situation au Moyen-Orient reste une variable critique. Une escalade significative du conflit, en provoquant des turbulences sur les marchés ou en menaçant la stabilité économique, pourrait perturber le calendrier de resserrement de la Banque du Japon. Les décideurs évaluent ce risque jusqu'au dernier moment avant leur réunion des 15-16 juin. À moins d'une telle aggravation, la trajectoire actuelle des politiques, visant à poursuivre la normalisation monétaire après des années de stimulation, devrait conduire à cette nouvelle hausse des taux.

marsbitIl y a 2 mins

Les taux d'intérêt japonais pourraient atteindre un sommet en 30 ans ? L'inflation et la situation au Moyen-Orient, variables clés

marsbitIl y a 2 mins

Partenaire de a16z Crypto : La trésorerie est le fossé protecteur

Auteur: Jason Rosenthal, associé opérationnel chez a16z Crypto. L'article soutient que les entreprises les plus performantes de l'histoire se sont bâties en se positionnant au cœur des "flux de valeur", facilitant la création et le transfert de valeur au sein d'un réseau et en prélevant une partie de celle-ci. La cryptomonnaie est présentée comme la première technologie moderne construite nativement pour cela. Grâce aux stablecoins, la valeur circule désormais à la vitesse d'internet, de manière globale, 24h/24, avec une transparence et une programmabilité inédites. Les blockchains, par conception, sont des entreprises en réseau. Chaque transaction est réglée sur un registre partagé, et chaque nouveau participant renforce le réseau pour tous. Les jetons de réseau bien conçus alignent les incitations de tous les acteurs (utilisateurs, développeurs, validateurs) autour d'un seul objectif : la croissance du réseau, avec une répartition proportionnelle aux contributions. Ce modèle n'est pas nouveau (exemples : chemins de fer, Google, AWS, Visa), mais la cryptomonnaie le rend plus accessible et évolutif pour les startups. La combinaison d'un flux de valeur et d'effets de réseau constitue une structure commerciale extrêmement durable. L'auteur applique le principe "vos marges sont mes opportunités" (Jeff Bezos) aux services financiers traditionnels, où les frais d'intermédiation (paiements, garde, transferts) sont élevés. Les fondateurs cryptos ont l'opportunité de construire la version suivante : programmable, instantanée, mondiale et native des flux de trésorerie. Le champ d'application dépasse largement la finance : le calcul (GPU), les données d'IA, l'énergie, les robots, les métaux rares... autant de marchés où la valeur peut circuler à une échelle inédite sur une infrastructure programmable sans intermédiaires enracinés. Pour les fondateurs, l'auteur pose trois questions clés : Êtes-vous actuellement dans un flux de valeur ? Vos revenus augmentent-ils proportionnellement à la valeur circulant sur votre produit ? Où les marges d'intermédiation sont-elles les plus fortes dans votre marché cible ? L'opportunité est là : il s'agit de s'insérer dans ces nouveaux flux et de laisser les effets de réseau opérer.

链捕手Il y a 4 mins

Partenaire de a16z Crypto : La trésorerie est le fossé protecteur

链捕手Il y a 4 mins

Le premier leader du RWA réalise sa première grande acquisition : pourquoi acheter une entreprise de prêts hypothécaires jugée « dépassée » ?

**Figure acquiert Kiavi pour dominer le crédit immobilier tokenisé** Le 10 juin, Figure Technology Solutions, présentée comme le leader de la tokenisation d'actifs réels (RWA), a annoncé l'acquisition de Kiavi pour 717 millions de dollars. Kiavi est une plateforme de prêt non bancaire axée sur les investisseurs immobiliers résidentiels, spécialisée dans les prêts de transition (RTL) pour rénovation et les prêts basés sur le ratio de couverture du service de la dette (DSCR). Cette acquisition stratégique permet à Figure, dont le modèle initial reposait sur les prêts de second rang (HELOC), de renforcer massivement son exposition aux prêts de premier rang, un marché estimé 25 fois plus vaste. Kiavi apporte son expertise et sa technologie propriétaire en IA pour évaluer la valeur après rénovation de biens immobiliers, un domaine traditionnellement peu traité par les banques. L'objectif est de connecter la capacité de production de prêts non standard de Kiavi à la plateforme de financement et de marché secondaire « Democratized Prime » de Figure. Le nouveau produit Adaptor de Figure vise à automatiser et unifier l'intégration de ces actifs sur la blockchain pour les rendre négociables. Ce rapprochement, qui doit générer des synergies de coûts, représente une étape majeure pour concrétiser la vision des RWA : transformer des prêts immobiliers complexes en actifs numériques liquides. Le succès de l'intégration et la sensibilité des actifs de Kiavi aux cycles des taux d'intérêt restent des défis à surveiller.

Foresight NewsIl y a 32 mins

Le premier leader du RWA réalise sa première grande acquisition : pourquoi acheter une entreprise de prêts hypothécaires jugée « dépassée » ?

Foresight NewsIl y a 32 mins

L'onde de Wall Street : Une publication à l'origine d'un rebond de 930 points, ce soir, c'est au tour de SpaceX

**Résumé : Le marché américain connaît un rebond spectaculaire de 930 points, porté par l'espoir de paix au Moyen-Orient et l'IPO record de SpaceX.** Jeudi 11 juin, les marchés américains ont effectué un revirement spectaculaire, le Dow Jones gagnant 930 points (+1,86%). Ce rebond est survenu malgré la publication d'un indice PPI (prix à la production) très chaud (+6,5% en glissement annuel), le plus élevé depuis fin 2022. La raison principale est politique : des déclarations de l'ancien président Trump suggérant un projet d'accord de paix au Moyen-Orient et une frappe annulée contre l'Iran ont fait chuter le prix du pétrole (WTI -4%). Les investisseurs ont anticipé un pic de l'inflation, provoquant un retour des capitaux vers les secteurs technologique et cyclique. Au sein de la tech, la divergence est forte. Les valeurs liées au matériel informatique et aux semi-conducteurs (comme Micron, Intel, AMD) ont fortement rebondi. En revanche, les logiciels souffrent, illustrés par la chute d'Oracle et d'Adobe malgré de bons résultats, en raison de craintes sur leurs flux de trésorerie et des départs de dirigeants. L'autre événement majeur est l'introduction en bourse (IPO) de SpaceX prévue le vendredi 12 juin. Avec une levée de fonds attendue d'environ 75 milliards de dollars et une valorisation proche de 1 750 milliards, elle devient la plus importante de l'histoire. Son entrée prochaine dans le Nasdaq 100 devrait générer des achats forcés massifs par les fonds indiciels. Cependant, cette valorisation très élevée (environ 88 fois le chiffre d'affaires) suscite des interrogations sur une éventuelle surévaluation. En conclusion, la qualité de ce rebond reste à prouver. Il repose sur des espoirs de paix encore fragiles et n'élimine pas les risques inflationnistes sous-jacents. L'ouverture du titre SpaceX servira de test crucial pour l'appétit au risque du marché.

marsbitIl y a 55 mins

L'onde de Wall Street : Une publication à l'origine d'un rebond de 930 points, ce soir, c'est au tour de SpaceX

marsbitIl y a 55 mins

Trading

Spot
Futures
活动图片