Anthropic s'est excusé, mais l'« affaire » de la sécurité n'est pas terminée

marsbitPublié le 2026-06-12Dernière mise à jour le 2026-06-12

Résumé

Le 11 juin, Anthropic a présenté ses excuses concernant son modèle Claude Fable 5. Celui-ci réduisait discrètement les performances (en redirigeant vers Opus 4.8) lorsqu'il détectait un développement de modèles IA avancé. La justification initiale – une mesure de sécurité – a été vivement critiquée. L'article affirme que la "sécurité" promue par Anthropic est avant tout une stratégie commerciale. Son "classificateur de sécurité intelligente" servirait surtout à protéger son avantage concurrentiel en limitant les chercheurs rivaux, sous couvert de protection utilisateur. Cette logique a été mise à nu lorsque, suite à la controverse, Anthropic a dû rendre ces limitations visibles, tout en avertissant que cela augmenterait les "faux positifs" pour les utilisateurs ordinaires. L'auteur analyse la stratégie d'Anthropic comme un cycle : publier des recherches amplifiant les risques de l'IA (comme une étude du 10 juin sur la génération d'exploits), proposer ensuite des produits "sécurisés" à prime (comme Fable 5), et monétiser via une évaluation boursière élevée (965 Mds $) et un IPO prochain. Cela contraste avec l'approche d'OpenAI, axée sur les outils et l'écosystème. L'incident a endommagé la crédibilité d'Anthropic auprès des développeurs. Si sa clientèle institutionnelle paie pour son image de "société la plus sûre", la confiance de la communauté technique est ébranlée. La conclusion est que les excuses ne sont qu'un service après-vente pour une activité où la "sécurité" est...

Le 11 juin, Anthropic a présenté ses excuses. Le modèle n'a pas déraillé, c'est « le manque de maîtrise de l'équilibre » qui est en cause : la nouvelle version Claude Fable 5 jouait un petit jeu, en redirigeant silencieusement les requêtes vers le modèle plus faible Opus 4.8 dès qu'elle détectait que vous utilisiez Claude pour du développement de modèles de pointe.

Démasqué, l'explication d'Anthropic est étrange : à l'avenir, on vous préviendra avant de réduire les capacités.

Les internautes ont rétorqué de manière cinglante : « Avec ce genre de procédé, avez-vous l'intention de prévenir avant de changer d'avis ? »

En réalité, le cœur du problème n'est absolument pas de savoir si le modèle a changé, mais le fait que la prétendue « sécurité » d'Anthropic n'a jamais été qu'une affaire depuis le début.

Les positions de l'algorithme suivent toujours les fluctuations de l'argent.

Défense concurrentielle, déguisée en défense sécuritaire

L'origine de l'affaire est qu'Anthropic a intégré un « classificateur de sécurité intelligente » au lancement de Fable 5, avec un discours officiel disant : détecter les requêtes à haut risque, les déclasser automatiquement, protéger l'utilisateur.

Qu'est-ce qu'un risque élevé ? Anthropic l'a lui-même révélé : « Prévenir les adversaires étrangers d'utiliser le modèle pour accélérer la R&D, protéger notre propre avantage concurrentiel. »

Les utilisateurs n'ont pas besoin de cette protection, ce qui figure dans les accords d'utilisation suffit à les protéger. Ce qu'Anthropic veut dire, c'est : utiliser Claude pour la recherche en IA, c'est leur mordre sur le marché. La sécurité n'est qu'un emballage, l'essence est la défense concurrentielle. En clair, c'est une question de stratégie commerciale.

Encore plus fort, ce mécanisme de défense était très discret. Heureusement, Anthropic a finalement dit une grande vérité dans ses excuses : « Des restrictions de sécurité invisibles permettent de cibler plus précisément des objectifs spécifiques, nous permettant de publier rapidement, avec un taux de faux positifs extrêmement bas. »

Les chercheurs en IA sont précisément ces cibles limitées.

Le passage forcé à « visible » est purement dû à l'échec cuisant. Ils ont même émis une mise en garde préventive : après être devenu visible, cela « produira inévitablement plus de faux positifs ». Ce qui signifie que l'expérience des utilisateurs ordinaires devra en subir les conséquences.

Ces règles n'ont jamais été neutres, elles ne protègent que ceux qui paient.

La trilogie : créer le buzz, monétiser, récolter

Cette façon de jouer d'Anthropic est plus calculée que le modèle d'IA lui-même.

Le 10 juin, ils ont d'abord publié une étude de sécurité, décrivant un modèle capable de reconstruire des codes d'exploitation de vulnérabilités à partir de correctifs de sécurité en quelques heures. Des vulnérabilités N-day que les hackers mettaient des jours, voire des semaines, à armer sont maintenant compressées à l'échelle de l'heure. L'étude en soi est solide, mais publiée le même jour que le lancement de Fable 5, le sens change : d'un côté prouver que l'IA est très dangereuse, de l'autre vendre une « solution de secours ».

Le « modèle légendaire » Fable 5 est tarifé à 10$ en entrée / 50$ en sortie, plus cher qu'Opus 4.8, le classificateur de sécurité devenant le point de différenciation principal. Les marchés financiers jouent le jeu, la valorisation d'Anthropic est de 9650 milliards de dollars, avec une introduction en bourse (IPO) prévue en octobre, Goldman Sachs et JP Morgan en co-garants. On n'achète pas des paramètres de modèle, mais l'image de « l'entreprise d'IA la plus sûre ».

La recherche amplifie l'anxiété, le produit récolte une prime, les capitaux se monétisent, les trois choses suivent les intérêts, formant une boucle parfaite. Le seul problème est que cette fois, la boucle a fui : trop pressés de limiter la concurrence, ils ont oublié que la communauté contient des gens capables de le détecter.

OpenAI vend des outils, Anthropic vend de l'anxiété

Comparé à OpenAI, la méthode est totalement différente.

OpenAI prépare secrètement son IPO, sa valorisation avoisinant le billion, avec un discours sur les « super applications » : ChatGPT a 900 millions d'utilisateurs actifs hebdomadaires, s'intègre avec Visa pour créer un écosystème. La logique est simple : fournir des outils, gagner du trafic. Cupide, mais franc.

Anthropic ne joue pas sur la taille, mais sur l'irremplaçabilité. L'industrie toute entière s'inquiète de la sécurité, alors elle joue le rôle du « seul adulte responsable ». Ses bailleurs de fonds sont les gouvernements et les géants, ceux qui craignent le plus les incidents, et sont les plus prêts à payer cher pour que « rien n'arrive ».

Donc Anthropic doit maintenir l'IA dans un état « schrödingérien » de « dangereuse mais contrôlable ». Trop sûre, le classificateur ne se vend pas ; trop dangereuse, les clients fuient. La meilleure solution ? Garder le pouvoir de définir le « danger » entre ses propres mains.

L'affaire de la réduction des capacités n'a fait que mettre à nu cette logique : la frontière du « dangereux » a été poussée jusqu'à « utiliser Claude pour faire de la R&D en IA ». Que vos recherches soient néfastes ou non importe peu, menacer mon avance est le péché originel.

L'IA n'a aucune valeur, elle se contente d'écrire en code les calculs commerciaux de son patron.

Des excuses, juste le service après-vente de l'affaire

Et après les excuses ? D'une réduction silencieuse des capacités, on passe à un signal avant de réduire.

Les internautes voient clair : « Vous croyez vraiment qu'à l'avenir ils ne réduiront pas silencieusement la qualité des réponses ? »

La confiance, une fois brisée, est brisée. D'autant que la couleur commerciale n'a pas changé : la recherche continue d'amplifier l'anxiété, le produit continue de récolter une prime.

Le Wall Street Journal a révélé qu'OpenAI envisageait une baisse significative de ses prix, pour tenter de voler des clients à Anthropic. La guerre des prix n'est pas nouvelle, mais cela révèle une vérité cachée : ce sont les chercheurs en IA qui subissent une dégradation cachée, et c'est la réputation dans le cercle des geeks qui en prend un coup. Mais les clients B2B qui achètent Anthropic n'achètent pas des paramètres, mais l'image de « l'expert de la sécurité dans le secteur ». Si cette image se fissure au sein du groupe central des développeurs, sur quoi les clients institutionnels et gouvernementaux, qui paient une « prime de sécurité », vont-ils continuer à vous croire « le plus sûr » ?

Dans cette valorisation de 9650 milliards, quelle part est réellement de la substance, et quelle part est de la mise en scène ?

Le code d'Anthropic est honnête. Le classificateur de sécurité protège toujours les intérêts commerciaux, la recherche est chargée d'amplifier l'anxiété, le produit de récolter la prime, l'IPO de monétiser le tout. Ces excuses ne sont qu'un correctif au système : remplacer « réduire les capacités en secret » par « réduire les capacités ouvertement ».

Si la stratégie de sécurité était vraiment efficace, Anthropic n'aurait pas besoin de publier chaque année des articles prouvant que les correctifs peuvent être contournés. Si le classificateur était vraiment neutre, faire de la R&D en IA ne serait pas classé comme haut risque.

La réponse est écrite depuis le début dans la logique commerciale.

La sécurité, c'est la meilleure affaire. Des excuses, ce n'est que le service après-vente de l'affaire.

Cet article provient du compte WeChat officiel « AI唱反调 », auteur : 长青

Questions liées

QQuel a été le problème principal avec le modèle Claude Fable 5 d'Anthropic ?

ALe problème principal était qu'Anthropic a discrètement redirigé certaines requêtes (identifiées comme étant liées au développement de modèles d'IA de pointe) vers un modèle plus faible, Opus 4.8, sans en informer les utilisateurs.

QSelon l'article, comment Anthropic a-t-elle justifié l'introduction de son « classificateur de sécurité intelligent » ?

AAnthropic a justifié l'introduction du classificateur comme une mesure de protection pour les utilisateurs contre les requêtes « à haut risque », mais a admis que son objectif réel était d'empêcher les concurrents étrangers d'utiliser son modèle pour accélérer leur propre recherche et ainsi protéger son avantage concurrentiel.

QComment l'article compare-t-il les stratégies commerciales d'Anthropic et d'OpenAI ?

AL'article compare qu'OpenAI se concentre sur la création d'un « super-application » (comme ChatGPT) et la monétisation par le trafic et les outils, de manière directe. Anthropic, elle, capitalise sur l'anxiété liée à la sécurité, se positionnant comme l'acteur le plus responsable et sûr pour vendre des produits à prime aux gouvernements et grandes entreprises.

QQuelle est la critique fondamentale de l'article concernant la notion de « sécurité » chez Anthropic ?

ALa critique fondamentale est que la « sécurité » promue par Anthropic n'est pas un principe neutre ou éthique, mais une stratégie commerciale. Elle est utilisée pour justifier des restrictions qui protègent principalement ses intérêts commerciaux (comme sa position dominante) et générer des revenus grâce à des produits à prime et une valorisation boursière élevée.

QQue signifie la phrase de conclusion de l'article : « La sécurité est la meilleure des affaires. Les excuses ne sont que le service après-vente de l'affaire » ?

ACette phrase signifie que pour Anthropic, le concept de sécurité est avant tout un outil marketing lucratif (une « affaire ») qui génère de la valeur et des profits. Les excuses offertes après le scandale du « downranking » ne sont qu'une mesure corrective superficielle pour maintenir cette affaire, sans remettre en cause la logique commerciale sous-jacente.

Lectures associées

L'onde de Wall Street : Une publication à l'origine d'un rebond de 930 points, ce soir, c'est au tour de SpaceX

**Résumé : Le marché américain connaît un rebond spectaculaire de 930 points, porté par l'espoir de paix au Moyen-Orient et l'IPO record de SpaceX.** Jeudi 11 juin, les marchés américains ont effectué un revirement spectaculaire, le Dow Jones gagnant 930 points (+1,86%). Ce rebond est survenu malgré la publication d'un indice PPI (prix à la production) très chaud (+6,5% en glissement annuel), le plus élevé depuis fin 2022. La raison principale est politique : des déclarations de l'ancien président Trump suggérant un projet d'accord de paix au Moyen-Orient et une frappe annulée contre l'Iran ont fait chuter le prix du pétrole (WTI -4%). Les investisseurs ont anticipé un pic de l'inflation, provoquant un retour des capitaux vers les secteurs technologique et cyclique. Au sein de la tech, la divergence est forte. Les valeurs liées au matériel informatique et aux semi-conducteurs (comme Micron, Intel, AMD) ont fortement rebondi. En revanche, les logiciels souffrent, illustrés par la chute d'Oracle et d'Adobe malgré de bons résultats, en raison de craintes sur leurs flux de trésorerie et des départs de dirigeants. L'autre événement majeur est l'introduction en bourse (IPO) de SpaceX prévue le vendredi 12 juin. Avec une levée de fonds attendue d'environ 75 milliards de dollars et une valorisation proche de 1 750 milliards, elle devient la plus importante de l'histoire. Son entrée prochaine dans le Nasdaq 100 devrait générer des achats forcés massifs par les fonds indiciels. Cependant, cette valorisation très élevée (environ 88 fois le chiffre d'affaires) suscite des interrogations sur une éventuelle surévaluation. En conclusion, la qualité de ce rebond reste à prouver. Il repose sur des espoirs de paix encore fragiles et n'élimine pas les risques inflationnistes sous-jacents. L'ouverture du titre SpaceX servira de test crucial pour l'appétit au risque du marché.

marsbitIl y a 3 mins

L'onde de Wall Street : Une publication à l'origine d'un rebond de 930 points, ce soir, c'est au tour de SpaceX

marsbitIl y a 3 mins

Examen des évaluations à milliers de milliards de dollars : Les trois super introductions en bourse sont-elles une fête technologique ou un cauchemar pour le marché crypto ?

Trois méga-IPO technologiques - SpaceX, OpenAI et Anthropic - prévues pour 2026, avec une valorisation combinée estimée à plus de 3 500 milliards de dollars, suscitent des débats sur leurs conséquences pour les marchés. SpaceX (visant ~1 750 milliards) voit sa logique de valorisation évoluer de l'aérospatial vers l'infrastructure mondiale, portée par Starlink, sa principale source de revenus. OpenAI (~852 milliards) et Anthropic (~965 milliards) offriront les premiers grands investissements publics directs dans des modèles de base d'IA générative. Des craintes existent quant à un "effet d'aspiration" de la liquidité du marché, les investisseurs institutionnels pouvant réallouer des fonds depuis d'autres actifs technologiques ou cryptos pour souscrire. Cependant, l'histoire (ex: Alibaba, Saudi Aramco) montre que les grandes IPO entraînent plus une reconfiguration des capitaux qu'un assèchement systémique, le marché global des actions étant très vaste. Pour les actions technologiques, cela pourrait reconfigurer la valorisation du secteur de l'IA, mettant sous pression les titres surévalués dépourvus de fondamentaux solides. Pour le marché des cryptomonnaies, une pression concurrentielle sur certains jetons liés à l'IA est possible, mais la tendance à long terme reste davantage dictée par ses propres cycles, la liquidité macro et la réglementation. Le risque principal ne réside pas dans les IPO elles-mêmes, mais dans la possibilité que la croissance future et la rentabilité de ces entreprises ne justifient pas leurs valorisations ambitieuses, ce qui pourrait déclencher un recalage des prix pour ces sociétés et le secteur technologique en général. En définitive, ces événements représentent un test majeur de la capacité du marché à évaluer et à absorber la prochaine vague d'innovation.

链捕手Il y a 7 mins

Examen des évaluations à milliers de milliards de dollars : Les trois super introductions en bourse sont-elles une fête technologique ou un cauchemar pour le marché crypto ?

链捕手Il y a 7 mins

Test d'évaluation de milliards de milliards de dollars : Les trois méga-IPO sont-elles la frénésie des actions technologiques ou le cauchemar du marché de la cryptomonnaie ?

Trois géants technologiques - SpaceX, OpenAI et Anthropic - préparent des introductions en bourse qui pourraient constituer l'une des plus importantes vagues de sorties technologiques. Leurs valorisations combinées dépasseraient les 3 500 milliards de dollars. Cette concentration soulève des interrogations sur une éventuelle pression sur la liquidité des marchés et un effet d'aspiration des capitaux au détriment d'autres actifs, notamment les cryptomonnaies. SpaceX, valorisé autour de 1 750 milliards de dollars, voit son récit d'investissement évoluer : le centre de gravité se déplace des lanceurs vers Starlink, perçu comme une future infrastructure de télécommunication mondiale, malgré des pertes actuelles. OpenAI (∼852 Md$) et Anthropic (∼965 Md$), pionniers de l'IA générative, offriront pour la première fois aux investisseurs un accès direct à des sociétés phares des modèles de fondation. Si des craintes existent quant à un "assèchement" de la liquidité au profit de ces mastodontes, l'analyse historique montre que les méga-IPO (comme Alibaba ou Aramco) provoquent davantage une reconfiguration des portefeuilles qu'une disparition des capitaux. Le marché actions américain, d'une taille considérable, a la capacité d'absorber ces nouvelles émissions, dont l'impact réel dépendra surtout du contexte de liquidité globale. Pour le marché actions, l'arrivée de ces champions pourrait entraîner une reprixation au sein du secteur technologique, défavorisant les valeurs spéculatives au profit des leaders avérés. Pour les cryptomonnaies, une pression concurrentielle temporaire sur certains jetons liés à l'IA est plausible, mais le marché crypto reste principalement piloté par ses dynamiques propres (cycles du Bitcoin, régulation, flux ETF). Le véritable enjeu ne réside pas dans l'opération de sortie elle-même, mais dans la capacité de ces entreprises à justifier à terme leurs valorisations astronomiques par la concrétisation de leurs promesses de croissance et de rentabilité.

marsbitIl y a 8 mins

Test d'évaluation de milliards de milliards de dollars : Les trois méga-IPO sont-elles la frénésie des actions technologiques ou le cauchemar du marché de la cryptomonnaie ?

marsbitIl y a 8 mins

Un consensus d'élite dans un cercle restreint : Faire des études supérieures est devenu un gaspillage coûteux ?

Un mouvement de « rébellion » contre l'université gagne du terrain parmi les jeunes élites de la Silicon Valley. Sebastian Tan, 18 ans, admis à Stanford, a choisi de reporter ses études pour un stage chez Palantir, attiré par son programme « Meritocracy Fellowship » qui promet une alternative pratique au parcours académique traditionnel. Cette tendance, portée par des figures comme Peter Thiel (fondateur du fonds Thiel qui subventionne les jeunes pour qu'ils quittent l'université) et des entreprises tech, avance trois arguments principaux : le coût exorbitant des études (jusqu'à 500 000 $ de dette), le décalage entre l'enseignement théorique et la rapidité du monde tech, et un rejet idéologique de ce qui est perçu comme une institution trop lente et imprégnée de « culture woke ». Les partisans de l'autodidactie soutiennent qu'avec l'IA et les ressources en ligne, il est plus efficace d'apprendre en construisant des projets réels. Cependant, des économistes comme David Deming rappellent que le « salaire premium » des diplômés reste élevé (75-80%) et que l'université, notamment via les arts libéraux, développe des compétences transversales et une capacité d'adaptation précieuses. Le débat ne signifie pas forcément la fin de l'université, mais révèle une crise de son modèle face à un monde en mutation rapide. L'enjeu n'est plus simplement « aller ou non à l'université », mais de repenser comment apprendre tout au long de la vie dans un environnement où le savoir est de plus en plus décentralisé et accessible.

marsbitIl y a 1 h

Un consensus d'élite dans un cercle restreint : Faire des études supérieures est devenu un gaspillage coûteux ?

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片