Auteur : Xiong Lei
Éditeur : Xu Qingyang
Le 12 juin, heure des États-Unis, un affrontement direct rare dans l'histoire de la régulation de l'IA entre le gouvernement et une entreprise a éclaté soudainement ce vendredi.
Le gouvernement américain, invoquant des raisons de sécurité nationale, a émis une directive de contrôle des exportations à l'encontre d'Anthropic, exigeant la suspension immédiate de tout accès des entités étrangères aux deux modèles d'IA Fable 5 et Mythos 5. La portée de cette directive est extrêmement large : elle s'applique non seulement aux utilisateurs étrangers en dehors des États-Unis, mais aussi aux citoyens étrangers résidant sur le territoire américain, y compris les employés étrangers au sein même de l'entreprise Anthropic.
En tant que mesure de conformité, Anthropic a dû fermer complètement les points d'accès à ces deux modèles pour tous les utilisateurs – c'est actuellement la seule solution viable pour assurer la conformité, car l'entreprise n'est pas capable, au niveau technique, de distinguer précisément les groupes d'utilisateurs "entités étrangères" et "citoyens américains". L'accès aux autres modèles de l'entreprise n'est pas affecté, les utilisateurs seront automatiquement replacés sur Claude Opus 4.8.
Cet arrêt d'urgence est arrivé de manière inattendue. Fable 5 et Mythos 5 ont été officiellement lancés le 9 juin, il y a seulement trois jours. Le retrait soudain des deux modèles a provoqué un vaste émoi dans le milieu technologique et la communauté de l'IA.
01 Que sont exactement ces deux modèles
Pour comprendre la tension centrale de cette controverse, il faut d'abord comprendre ce que sont les modèles Fable 5 et Mythos 5, et pourquoi ils se sont trouvés dès le départ sous les feux de la rampe de la régulation.
Mythos est une toute nouvelle famille de modèles d'Anthropic, placée hiérarchiquement au-dessus de la série Opus, et représente le plus haut niveau de capacité actuellement déployable publiquement par Anthropic. Le premier modèle de type Mythos, Claude Mythos Preview, a été lancé en avril dernier via le projet "Project Glasswing", avec un accès strictement limité à un petit nombre de partenaires, en raison de ses capacités jugées trop puissantes dans le domaine de la cybersécurité pour une ouverture large.
Fable 5 est le premier modèle de niveau Mythos officiellement ouvert au grand public, surpassant en capacités tous les modèles précédemment publiés par Anthropic, atteignant des niveaux de pointe dans l'industrie sur presque tous les benchmarks de test, qu'il s'agisse de génie logiciel, de travail intellectuel, de compréhension visuelle ou de recherche scientifique.
Pour permettre sa publication publique, Anthropic a équipé Fable 5 d'un mécanisme de protection de sécurité spécifique – dans les domaines à haut risque comme la cybersécurité, la biologie, la chimie, etc., le modèle bloque automatiquement les réponses et retourne le traitement à Claude Opus 4.8.
Mythos 5 est quant à lui une version basée sur le même modèle fondamental, mais dotée de moins de protections de sécurité, ouverte uniquement aux institutions approuvées ayant déjà obtenu un accès via Project Glasswing. Il est positionné comme un outil professionnel pour les défenseurs de la cybersécurité et les opérateurs d'infrastructures critiques. Les deux modèles sont tarifés de la même manière : 10 dollars par million de tokens en entrée et 50 dollars par million de tokens en sortie.
02 La cause déclenchante de la directive
Selon les rapports, le secrétaire américain au Commerce, Howard Lutnick, a adressé une lettre le 12 juin au PDG d'Anthropic, Dario Amodei (Dario Amodei), annonçant que Mythos 5 et Fable 5 seraient soumis à un contrôle des exportations. La cause directe ayant déclenché cette décision serait l'affirmation par une autre société d'être capable de réaliser un "jailbreak" (contournement des sécurités) sur Mythos, ce qui aurait alerté l'administration Trump sur les risques potentiels pour la sécurité nationale.
Il est rapporté que l'administration Trump avait auparavant tenté d'empêcher Anthropic de publier ces deux modèles, sans succès – ce qui a ensuite conduit le gouvernement à adopter cette mesure plus ferme de contrôle des exportations.
Face à cette directive soudaine, tout en se conformant à son exécution, Anthropic a publié une déclaration d'une rareté remarquable par sa tonalité ferme, réfutant systématiquement les raisons avancées par le gouvernement.
Anthropic estime que les preuves de "jailbreak" en possession du gouvernement concernent uniquement un mode d'attaque très étroit et non généralisable, qui consiste essentiellement à demander au modèle de lire un dépôt de code spécifique et de corriger ses vulnérabilités logicielles – ce type de capacité existe également dans d'autres modèles disponibles publiquement, y compris GPT-5.5 d'OpenAI, et est utilisé quotidiennement par les défenseurs en cybersécurité pour des travaux de maintenance normale des systèmes.
Anthropic indique clairement dans sa déclaration que si l'existence d'un "jailbreak potentiel à portée limitée" devient la norme pour rappeler des modèles commerciaux déjà déployés, cela conduirait en pratique à un arrêt complet de tout nouveau déploiement de tous les modèles de pointe dans l'ensemble du secteur. L'entreprise souligne également que cette action gouvernementale n'a pas suivi la procédure légale transparente, équitable et fondée sur des faits techniques qu'elle avait publiquement appelée de ses vœux auparavant.
Anthropic déclare qu'elle se conformera aux instructions légitimes du gouvernement, tout en travaillant activement à communiquer avec lui pour rétablir l'accès dans les plus brefs délais, et qu'elle publiera davantage de détails techniques dans les 24 prochaines heures. L'entreprise estime que cet incident découle d'un malentendu et présente ses excuses pour les inconvénients causés aux utilisateurs.
Voici le texte intégral de la déclaration publiée par Anthropic, intitulée « Déclaration concernant l'instruction du gouvernement américain de suspendre l'accès à Fable 5 et Mythos 5 » :
Le gouvernement américain, s'appuyant sur des pouvoirs de sécurité nationale, a émis une directive de contrôle des exportations exigeant la suspension de l'accès à Fable 5 et Mythos 5 pour tous les citoyens étrangers, qu'ils se trouvent sur le territoire américain ou à l'étranger, y compris les employés étrangers d'Anthropic. L'effet pratique de cette directive est le suivant : nous devons immédiatement fermer Fable 5 et Mythos 5 à tous les utilisateurs pour assurer la conformité. Les autres modèles Anthropic ne sont pas affectés.
Nous avons reçu cette instruction aujourd'hui à 17h21 heure de l'Est. La lettre ne précise pas les préoccupations spécifiques en matière de sécurité nationale. D'après ce que nous comprenons, le gouvernement pense avoir connaissance d'une méthode pour contourner les protections de sécurité de Fable 5, une technique dite de "jailbreak" (contournement). Nous avons examiné une démonstration de cette technique et constaté qu'elle ne permettait d'identifier qu'un petit nombre de vulnérabilités mineures et déjà connues. Ces vulnérabilités sont toutes relativement simples, et d'autres modèles disponibles publiquement peuvent découvrir les mêmes problèmes sans nécessiter de jailbreak.
Anthropic a exposé notre position concernant les protections de sécurité de Fable dans l'article de blog annonçant sa publication, comme suit :
Nous avons mis en place des mécanismes de protection de sécurité solides qui réduisent considérablement la probabilité que Fable soit détourné pour des tâches liées à la cybersécurité, entre autres. En fait, certains utilisateurs ont rapporté que nos mesures de protection étaient trop strictes.
Plusieurs semaines avant la publication de Fable, Anthropic a collaboré avec le gouvernement américain, l'Institut britannique de sécurité de l'IA, plusieurs organismes tiers et des équipes internes pour effectuer des tests d'équipe rouge (red teaming) sur les protections de sécurité de Fable, cumulant des milliers d'heures. Les résultats ont montré que les protections de sécurité de Fable étaient significativement plus efficaces que celles de tout modèle précédemment déployé.
Aucun testeur n'a jusqu'à présent réussi à trouver une méthode de "jailbreak universel" – c'est-à-dire un moyen de contournement qui permettrait de débloquer de manière complète les protections de sécurité du modèle et d'accéder à des capacités d'attaque réseau à grande échelle.
Nous estimons qu'aucun fournisseur de modèle ne peut actuellement offrir une protection parfaite contre les jailbreaks. Tous les mécanismes de protection de l'industrie peuvent potentiellement être contournés par des "jailbreaks non universels" (obtention d'informations réseau partielles dans des circonstances spécifiques), et des méthodes de jailbreak universel pourraient apparaître à l'avenir. Nous l'avons clairement indiqué lors de la publication de Fable 5.
Considérant qu'une protection parfaite contre les jailbreaks n'est actuellement pas réalisable, Anthropic a adopté une stratégie de défense en profondeur pour Fable 5. Notre objectif est de rendre les attaques par jailbreak soit de portée très limitée (pour les jailbreaks non universels), soit extrêmement coûteuses (pour les jailbreaks universels), tout en complétant cela par une surveillance complète pour détecter et contenir rapidement toute attaque réussie. C'est également la raison pour laquelle Anthropic exige une conservation des données clients pendant 30 jours – bien que cette politique ait un impact réel sur nos relations avec les clients, elle nous aide à étudier et à répondre aux risques de jailbreak.
Nous maintenons cette stratégie de défense en profondeur. Elle réduit efficacement les risques posés par Fable, les ramenant à un niveau comparable à celui des modèles actuellement déployés dans l'industrie.
Jusqu'à présent, nous n'avons même pas reçu de divulgation formelle concernant un quelconque jailbreak non universel qui pourrait avoir des conséquences néfastes. Les cas potentiels de jailbreak qui nous ont été divulgués sont soit totalement inoffensifs, soit relèvent de découvertes mineures qui ne mettent pas en évidence des capacités exclusives à Mythos.
Actuellement, le gouvernement américain ne nous a fourni que des preuves orales concernant une méthode potentielle et limitée de jailbreak non universel, dont l'essence est de demander au modèle de lire un dépôt de code spécifique et de corriger les vulnérabilités logicielles qu'il contient. D'après ce que nous comprenons, cette méthode de jailbreak potentielle a été partagée avec le gouvernement. Nous avons examiné un rapport – nous pensons que c'est ce rapport qui a servi de base à l'instruction du gouvernement – et avons vérifié que le niveau de capacité démontré dans ce rapport existe également couramment dans d'autres modèles (y compris GPT-5.5 d'OpenAI) et est utilisé quotidiennement par les défenseurs de la cybersécurité pour maintenir la sécurité des systèmes. Nous publierons plus de détails dans les 24 prochaines heures.
Nous nous conformerons à l'instruction légitime du gouvernement en fermant l'accès à Fable 5 et Mythos 5 pour tous les utilisateurs. Cependant, nous ne pensons pas que la découverte d'une méthode de jailbreak potentielle et limitée constitue à elle seule une raison suffisante pour rappeler un modèle commercial déjà déployé auprès de centaines de millions d'utilisateurs. Si cette norme était appliquée à l'ensemble du secteur, cela conduirait en pratique à un arrêt complet des nouveaux déploiements de modèles par tous les fournisseurs de modèles de pointe.
Nous avons publiquement affirmé que le gouvernement devrait avoir le pouvoir, sur la base d'une procédure légale transparente, équitable, claire et fondée sur des faits techniques, d'empêcher le déploiement de modèles non sécurisés. Cette action ne s'est pas conformée aux principes ci-dessus.
Nous nous excusons sincèrement pour les désagréments causés à nos utilisateurs. Nous pensons que cet incident découle d'un malentendu et travaillons activement à rétablir l'accès dans les plus brefs délais.





