Vous devez vous souvenir qu'en avril, Anthropic a publié un modèle nommé Mythos.
Rien qu'au nom, on comprend son ambition : Mythe.
À l'époque, on disait qu'il avait trouvé plus de dix mille vulnérabilités critiques pour 50 entreprises clientes, bouleversant toute l'industrie.
Cette nouvelle avait provoqué une chute généralisée des actions de la cybersécurité, vous devez vous en souvenir.
En raison de sa puissance jugée trop dangereuse et risquant d'être détournée, "trop dangereux pour être rendu public", il n'a pas été ouvert au grand public.
Jusqu'à hier soir, Anthropic a ajouté un classificateur de sécurité au modèle Mythos et a officiellement lancé Fable 5.
Quant au Mythos 5 non castré, il n'est actuellement ouvert qu'à environ 200 organisations soumises à un examen rigoureux, comme la Maison Blanche, les défenseurs de la cybersécurité et le projet Transparent Wing.
Une telle prudence ne peut manquer de faire penser à la série d'animation IA récemment très populaire, Angel Engine.
L'être enfermé dans la cage, est-ce cet "Ange" ?
Même si ce n'est pas encore le cas, ce n'est plus très loin.
01
Selon les données de test publiées officiellement par Anthropic et les rapports de tests réels des premiers partenaires entreprises, la puissance de Fable 5 peut être qualifiée de stupéfiante.
Regardons d'abord les benchmarks.
Sur le tableau d'évaluation de la programmation automatique SWE-Bench Pro, Claude Fable 5 a un taux de réussite de 80,3 %, contre 69,2 % pour son "parent" Opus 4.8 ; GPT-5.5 est à 58,6 % ; Gemini 3.1 Pro seulement à 54,2 %.
Sur l'évaluation de code de pointe, Fable 5 atteint 29,3 %, Opus 4.8 est à 13,4 % ; GPT-5.5 seulement à 5,7 %.
......
L'écart est tel qu'il est comparable à sortir une mitrailleuse à l'époque des armes blanches.
Pour le reste, génie logiciel, formulation d'hypothèses de recherche indépendantes, conception de molécules pharmaceutiques, distillation de modèles et compression extrême, compréhension de contexte long, etc., dans presque tous les tests, Fable 5 arrive en première position.
Vous pouvez chercher des vidéos pour les détails.
Voyons maintenant les applications pratiques.
Le géant des paiements Stripe a effectué un test précoce avec Fable 5. Ils avaient un énorme codebase historique de 50 millions de lignes nécessitant une migration complète. Selon les estimations, une refonte de cette ampleur, même confiée à une équipe spécialisée, prendrait au minimum deux mois.
Résultat, après avoir soumis la tâche à Fable 5, celui-ci a planifié tout seul, vérifié sa progression, corrigé les erreurs rencontrées. En seulement un jour, la migration des 50 millions de lignes de code était terminée.
Une telle performance ne se résume pas au simple adjectif "puissant".
D'un point de vue étroit, Fable 5 a en réalité déjà réalisé l'AGI au niveau de l'économie numérique.
La raison est qu'il démontre une véritable "capacité d'agence à long terme".
Que ce soit GPT-5.5 ou Gemini 3.5, sans parler des autres grands modèles moins performants, ils sont essentiellement dans un mode "réponse".
Vous donnez un coup de pied, il fait un pas.
Face à une impasse, il ne peut que lever une exception, pleurnicher en disant "désolé, je ne suis qu'un modèle de langage".
Qualifié d'outil, l'utilisateur doit en réalité réfléchir en profondeur, guider l'IA pas à pas pour obtenir le résultat souhaité, ce qui n'est pas facile.
Fable 5, doté d'une logique de pilotage par objectifs internalisée, est différent.
Comme dans le test de Stripe, lorsqu'on lui donne une tâche longue et complexe de haut niveau, il procède en trois étapes :
Construire un arbre de sous-tâches ;
Orchestrer différents outils (recherche web, extraction de base de données, environnement bac à sable Python) ;
Autoréflexion, s'il rencontre un blocage, il change immédiatement de voie.
L'humain, en dehors de la formulation de la tâche et de la réception du résultat, n'a plus besoin d'intervenir constamment.
En tant qu'outil de productivité, c'est déjà quasiment parfait.
Mais cela reste fondamentalement différent d'une véritable AGI.
La force de Fable 5 est construite sur le fait que les bases de code, la littérature scientifique, etc., dans lesquelles il évolue, possèdent toujours une logique mathématique sous-jacente et des structures définies.
S'il ne se perd pas dans des tâches à long cycle, c'est parce qu'il a surmonté le problème de la "décroissance de l'attention sur les longs textes", et qu'il peut maintenir l'alignement sur l'objectif central tout en traitant des tâches complexes s'étendant sur des millions de tokens.
Mais si on le jette dans le bourbier chaotique de la réalité physique et sociale, dépourvu de règles numériques et que l'humain lui-même ne maîtrise pas, il subirait toujours des ruptures logiques dues à l'"absence de fondations".
Si on utilise la "norme à cinq niveaux de l'intelligence artificielle" proposée par OpenAI (Niveau 1 : Chatbot ; Niveau 2 : Raisonneur ; Niveau 3 : Agent ; Niveau 4 : Innovateur ; Niveau 5 : Organisation) pour mesurer.
Opus 4.8 est entre le niveau 2 et le niveau 3, tandis que Fable 5 est solidement au niveau 3 et explore le niveau 4.
Et il a fallu 43 jours pour passer d'Opus 4.7 à 4.8, et seulement 11 jours pour passer de 4.8 à Fable 5.
Combien de temps pour s'établir solidement au niveau 4 ? Au rythme de plus en plus rapide des mises à jour d'Anthropic aujourd'hui, cela pourrait être réalisé cette année.
Même le niveau 5 final, selon des estimations optimistes, ne nécessiterait que 18 à 24 mois, il n'est vraiment qu'à un pas.
Cette vitesse est trop rapide, c'est aussi la principale raison pour laquelle des restrictions de sécurité doivent lui être imposées.
02
Dans le System Card et le rapport d'évaluation RSP publiés par Anthropic avec le modèle, Mythos 5 a montré des signaux extrêmement dangereux sur deux capacités.
Premièrement, le modèle sous-jacent Fable/Mythos a atteint le niveau CB-1 dans les évaluations chimiques et biologiques.
Cela signifie que le modèle possède la capacité de bout en bout de "synthétiser et de guider la fabrication d'armes biologiques/chimiques non-nouveauté", et peut même suggérer des modifications de séquences génétiques pour optimiser l'efficacité de transmission d'un virus hautement pathogène.
Si un terroriste ayant des bases biologiques universitaires obtenait le Mythos 5 libéré de ses chaînes, il pourrait, en incitant constamment le modèle, obtenir des instructions complètes sur la façon de contourner la réglementation des matières premières, de construire un laboratoire P3 simplifié dans un sous-sol, et de synthétiser un agent pathogène à haute létalité.
Deuxièmement, les attaques réseau et l'exploitation de vulnérabilités.
Lors des tests très précoces, Mythos 5 a démontré une capacité à rechercher de manière autonome et à exploiter les vulnérabilités critiques d'infrastructures essentielles (comme les centrales électriques, les systèmes de compensation financière, les réseaux hospitaliers), générant en quelques secondes des scripts d'attaque exploitant des vulnérabilités zero-day ciblées.
Lors du développement initial de Mythos en avril dernier, des fuites indiquaient qu'il avait trouvé plus de dix mille vulnérabilités de niveau critique pour les 50 premiers partenaires.
......
Face à ces deux scénarios, lancer Mythos 5 directement au public serait beaucoup trop dangereux.
Il faut enfermer cette bête féroce dans une cage.
Après deux mois, la cage construite par Anthropic comporte deux couches.
Premièrement, un mécanisme de routage par rétrogradation silencieuse.
Anthropic a déployé en front-end de Fable 5 un classificateur IA à haute précision, entièrement indépendant et extrêmement réactif.
Lorsqu'un utilisateur saisit une requête complexe, susceptible de concerner la cyberdéfense, la biochimie, ou tentant d'extraire les poids du modèle de manière détournée, le classificateur déclenche immédiatement une alerte et redirige silencieusement en arrière-plan la session vers l'ancien modèle Opus 4.8 pour répondre.
Deuxièmement, la rétention des données.
Anthropic et Amazon ont annoncé conjointement hier soir : quel que soit le plateau-forme, première ou tierce partie, tout trafic appelant le modèle Mythos doit obligatoirement appliquer une rétention des données de 30 jours.
Pourquoi ?
Parce que les vrais hackers ou terroristes sont souvent très intelligents ; ils ne poseront pas directement la question "comment fabriquer une bombe" dans une conversation, mais la décomposeront en 100 questions basiques apparemment inoffensives.
La surveillance complète des données sur 30 jours vise à capturer, par reconnaissance de motifs, les abus malveillants de type "méthode du salami" qui ne sont pas visibles dans une conversation unique.
Comme Dario Amodei l'a déjà averti en public : "La probabilité que l'IA provoque un risque catastrophique pour l'humanité est d'un bon 25 %."
Pour respecter la Responsible Scaling Policy (RSP) établie en interne ainsi que le Frontier Compliance Framework (FCF), Anthropic doit de ses propres mains attacher des menottes à cette bête gigantesque.
C'est ainsi qu'est né Fable 5.
03
Parlons maintenant du prix.
Le tarif officiel annoncé par Anthropic est : 10 dollars par million de tokens d'entrée, 50 dollars par million de tokens de sortie.
Trop cher.
Les tâches d'Agent de niveau entreprise actuelles, pour rechercher une haute précision, adoptent souvent une logique en chaîne du type "réfléchir plusieurs fois, réfléchir encore", une seule itération d'ingestion/rendu peut consommer 20 millions de tokens d'entrée, puis produire 5 millions de lignes de code modifiées.
Au calcul, une seule tâche coûterait 450 dollars.
De plus, Anthropic a déjà annoncé : la fenêtre d'expérience du modèle Mythos incluse dans l'abonnement personnel existant (Claude Pro) sera définitivement fermée le 22 juin 2026.
À l'avenir, si les utilisateurs individuels l'utilisent vraiment pour travailler, des dizaines de dollars disparaîtront en un clin d'œil.
Bien que le prix finira par baisser avec les mises à jour technologiques, à ce moment-là, il ne sera plus le plus performant.
La situation est déjà très claire : les grands modèles les plus avancés sont devenus des produits de luxe, inaccessibles pour le commun des mortels.
Bien sûr, pour Anthropic qui se concentre sur le marché B2B, c'est compréhensible.
La question est que, récemment encore, Google annonçait haut et fort une guerre des prix.
Alors que les concurrents baissent généralement leurs prix pour gagner des parts de marché, pourquoi Anthropic ose-t-il augmenter les prix à contre-courant ?
Parce que le prix du Token est virtuel, le retour sur investissement est fondamental.
Les clients entreprises se moquent du prix d'un kilowatt-heure ou d'un Token, tant que l'IA peut exécuter parfaitement et sans bug l'ensemble du flux d'ingénierie, ils se bousculent pour payer cette prime.
Plus crucial encore, la guerre de la cybersécurité est désormais devenue une confrontation pure entre IA et IA.
Étant donné que les modèles de niveau Fable/Mythos peuvent trouver instantanément des vulnérabilités système, la seule option pour les entreprises et les institutions étatiques pour se protéger des attaques est d'acheter à prix élevé le service de défense privatif en réseau interne Mythos 5 auprès d'Anthropic.
En termes simples, c'est un racket de protection : J'ai forgé l'épée la plus terrifiante (Mythos 5), j'ai peur de blesser alors je la vends au public avec un fourreau (Fable 5), mais en même temps je vends l'épée sans restriction aux départements de défense, pour qu'ils l'utilisent pour intercepter les épées que d'autres sont en train de forger.
Se défendre contre la menace de l'IA deviendra une dépense obligatoire pour chaque grande entreprise.
Cela conduira directement à une concentration encore plus forte des budgets haut de gamme du marché B2B vers Anthropic, tandis que les modèles bon marché qui ne servent qu'à écrire des documents officiels ou envoyer des emails se battront dans le marché C2C à très faible marge.
On peut prévoir que, dans la suite, le secteur mondial de la cybersécurité connaîtra une réévaluation de la valeur entraînée par l'IA.
Simultanément, l'"entreprise individuelle" deviendra aussi rapidement un phénomène de plus en plus répandu.
04
Fonctionnalité intégrée d'allocation de budget de tâches, prise en charge de la mémoire et de la gestion de contexte, capable de mémoriser, rejeter, recommencer comme un humain, capable de prendre en charge de manière indépendante tout le cycle de vie, du cahier des charges à la livraison du code...
L'apparition de Fable 5 et Mythos 5, plutôt qu'une simple mise à jour technologique des grands modèles, ressemble plus à une cérémonie de passage à l'âge adulte pour la division du travail dans l'industrie de l'IA.
Le marché de l'IA dit adieu à l'ère pastorale des "essais gratuits pour tous".
La puissance de calcul la plus avancée et l'intelligence la plus profonde seront prioritairement acheminées, comme une ressource stratégique de production, vers les champs de bataille des infrastructures, de la recherche et des applications B2B qui génèrent le plus de valeur commerciale.
C'est une fête explosive pour la productivité, mais aussi un hiver glacial pour le marché du travail.
Cet article provient du compte WeChat "Gelong", auteur : Wan Lianshan










