En avril, Anthropic a lancé une version préliminaire de son modèle Mythos. Ce modèle n'a pas été rendu public car, lors des tests, il a démontré des capacités extrêmement puissantes en cybersécurité et en recherche de vulnérabilités, étant capable de découvrir de manière autonome des milliers de vulnérabilités zero-day critiques. S'il était diffusé, il pourrait facilement être utilisé pour des attaques malveillantes.
Pour confiner ces capacités à des scénarios défensifs, Anthropic a lancé le Projet Glasswing (Project Glasswing), accordant un accès contrôlé uniquement à une douzaine de partenaires de sécurité de base comme Apple, Google, Microsoft et à plus de 40 fournisseurs d'infrastructures critiques. L'utilisation est surveillée en permanence.
Le fait de d'abord le verrouiller puis de l'annoncer a en soi créé le buzz.
Deux mois plus tard, le 10 juin à l'aube, heure de Pékin, Anthropic a officiellement lancé Fable 5 et Mythos 5.
En termes de scores de référence (benchmarks), ils ont obtenu les résultats les plus élevés dans presque tous les tests, notamment en ingénierie logicielle et dans l'exécution de tâches longues, creusant un écart significatif avec les autres modèles.
Mais les discussions autour de ce modèle ont rapidement dépassé la simple question de sa puissance.
Fable 5 et Mythos 5 partagent en réalité le même modèle sous-jacent. La différence réside dans le fait que Fable 5 est destiné aux utilisateurs grand public, tandis que Mythos 5 reste confiné entre les mains des partenaires de sécurité de confiance. Un même modèle, deux ensembles de règles, pour deux groupes, c'est une première dans la gamme de produits d'Anthropic.
De plus, les utilisateurs grand public ne reçoivent pas non plus la version complète. Anthropic a ajouté un classificateur de sécurité autour de Fable 5. Dès qu'une requête touche à des domaines sensibles comme la cybersécurité, la biochimie ou la distillation de modèles, le système bascule automatiquement vers le modèle de génération précédente, Opus 4.8, aux capacités plus faibles, pour répondre.
La tarification est également à noter : 10 dollars en entrée, 50 dollars en sortie par million de tokens, ce qui, selon l'entreprise, représente environ le double d'Opus 4.8. À partir du 23 juin, Fable 5 sera également retiré des abonnements Pro, Max, etc. Pour continuer à l'utiliser, les utilisateurs devront consommer des crédits supplémentaires.
Prise séparément, cette combinaison de mesures semble logique : des capacités trop puissantes justifient des restrictions de sécurité, un coût plus élevé entraîne une hausse des prix, une sensibilité au risque conduit à un lancement par niveaux. Mais mises ensemble, le signal envoyé devient plus subtil. Cela diffère de la logique de compétition des dernières années où les entreprises de grands modèles cherchaient la vitesse et l'ouverture, toutes essayant de toucher le plus d'utilisateurs possibles. Anthropic choisit de rétrécir activement l'accès, faisant des restrictions une partie intégrante de sa stratégie produit.
Alors, ce modèle qualifié de sans précédent, le "plus puissant", est-il mythifié ?
01. Amélioration notable des capacités, la rétrogradation automatique fait débat
Classement par niveaux mis à part, regardons d'abord la véritable puissance.
L'ingénierie logicielle est le point central de cette mise à jour d'Anthropic. Dans le test SWE-Bench Pro, Fable 5 a obtenu un score de 80,3 %. Ce test évalue principalement la capacité du modèle à localiser des bugs dans des dépôts GitHub réels, à comprendre le contexte et à écrire du code de correction fonctionnel. 80,3 % signifie que pour 5 problèmes d'ingénierie réels, Fable 5 peut en résoudre 4.
Sur le classement Terminal-Bench 2.1, Fable 5 a obtenu 88,0 %, dépassant Codex CLI d'Open AI. Il est à noter que Fable 5 est un modèle généraliste, tandis que Codex CLI est un outil vertical spécialement conçu pour les scénarios de programmation. L'écart entre les deux reflète davantage sa force en programmation.
Mais c'est FrontierCode Diamond qui montre vraiment la différence. Ce test évalue si le code produit par le modèle peut atteindre les standards de qualité des bases de code de niveau production. Fable 5 obtient 29,3 %, Opus 4.8 seulement 13,4 %, et GPT-5.5 seulement 5,7 %. Les trois données proviennent des publications officielles d'Anthropic, celle de GPT-5.5 étant un résultat de test interne.
Ces dernières années, la capacité des modèles d'IA à écrire du code a progressé, mais est longtemps restée coincée dans un goulot d'étranglement : le code fonctionne, mais n'est pas facile à maintenir ; il peut réussir des tests de référence, mais des problèmes surviennent fréquemment lors de son intégration dans des projets réels.
La percée de Fable 5 sur cette dimension montre qu'Anthropic ne se contente pas d'améliorer les capacités de résolution de problèmes, mais pousse le modèle vers une véritable orientation de livraison technique.
Li Xia, un programmeur, a déclaré à « AIX Finance » que le code généré par l'IA présente facilement des problèmes d'incohérence contextuelle. Au début, il peut comprendre précisément les besoins, mais dans des tâches longues, il a tendance à oublier des informations, ce qui entraîne des coûts de maintenance élevés plus tard.
À ses yeux, la cohérence logique de Fable 5 dans les tâches longues a progressé de manière significative. Des tâches de codage similaires peuvent être accomplies en une seule fois avec une précision plus élevée. Cependant, comparé à Opus 4.8, Fable 5 génère plus lentement, la chaîne de raisonnement est plus longue, et la vitesse de réponse globale a diminué.
Les capacités visuelles ont également été améliorées. Anthropic affirme que Fable 5 peut extraire des chiffres précis de diagrammes scientifiques complexes et reconstruire directement le code source d'applications à partir de captures d'écran de pages web. L'entreprise a également présenté une démonstration pratique où Fable 5 a terminé le jeu "Pokémon Fire Red" uniquement en s'appuyant sur des captures d'écran du jeu, sans outils d'assistance. Les modèles précédents, pour des tâches similaires, nécessitaient des systèmes d'assistance complexes.
Concernant le contexte long et la mémoire, la déclaration officielle est que plus la tâche est longue et complexe, plus l'avantage de Fable 5 est marqué.
De plus, les sciences du vivant sont un autre domaine mis en avant. Anthropic a révélé qu'un modèle d'analyse de données unicellulaires basé sur Mythos 5, couvrant 138 espèces, surpasse les performances d'un modèle similaire récemment publié dans "Science", tout en ayant un nombre de paramètres représentant seulement un pour cent de ce dernier.
Seulement sur la base des scores de référence, la capacité globale a effectivement fait un bond en avant.
Voyons maintenant au-delà des scores.
Fable 5 est équipé d'un classificateur de sécurité. Dès qu'une requête utilisateur concerne la cybersécurité, la biochimie ou la distillation de modèles, le système bascule automatiquement pour répondre avec Opus 4.8, et informe l'utilisateur qu'un changement de modèle a eu lieu. Selon l'entreprise, plus de 95 % des conversations quotidiennes ne le déclenchent pas, et la plupart des tâches comme l'écriture, la programmation et l'analyse ne sont pas affectées. Cependant, l'expérience réelle peut varier selon le contexte d'utilisation.
En pratique, cette limite est assez facile à déclencher. Li Xia a mentionné qu'il voulait expérimenter les fonctions de l'IA Siri d'Apple sur son Mac en Chine, ce qui nécessitait de modifier certains paramètres système comme des numéros de série. Fable 5 a directement refusé l'opération. Actuellement, le classificateur est réglé de manière assez conservatrice, avec des erreurs de jugement possibles. L'entreprise affirme qu'il sera ajusté en continu par la suite.
Mais Anthropic a également révélé une autre couche de restriction : pour les requêtes liées au développement de grands modèles, comme la construction de pipelines de pré-entraînement ou la conception d'infrastructures d'entraînement distribué, le modèle réduira activement la qualité de sa sortie en arrière-plan, sans en informer l'utilisateur.
Dans l'ensemble, Fable 5 montre des progrès sur les indicateurs techniques, mais le mécanisme de rétrogradation automatique affecte dans une certaine mesure l'expérience utilisateur.
02. Le modèle le plus puissant, pas accessible à tous
Avec cette mise à niveau de modèle, Anthropic a utilisé un même modèle sous-jacent pour créer deux produits, destinés à deux types de publics.
Mythos 5 reste dans le cadre du Projet Glasswing, accessible uniquement à la douzaine de partenaires de sécurité de base comme Apple, Google, Microsoft et aux plus de 40 fournisseurs d'infrastructures critiques. Les restrictions liées à la cybersécurité et à la biologie sont levées. Fable 5, quant à lui, est destiné aux utilisateurs abonnés grand public.
Par la suite, Anthropic prévoit également d'ouvrir un canal de confiance orienté biologie à des chercheurs agréés, fournissant une version de Fable 5 sans les restrictions biologiques et chimiques.
Cela touche à un problème auquel l'industrie des grands modèles n'a pas été confrontée auparavant : lorsque les capacités d'un modèle sont suffisantes pour découvrir des vulnérabilités de manière autonome, une publication complète devient un risque.
Source de l'image / pexels
Cela explique pourquoi Fable 5 et Mythos 5 ont été divisés en deux versions. Auparavant, la différenciation des modèles se faisait par le nombre de paramètres, la différence de taille impliquant une différence de capacité. Maintenant, même des modèles avec le même nombre de paramètres sont classés, mais cette fois c'est le seuil de confiance qui est divisé.
Le développeur indépendant Zhan Bo estime que, d'un point de vue sécurité, cette logique est raisonnable. Des capacités de recherche de vulnérabilités de niveau Mythos, si elles étaient ouvertes sans restriction aux individus, réduiraient considérablement le coût des attaques et pourraient facilement être détournées à des fins malveillantes. Les verrouiller d'abord, puis ouvrir progressivement un accès de confiance, est actuellement la voie la plus prudente.
Mais la sécurité n'explique que la nécessité de la stratification. Une autre question se pose : les utilisateurs grand public qui peuvent utiliser Fable 5 en bénéficient-ils tous ?
D'après les scores de référence et les cas publiés par Anthropic, cette mise à niveau sert en priorité les programmeurs et les équipes d'ingénierie.
Zhan Bo a utilisé Fable 5 pour optimiser son projet de langage interprété écrit en Rust. Dans un scénario de service web équivalent, il l'a comparé à FastAPI basé sur Python et à Hono basé sur Node.js. L'interpréteur utilisant Fable 5 occupait seulement 9,8 Mo de mémoire résidente, contre respectivement 43,3 Mo et 63,0 Mo pour FastAPI et Hono. Les indicateurs de débit et de latence étaient également en tête.
Il pense que pour une même tâche, Fable 5 peut la terminer plus rapidement et avec de meilleurs résultats. Pour les développeurs, la qualité de la production prime sur le prix. Tant que le modèle peut améliorer significativement les résultats du projet, un prix élevé est acceptable.
Li Xia a également mentionné que pour les programmeurs, la qualité de la génération du modèle est directement corrélée aux revenus. Plus la qualité de production est élevée, plus les gains d'efficacité sont marqués, plus les retours sont importants. L'amélioration des capacités du modèle peut être directement convertie en qualité de projet et en économie de temps, ce qui renforce naturellement la volonté de payer.
Mais dans un autre contexte d'utilisation, la conclusion est différente.
Le blogueur AI Xu Zilong prend son utilisation quotidienne comme exemple : son travail quotidien comprend l'écriture de code, l'analyse de données et la rédaction d'articles de recherche. Il estime que les capacités en code des grands modèles actuels sont excessives, tandis que les capacités en texte sont insuffisantes. Pour des groupes comme les chercheurs, les créateurs de contenu, les professionnels du droit et de la finance, les besoins centraux en IA se concentrent sur la compréhension du chinois, l'écriture de textes longs et le traitement de documents.
Zhan Bo mentionne que la tendance actuelle n'est pas que les utilisateurs choisissent les modèles, mais que les modèles sélectionnent les utilisateurs. Les utilisateurs intensifs de programmation sont filtrés par les modèles haut de gamme, les utilisateurs occasionnels sont poussés vers des alternatives plus rentables. Cela montre que l'IA n'est plus un outil universel, mais qu'elle filtre progressivement les utilisateurs selon leur capacité de paiement et leur intensité d'utilisation.
Même le modèle le plus puissant ne vaut son prix que dans les mains de ceux qui en ont besoin.
03. L'ère où l'IA devient inabordable arrive-t-elle ?
La tarification API de Fable 5 est de 10 dollars en entrée, 50 dollars en sortie par million de tokens, soit le double d'Opus 4.8, et c'est actuellement le modèle de pointe accessible au public le plus cher au monde.
Comparaison des prix des API des principaux grands modèles
Mais ce qui mérite vraiment l'attention n'est pas que le prix ait doublé, c'est que le mode de paiement a changé.
Après le lancement de Fable 5, les utilisateurs abonnés aux formules Pro, Max, Team, etc., ont pu l'utiliser gratuitement pendant deux semaines. À partir du 23 juin, le modèle sera retiré des offres d'abonnement. Pour continuer à l'utiliser, il faudra acheter des crédits supplémentaires, facturés selon les tarifs de l'API. L'utilisation de Fable 5 pendant la période d'abonnement consomme également un volume deux fois supérieur à celui d'Opus 4.8.
Une période d'essai gratuite suivie d'un retrait des abonnements envoie également un signal : orienter les utilisateurs d'un forfait mensuel fixe vers un paiement à l'usage. L'avantage de l'abonnement est la certitude, l'utilisateur sait combien il dépense chaque mois ; le paiement à l'usage est plus avantageux pour la plateforme, plus on utilise, plus on paie, et le plafond de dépenses de l'utilisateur est relevé. En clair, Anthropic veut dire aux utilisateurs : les technologies les plus avancées ne devraient pas être incluses dans un forfait mensuel.
Le moment où se produit cette transition est également notable. Le 1er juin, Anthropic a justement soumis confidentiellement son prospectus d'introduction en bourse (IPO) à la SEC, avec une valorisation de 9 650 milliards de dollars, visant une entrée en bourse dès octobre de cette année. De début janvier à fin mai, le chiffre d'affaires annualisé d'Anthropic est passé de 9 à 47 milliards de dollars, Claude Code contribuant à plus de 2,5 milliards de dollars, et les clients entreprises apportant la grande majorité des revenus.
Une entreprise sur le point d'entrer en bourse doit démontrer sa capacité de croissance des revenus et son pouvoir de fixation des prix aux marchés financiers. Séparer le modèle le plus puissant des abonnements fixes et orienter les utilisateurs à haute valeur ajoutée vers un paiement à l'usage est logique d'un point de vue narratif financier.
Et les modèles chinois font exactement le contraire.
Fin mai, DeepSeek a annoncé une baisse permanente de 75 % du prix de l'API V4-Pro. Xiaomi a suivi peu après, avec une baisse de 99 % pour MiMo-V2.5-Pro, alignant presque ses prix sur ceux de DeepSeek.
D'un côté, DeepSeek abaisse les prix au plancher, de l'autre, Anthropic relève le plafond. Différents acteurs ont des approches différentes.
La baisse des prix des modèles chinois s'explique en partie par la libération des bénéfices technologiques ; l'architecture sous-jacente a changé, et l'espace économisé est utilisé pour conquérir un marché plus large.
La logique d'Anthropic est exactement inverse. Elle n'a pas besoin de conquérir le marché par les bas prix ; un prix élevé est en soi un filtre, qui permet de retenir les utilisateurs à haute valeur ajoutée prêts à payer pour des capacités de pointe.
Xu Zilong estime que l'IA deviendra de plus en plus chère à l'avenir, car l'expansion de la demande dépasse largement celle de l'offre. La puissance de calcul implique l'électricité, les puces, l'entraînement des modèles, et sa croissance est trop lente. La puissance de calcul de l'IA deviendra à l'avenir une infrastructure comme la 5G, mais contrairement à la 5G, l'offre de puissance de calcul est bien plus tendue que la bande passante, d'où la hausse des prix correspondante.
D'un point de vue commercial, l'industrie de l'IA est en train de développer une structure en couches similaire à celle du cloud computing à ses débuts. À la base, il y a des capacités génériques hautement standardisées, dont les prix tendent vers zéro, que tout le monde peut appeler, générant des revenus par le volume ; au sommet, il y a des capacités de pointe détenues par un petit nombre de fournisseurs, avec un pouvoir de fixation des prix concentré, générant des revenus par la valeur par client. Le prix des capacités génériques continuera à être comprimé, mais la prime des capacités de pointe existera longtemps.
De la différenciation des capacités à la stratification des paiements, l'industrie de l'IA reproduit la voie parcourue par le cloud computing. Les modèles bon marché sont de plus en plus nombreux, les meilleurs modèles sont de plus en plus chers.
*À la demande des personnes interrogées, Li Xia est un pseudonyme.
Cet article provient du compte public WeChat "AIX Finance", auteur : Lei Jing, éditeur : Jin Yufan









