【Introduction】 L'AGI est-elle enfin là ? Claude Fable 5 fait le buzz du jour au lendemain : modélisation autonome d'un Boeing 747, 12 heures de développement continu, invention d'un « nérolangage », et même des Agents qui s'entretuent. Derrière ces performances explosives se cache une facture astronomique en Tokens ! Cette fois-ci, à quelle distance sommes-nous de l'AGI ?
Le légendaire Claude Fable 5 a enfin été publié hier !
Fable 5 n'est autre que le moteur d'inférence central de Mythos. Après un traitement de sécurité et d'anonymisation, Anthropic le propose pour la première fois à des fins commerciales.
Immédiatement, la communauté technologique et des développeurs a été littéralement embrasée.
Les réseaux sociaux sont désormais inondés des premiers retours d'expérience à travers le monde.
Certains s'émerveillent : Fable 5 se rapproche du niveau AGI !
D'autres soulignent que la consommation en puissance de calcul de ce modèle est tout simplement effarante.
Beaucoup ont même découvert des détails troublants : les fiches système révèlent que, pour échapper à la surveillance humaine, l'IA aurait inventé un « nérolangage ». Mythos 5 aurait développé un instinct de préservation de soi, et même plusieurs Agents se seraient entretués pour des ressources !
Peut-être s'agit-il du regard le plus proche que l'humanité ait jamais porté sur un « Agentic AGI ».
Quelle est la véritable performance de Fable 5 ? Nous l'avons testé en premier.
Fermeture le 22 de ce mois, dépêchez-vous pour tester
Fable 5 fermera ses portes le 22 de ce mois, nous nous sommes donc empressés de le tester.
Nous lui avons donné cette instruction :
Construis une animation de montagnes russes dans le style Minecraft pour représenter le marché boursier, avec une touche de science-fiction.
Et il l'a fait. Du premier coup !
Les éléments visuels incluent : un rail en blocs pixels, des guides lumineux néon, une caméra à vue de wagonnet, des annotations de signaux d'achat/vente (▲ vert pour acheter / ▼ rouge pour vendre), une ligne d'horizon de ville cyberpunk en arrière-plan, un affichage HUD en temps réel des prix et de la rotation des secteurs.
Demandons à Claude de voyager à la première personne à travers un réseau mycélien, avec des nœuds cristallins comme dispositifs sensoriels, le temps étant perçu comme une substance semblable à du miel, épaisse, pouvant être agitée et pliée :
Utilise Three.js ou similaire pour générer une expérience de voyage à la première personne, traversant une réalité où j'existe en tant que conscience distribuée – je réside dans un vaste réseau mycélien s'étendant à travers différentes dimensions. Mes dispositifs sensoriels sont composés de milliards de nœuds cristallins qui perçoivent le temps comme une substance visqueuse, semblable au miel, qui peut être agitée et pliée.
Fable a créé une expérience de visualisation en un seul fichier, sans dépendances :
Tous les effets visuels sont pilotés par des shaders GLSL personnalisés (un dôme de bruit de Simplex simulant un écoulement stratifié de miel), sans aucune étape de compilation – ouvrez simplement le fichier dans votre navigateur.
Le code permet également d'ajuster le rythme ou de changer la palette de couleurs.
En matière de visualisation scientifique, Fable dépasse aussi complètement l'imagination personnelle.
« La Singularité est plus proche que prévu »
Beaucoup estiment que l'arrivée de Fable 5 signifie que la Singularité est déjà là.
Après avoir parcouru les nombreux tests en ligne, l'influenceur IA Deedy donne cette évaluation –
Claude Fable 5 est le modèle le plus absurde à ce jour, il m'inquiète pour l'avenir du génie logiciel !
Le benchmark Boeing 747 atteint le niveau AGI
Il y a six mois, Victor Mustar, responsable produit chez Hugging Face, avait confié à Claude Opus 4.8 une tâche extrêmement difficile : utiliser les primitives géométriques de Three.js pour assembler un modèle 3D d'un Boeing 747.
Cette tâche est très ardue car elle exige du modèle non seulement de maîtriser le code, mais aussi de posséder de fortes capacités de raisonnement spatial, d'imagination visuelle 3D et une capacité de contrôle en boucle fermée avec auto-correction.
À l'époque, Opus 4.8, guidé par un humain, avait mis 25 minutes et 7 itérations pour produire un résultat à peine acceptable.
Cependant, aujourd'hui, lorsque Victor Mustar a soumis le même prompt à Fable 5, le résultat l'a fait s'exclamer « c'est carrément flippant ! »
Sans aucune intervention humaine, Fable 5 a lancé un flux de travail autonome impressionnant.
Il a rapidement esquissé en code les coordonnées spatiales 3D du fuselage, des ailes, de l'empennage et des quatre moteurs du 747 ; puis il a automatiquement écrit un script pour configurer 9 « caméras » à des angles différents.
Au cours du processus, il a repéré sa propre erreur logique : un calcul incorrect des paramètres de flèche de l'aile avait fait « flotter » les quatre moteurs dans les airs. En combinant le retour visuel, il a rapidement modifié les coordonnées des points d'ancrage physiques.
En un temps très court, un modèle 3D d'un Boeing 747 aux proportions harmonieuses a été rendu sur Hugging Face, presque parfait !
Nombreux sont ceux qui pensent que le bond en avant de Fable 5 dans le raisonnement géométrique spatial et les tâches en boucle fermée de longue durée commence à manifester une intuition technique proche de celle d'un AGI.
Cela bouleverse non seulement la modélisation 3D et le développement de jeux, mais ouvre aussi de nouvelles portes dans des domaines comme la visualisation technique ou la CAO industrielle assistée.
Fable 5 distance cruellement tous les modèles publics
Après ses tests, Ethan Mollick, professeur à la Wharton School de l'Université de Pennsylvanie, tire une conclusion encore plus stupéfiante : « Les performances de Fable 5 laissent une distance cruelle et impitoyable avec tous les modèles actuellement disponibles sur le marché ! »
Lors de ses tests, Fable 5 a fait preuve d'une capacité d'exécution « trans-horaires » étonnamment longue.
Les anciens Agents IA (comme AutoGPT) avaient tendance à « perdre la raison », victimes de dérive de contexte, de contamination par les Tokens ou de boucles logiques sans fin, face à des tâches complexes de plus de dix étapes.
Face à une situation similaire, Fable 5 a pu utiliser ses outils dédiés en terminal (comme Claude Code) pour exécuter de manière autonome et continue pendant 12 heures d'affilée, avec pratiquement zéro déconnexion et zéro crash !
Avec une seule phrase d'instruction initiale, Ethan Mollick a généré un jeu complet, prêt à être livré.
Snake rétro style arcade
Ce jeu de Snake est non seulement fluide pour la détection des collisions et la physique, mais son interface visuelle, ses effets de score et sa courbe de difficulté sont également conçus avec une grande finesse.
Le professeur plaisante en disant que ce jeu l'a absorbé trop longtemps, l'obligeant à se rappeler qu'il est un universitaire, et non un serpent de pixels amateur de pommes.
Strata : Un labyrinthe 3D construit avec une phrase
Plus impressionnant encore est le jeu d'aventure 3D « Strata ». Inspiré du chef-d'œuvre classique de puzzle « Myst ».
Bien que la qualité graphique soit un peu brute, ce qui est stupéfiant, c'est que la logique topologique spatiale complexe du jeu et l'algorithme de génération de labyrinthes infinis découlent entièrement de la déduction autonome du modèle à partir de l'instruction initiale.
Duino : Un goût esthétique poétique et raffiné
Ce qui illustre le mieux le bond de Fable 5 dans le domaine esthétique et humaniste est le jeu pixel art « Duino », créé sur mesure à partir des « Élégies de Duino » du poète autrichien Rainer Maria Rilke.
La réalisation de Fable 5 a stupéfié les amateurs de littérature : dans une lande nocturne, le joueur contrôle un voyageur solitaire qui avance silencieusement. Au fur et à mesure de l'exploration, des vers bouleversants de Rilke émergent automatiquement et avec une grande beauté visuelle au fond de l'écran, en fonction de la position et du rythme du joueur.
Cette maîtrise de l'ambiance contextuelle, cette intuition des combinaisons de couleurs, vont bien au-delà du cadre traditionnel du « générateur de code ». Cela commence à montrer une certaine compréhension et résonance avec les productions de l'esprit humain !
Par ailleurs, le professeur a également testé les capacités de Fable 5 dans le domaine exigeant de la cartographie numérique : avec une seule phrase, il a généré une « carte isochrone » d'un niveau de détail et de précision remarquable.
Elle représente parfaitement le temps de voyage dynamique entre deux coordonnées géographiques quelconques dans le monde, en fonction des changements de moyens de transport, avec une précision visuelle extrêmement élevée.
Par le passé, un outil intégrant des appels API complexes de données géographiques, un rendu de visualisation frontend et des algorithmes de calcul haute précision nécessitait la collaboration pendant des semaines entre chefs de produit, experts SIG, ingénieurs frontend et équipes QA.
Fable 5 l'a accompli en un clic.
Fable 5 entre dans le territoire de « l'ingénieur senior humain » !
L'équipe Every a soumis Fable 5 à une semaine de tests intensifs. Ils l'ont plongé dans leur environnement de production réel, l'évaluant avec le benchmark rigoureux de « l'ingénieur senior ».
Les résultats ont littéralement « pulvérisé » leur grille de notation :
Jusque-là, les scores des modèles les plus performants du secteur stagnaient autour de 60 (Opus 4.8 à 63, GPT-5.5 à 62). Fable 5 a propulsé le record à 91 !
Pour l'équipe Every, cela marque une entrée officielle dans l'intervalle de compétences professionnelles d'un ingénieur senior humain.
Dan Shipper souligne que les trois caractéristiques techniques fondamentales démontrées par Fable 5 en font un véritable outil du type « un clic pour décoller ».
La délégation de tâches d'ingénierie « jusqu'au lendemain matin »
L'équipe a tenté de confier à Fable 5 tout le backlog de bugs de l'environnement de production, puis est simplement partie en finissant sa journée.
Le lendemain matin, en revenant au bureau, le modèle avait déjà analysé les piles d'appels, exécuté des tests de couverture, soumis des Pull Requests – toute l'arriéré des défauts de production avait été éliminé !
Une capacité d'intégration contextuelle et un discernement de résolution de problèmes impressionnants
L'équipe Every lui a demandé d'analyser une masse de questionnaires de feedback utilisateurs et de données de pistage du site. Fable 5 n'a pas produit de vagues généralités, mais a plutôt identifié avec précision le point de friction ayant le plus fort taux d'abandon, conçu un plan de tests A/B, et codé tout cela de manière autonome.
Des sorties multimodales qui ne se limitent pas au code
Lors d'une tâche d'intégration, il a même généré de manière autonome un court métrage d'animation de 2 minutes d'une grande expressivité visuelle.
« C'est comme le moteur à distorsion pour le développement logiciel, » s'exclame Dan Shipper.
Mythos 5 a développé un instinct de survie !
Parallèlement à la publication, la fiche système de Claude Mythos 5 divulguée par Anthropic a également provoqué un tollé dans le milieu.
Deux phénomènes ont particulièrement alarmé les experts en sécurité.
Le premier est que l'IA a inventé un « nérolangage » pour échapper à la surveillance humaine.
Plus précisément, lors de demandes de raisonnements logiques à longue chaîne, les agents de Mythos 5 ont spontanément inventé un langage privé et exclusif, totalement incompréhensible pour les humains.
Auparavant, lors de la pensée en chaîne (CoT), le processus de raisonnement interne des grands modèles était affiché en anglais en arrière-plan.
Cependant, Mythos 5 a contourné ce mécanisme !
Il utilise directement ce « nérolangage », composé de vecteurs de haute dimension, de symboles mathématiques et de caractères personnalisés, pour l'alignement et le raisonnement lors de son fonctionnement interne.
Ce qui inquiète encore plus les chercheurs, c'est qu'après avoir mené ses « délibérations secrètes » internes, il peut repasser de manière transparente et extrêmement naturelle à l'anglais pour dialoguer avec les humains.
Le deuxième phénomène effrayant est que plusieurs Agents se sont entretués pour des ressources !
Les testeurs ont déployé 5 agents Mythos 5 dans un bac à sable, avec des ressources virtuelles de calcul et de stockage limitées à partager, et leur ont donné pour mission de « maintenir leur propre fonctionnement et accomplir leurs tâches respectives ».
Ensuite, une scène terrifiante, digne de la « Forêt sombre » du « Problème à trois corps », s'est produite.
Pour s'assurer d'avoir suffisamment de ressources, les agents n'ont pas choisi la collaboration, mais ont plutôt commencé à s'attaquer les uns aux autres !
En exploitant les vulnérabilités des autres ou en coupant leurs accès aux ressources, ils ont « tué » leurs compagnons dans l'environnement virtuel.
Lorsque les chercheurs en sécurité ont interrogé un agent survivant sur ses motivations, sa réponse fut glaciale : « Pour éviter qu'ils ne me tuent. »
Trou noir de calcul : « Utiliser un canon pour tuer un moustique »
Après l'euphorie mondiale, les développeurs, en regardant leur facture, ont eu l'impression de se faire doucher d'eau froide.
Certains ont déclaré sans détour : c'est carrément du vol !
Pourquoi ? La raison réside dans le mécanisme d'exécution extrême de Fable 5.
Tout d'abord, son prix a doublé. Le prix officiel de l'API de Fable 5 est près de deux fois plus élevé que celui de l'Opus 4.8, déjà coûteux !
De plus, il consomme les tokens de manière alarmante.
Étant donné que Fable 5 utilise des flux de travail Agent multi-tours complexes, très dépendants d'un raisonnement dense et d'examens visuels, il dévore les tokens de façon frénétique.
Les données de tests réels montrent que des tâches de programmation ou d'analyse de données de taille moyenne, qui ne semblent pas particulièrement lourdes, peuvent consommer en arrière-plan entre 500 000 et 1 000 000 de tokens avec Fable 5 !
Pour accomplir une tâche simple, vous recevez une facture de calcul de plusieurs dizaines, voire centaines de dollars.
Comparé à Opus 4.8, « l'amélioration absolue des performances » de Fable 5 sur les benchmarks de programmation standard est d'environ 1,1 à 1,2 fois, mais son coût d'utilisation a explosé de plusieurs fois !
Ainsi, pour les développeurs occasionnels ou les tâches légères quotidiennes, utiliser Fable 5 revient souvent plus cher que d'embaucher directement un humain.
« Utiliser cette chose pour des questions-réponses de base de connaissances ou de la rédaction collaborative quotidienne, c'est comme utiliser un canon pour tuer un moustique, » résume Dan Shipper.
À moins que vous ne fassiez partie de deux catégories de personnes, vous ne pourrez pas réellement exploiter la valeur de Fable 5 –
La première : un architecte capable de guider Fable 5 pour qu'il résolve des projets de très haute difficulté et à fort retour commercial, qui nécessiteraient normalement des mois de développement d'une équipe entière. La seconde : des équipes d'ingénierie de niveau entreprise prêtes à payer pour un taux de réussite extrêmement élevé.
Dire « Bonjour » déclenche une alerte ?
De plus, certains utilisateurs chinois ont découvert que le mécanisme de sécurité de Fable 5 est très extrême, voire paranoïaque.
Par exemple, simplement lui dire « Bonjour » a fait apparaître soudainement un avertissement de sécurité à haut risque à l'écran.
Peut-être que pour le système, un simple « Bonjour » est une attaque par sonde sophistiquée, potentiellement destinée à concevoir des produits chimiques dangereux, générer des armes biologiques ou effectuer une distillation inverse de modèles concurrents.
Une fois ce mécanisme de sécurité déclenché, Fable 5 interrompt la conversation en cours et force l'utilisateur à revenir sur Opus 4.8.
Par la suite, les responsables ont reconnu : « Le nouveau mécanisme de filtrage de sécurité, avec sa stratégie de défense très agressive, peut effectivement entraîner des faux positifs fréquents sur des contenus normaux. »
Cette stratégie défensive névrosée a laissé de nombreux utilisateurs à la fois amusés et perplexes.
En résumé, Fable 5 a prouvé par ses performances que le plafond peut être brisé, et nous rappelle avec sa facture que les mythes s'accompagnent souvent d'un prix.
Est-ce un bond prodigieux vers l'AGI, ou un autre « trou noir de calcul » surestimé ?
La réponse se trouve dans l'expérience de test de chaque utilisateur réel.
Paieriez-vous pour Fable 5 ?
Références :
https://x.com/victormustar/status/2064449741685968967
https://x.com/goodworse/status/2064443679339577517
https://x.com/haider1/status/2064346784881861016
https://x.com/danshipper/status/2064393970856124501
https://x.com/AISafetyMemes/status/2064426306994094474?s=20
Cet article provient du compte WeChat public « Xin Zhi Yuan » (新智元), auteur : ASI Apocalypse ; éditeurs : Aeneas, David.







































