Le Phénomène Inattendu Japonais de l'IA : Comment un Petit Modèle de 7B Défie Fable et Mythos ?
En juin 2026, Sakana AI, basée à Tokyo, a présenté Fugu, un modèle d'IA qui défie les attentes. Malgré sa taille modeste de seulement 7 milliards de paramètres, son système "Fugu Ultra" obtient des scores élevés (73,7 sur SWE-Bench Pro et 82,1 sur TerminalBench 2.1), surpassant des géants comme GPT-5.5 et Claude Opus 4.8. Son secret ? Fugu n'est pas un modèle monolithique, mais un "chef d'orchestre" (RL Conductor). Ce petit modèle utilise l'apprentissage par renforcement pour analyser une tâche utilisateur, puis la décompose et la route dynamiquement vers un pool d'agents spécialisés utilisant les meilleurs modèles externes (GPT, Gemini, Claude, etc.). Il valide et synthétise leurs réponses.
Cette architecture d'orchestration multi-agents permet à Fugu d'exceller dans des tâches complexes et multi-étapes comme la revue de code approfondie, les tests de sécurité complets ou la stabilité dans les conversations longues, tout en économisant des tokens. Cette approche représente une voie d'innovation "asymétrique" pour le Japon, confronté à des contraintes de calcul et de données. Plutôt que de concurrencer frontalement les modèles géants, Sakana AI crée un système intelligent pour exploiter au mieux les capacités existantes.
Cependant, cette force est aussi sa faiblesse : Fugu dépend fortement des API des grands modèles américains, ce qui pose des risques de stabilité, de coût et de latence. De plus, ses comparaisons avec des modèles de pointe sous restrictions à l'export (comme Fable 5) sont basées sur des rapports publics et non sur des tests directs, suscitant des débats. En résumé, Fugu est une innovation système brillante qui change la donne pour les workflows complexes, mais ses utilisateurs doivent être conscients de ses dépendances sous-jacentes.
marsbitIl y a 40 mins