Par | Alphabet AI
Cela fait environ dix mois que Wang Tao (Alexandr Wang) a rejoint Meta, le monde est passé d'un été à un autre, et l'« avocat » de Meta est enfin mûr.
Le 8 avril, heure locale, Meta a officiellement annoncé le lancement de Spark, le premier modèle de la série Muse. C'est également le premier plat servi par Meta après avoir intégré Wang Tao et créé le « Meta Superintelligence Labs (MSL) ».
Wang Tao a publié plusieurs messages sur X pour présenter le nouveau modèle, déclarant : « Il y a neuf mois, nous avons reconstruit la pile technologique d'intelligence artificielle à partir de zéro, incluant une toute nouvelle infrastructure, architecture et pipeline de données. Muse Spark est le fruit de ce travail. »
Même Yann LeCun, l'ancien scientifique en chef de Meta, dont on disait qu'il était en conflit avec Wang Tao, est venu le féliciter, créant une atmosphère harmonieuse.
Meta a souligné que la conception de Spark visait à être « compacte et rapide ». Présenter un tel modèle en premier plutôt que de « retenir son coup » pour sortir directement un modèle écrasant montre que Meta sait que le temps presse.
Pour l'instant, cette stratégie a fonctionné : le cours de l'action de Meta a augmenté d'environ 9 % ce jour-là.
01 Le nouveau modèle Muse Spark
Voyons d'abord quel modèle Meta a lancé.
Le nouveau modèle s'appelle Muse Spark, Muse étant le nom de la série de modèles. Ce nom est assez intéressant : Muse fait référence aux « Muses », et Spark signifie « étincelle ».
Meta indique que Muse Spark est le modèle le plus puissant de Meta à ce jour. Il alimente actuellement les applications et sites web de Meta AI, et sera déployé dans les prochaines semaines sur WhatsApp, Instagram, Facebook, Messenger et les lunettes AI. Meta proposera également une préversion privée du modèle via une API à certains partenaires.
Il est clair que Meta veut tirer pleinement parti de son avantage de plateforme, affirmant clairement que Muse Spark est conçu spécifiquement pour les produits Meta.
Il fournira un support plus intelligent et plus rapide à Meta AI, et débloquera au fil du temps de nouvelles fonctionnalités pouvant s'appuyer sur les contenus recommandés et les informations partagées par les utilisateurs sur Instagram, Facebook et Threads.
« Nous avançons vers l'objectif d'une superintelligence personnelle : créer un assistant intelligent capable d'aider n'importe qui, n'importe quand, à gérer ce qui compte le plus pour eux. »
Muse Spark a été conçu pour être compact et rapide, mais suffisamment capable pour traiter des problèmes complexes dans les domaines scientifiques, mathématiques et de la santé. Son cœur est un modèle de raisonnement multimodal natif.
Contrairement aux versions précédentes qui « collaient » ensemble le visuel et le texte, Muse Spark a été reconstruit à partir de l'architecture de base, intégrant l'information visuelle dans sa logique interne. Ce changement d'architecture permet une « chaîne de pensée visuelle », permettant au modèle d'annoter des environnements dynamiques – par exemple, identifier les composants d'une machine à café complexe, ou corriger la posture de yoga d'un utilisateur via l'analyse vidéo côte à côte.
Cependant, le saut technologique le plus important est l'ajout d'un mode « réflexion ».
Meta affirme que cette fonctionnalité coordonne plusieurs sous-agents pour un raisonnement parallèle, permettant à Meta de rivaliser avec des modèles de raisonnement extrême comme Gemini Deep Think de Google et GPT-5.4 Pro d'OpenAI.
En termes de résultats de test sur un seul modèle.
Le nouveau modèle Muse Spark de Meta affiche des performances remarquables sur l'Indice d'Intelligence Artificielle d'Artificial Analysis. Il a obtenu un score de 52, se classant 4ème mondial. Devant lui se trouvent respectivement Gemini 3.1 Pro et GPT-5.4 (tous deux autour de 57 points), et Claude Opus 4.6 (environ 53 points).
Comparé au score de seulement 18 de Llama 4 Maverick l'année dernière, c'est une amélioration significative, montrant que Meta a clairement comblé son retard sur les modèles de pointe.
Points forts et points faibles spécifiques :
. Raisonnement scientifique de niveau doctoral (GPQA Diamond) : Muse Spark a atteint une précision de 89,5 %, performance assez solide, mais légèrement derrière Gemini 3.1 Pro (94,3 %), GPT-5.4 (92,8 %) et Claude Opus 4.6 (92,7 %).
. Compréhension des graphiques et du visuel (CharXiv Reasoning, en mode Contemplation) : Score de 86,4, surpassant nettement les concurrents dans cette tâche de raisonnement visuel multimodal – meilleur que Gemini 3.1 Pro (80,2), GPT-5.4 (82,8) et Claude Opus 4.6 (65,3). La compréhension visuelle et le raisonnement graphique sont des points forts majeurs de Muse Spark.
. Raisonnement médical complexe (HealthBench Hard) : Score de 42,8 %, devançant largement tous les principaux concurrents, incluant GPT-5.4 (40,1 %), Gemini 3.1 Pro (20,6 %) et Claude Opus 4.6 (14,8 %). Meta indique que cela est dû à un entraînement ciblé mené en collaboration avec plus de 1000 médecins ; les capacités liées à la santé sont un de ses points forts.
. Ingénierie logicielle et codage (SWE-Bench Verified) : Score de 77,4 %, derrière Claude Opus 4.6 (80,8 %) et Gemini 3.1 Pro (80,6 %). Meta reconnaît lui-même qu'il reste des lacunes dans les tâches autonomes longues et multi-étapes (agentic tasks) et les workflows de codage complexes, nécessitant des investissements continus.
. Compréhension multimodale et multidisciplinaire (MMMU Pro) : Score d'environ 80,4–80,5 %, juste derrière Gemini 3.1 Pro (83,9 %), se classant deuxième dans les tâches visuelles multimodales.
Dans l'ensemble, Muse Spark excelle dans le raisonnement multimodal visuel, le domaine médical et le raisonnement efficace, étant particulièrement adapté à l'écosystème social, de contenu et de santé de Meta ; mais il a encore du retard à combler dans le codage pur et les tâches autonomes longues.
02 L'« avocat » plusieurs fois reporté
Sur X, un petit incident intéressant s'est produit.
En tant que responsable actuel de l'IA chez Meta, Wang Tao (Alexandr Wang) a posté de nombreux messages sur X pour promouvoir le nouveau modèle.
À ce moment-là, quelqu'un a pointé du doigt que le graphique de benchmark fourni par Meta était trop trompeur, « presque criminel ». Sur ce graphique, les scores de Muse Spark étaient dans la première colonne et tous surlignés de manière prominente. À première vue, on avait l'impression d'une avance générale, mais en regardant de plus près, certains scores étaient en fait plus bas.
Jouer sur les graphiques n'est pas nouveau, OpenAI ayant déjà été critiqué plusieurs fois pour cela.
Il est intéressant de noter que Wang Tao a cette fois choisi de s'excuser immédiatement, répondant à la critique :
« Désolé, nous n'avons pas voulu suggérer que nos scores étaient les plus élevés. Au contraire, la plupart des résultats d'évaluation montrent que notre modèle a encore beaucoup de progrès à faire. Nous ne répéterons pas cette erreur. »
Il n'est pas difficile de voir que Meta ne cherche pas non plus à ce que Muse Spark soit écrasant de manière exhaustive, mais plutôt à revenir dans la course de l'IA.
D'après divers signes, la série Muse devrait être le projet au nom de code interne « Avocado » (Avocat) chez Meta.
L'avocat a été reporté trop longtemps, et Meta adopte désormais une stratégie « petit d'abord, grand ensuite ». Meta souligne dans son article officiel que Spark mise sur la rapidité et la compacité, ce n'est qu'un début :
« Notre modèle évolue comme prévu. Muse Spark est un point de données précoce dans notre parcours de développement, et nous travaillons sur des modèles plus grands. »
Cela contraste avec le rythme habituel du secteur de l'IA (surtout parmi les leaders) qui aime « faire sensation » et « épater », mais Meta n'a vraiment plus le temps de prendre son temps.
Début de l'année dernière, après la sortie de la série Llama 4, les performances du modèle n'ont pas répondu aux attentes (en particulier la performance insuffisante du grand modèle Behemoth), conduisant à une pause dans le développement open source ultérieur de la série Llama.
À l'été dernier, Meta a investi 143 milliards de dollars dans Scale AI (détenant 49 % des actions) et a directement recruté le fondateur et PDG de Scale AI, Wang Tao (Alexandr Wang), âgé de 28 ans, en tant que directeur de l'IA, créant officiellement les Meta Superintelligence Labs (MSL).
Simultanément, Meta s'est lancé dans une chasse aux talents frénétique, recrutant à grands frais des dizaines de chercheurs de premier plan auprès d'OpenAI, Google et autres, certaines offres atteignant des millions voire des milliards de dollars.
En termes de coûts, les dépenses en capital liées à l'IA de Meta pour l'année 2025 ont atteint 72,22 milliards de dollars ; les prévisions financières de janvier 2026 indiquent que ce chiffre augmentera considérablement pour atteindre 1150 à 1350 milliards de dollars, presque le double, principalement destinés à l'entraînement des modèles du MSL et à l'expansion des centres de données.
Au cours de ces dix derniers mois, Meta, ainsi que Mark Zuckerberg et le responsable de l'IA de Meta, Wang Tao, ont été sous une énorme pression. Les gens étaient impatients de voir quel plat serait servi après l'arrivée de Wang Tao et la restructuration de Meta.
Au moins, selon la réaction immédiate du marché, la stratégie de Meta d'abandonner le « big bang » pour servir d'abord un petit plat a fonctionné : le cours de l'action de Meta a grimpé de près de 9 % ce jour-là, enregistrant sa plus forte hausse quotidienne depuis janvier de cette année. À la clôture, Meta a gagné 6,5 %.
Une information à noter est que le monde extérieur pensait que « l'avocat » passerait complètement en mode propriétaire (closed-source), mais Meta n'a pas fermé la porte cette fois. À l'avenir, Meta pourrait adopter une stratégie hybride, open source et propriétaire, en conservant les modèles phares et les technologies exclusives en interne tout en maintenant la disponibilité open source de modèles plus frais pour la large communauté de développeurs.
Meta a finalement mis « l'avocat » sur la table, mais ce n'est de loin pas la fin. Pour Wang Tao et Mark Zuckerberg, Muse Spark ressemble plus à un coup de pistolet de départ. L'avenir dépendra de la capacité à tenir la promesse de modèles « de plus en plus puissants ».













