Les 18 et 19 mars, deux entreprises chinoises ont successivement publié leurs grands modèles orientés Agent. La startup chinoise d'IA MiniMax a lancé M2.7, tandis que l'équipe de grands modèles de Xiaomi, MiMo, a présenté V2-Pro. Les deux modèles se classent dans le premier groupe mondial sur le benchmark Agent, mais leurs prix de sortie d'API sont respectivement 1/21 et 1/8 de celui de Claude Opus 4.6.
Ils ont joué leurs cartes la même semaine, mais avec des jeux complètement différents. Ils représentent deux voies technologiques radicalement distinctes, parient sur deux avenirs possibles pour l'ère des Agents.
Le même examen, des frais de scolarité 17 fois moins chers
Commençons par la comparaison la plus直观的 (évidente).
Selon les données d'OpenRouter et des pages de tarification officielles des entreprises, en se basant sur le prix de sortie d'API (par million de tokens), le MiniMax M2.7 coûte 1,2 dollar, le MiMo-V2-Pro coûte 3 dollars. Pour référence, le prix de sortie de Claude Opus 4.6 est de 25 dollars, GPT-5.2 de 14 dollars, et Claude Sonnet 4.6 de 15 dollars.
L'écart de prix est d'un ordre de grandeur, mais pas l'écart de capacités. Sur le SWE-bench Verified (le benchmark le plus courant pour mesurer les capacités d'ingénierie logicielle), le MiMo-V2-Pro obtient 78 %, Sonnet 4.6 obtient 79,6 %, l'écart est inférieur à deux points de pourcentage. Le score SWE-Pro du M2.7 est de 56,22 %, à égalité avec GPT-5.3-Codex. Sur le VIBE-Pro (capacité de livraison de projet de bout en bout), le M2.7 obtient 55,6 %, proche du niveau d'Opus 4.6.
Le point important de ce graphique n'est pas de savoir qui est le meilleur - les systèmes de benchmark de chaque acteur ne sont pas parfaitement alignés, les comparaisons directes doivent être prudentes. L'important est ce « différentiel prix-performance » : les modèles Agents chinois ont déjà intégré la même bande de capacités, mais se positionnent dans des fourchettes de prix complètement différentes.
Milliers de milliards de paramètres vs Auto-évolution
Le prix n'est que la surface. Les deux entreprises ont sorti deux jeux de cartes complètement différents.
Le MiMo-V2-Pro suit la voie de la « force brute ». Selon l'annonce officielle de Xiaomi, le V2-Pro possède plus de 1 000 milliards de paramètres au total, 42 milliards de paramètres activés, et supporte un contexte ultra-long de 1 million de tokens. Son innovation principale est le mécanisme d'attention hybride Hybrid Attention, qui ajuste le ratio entre l'attention par fenêtre glissante (SWA) et l'attention globale (GA) à 7:1 — le ratio était de 5:1 pour la génération précédente V2-Flash. Cette architecture rend le modèle plus stable dans les scénarios Agent traitant de longs documents ou faisant appel à plusieurs outils en parallèle. Sur le PinchBench (évaluation des capacités d'appel d'outils des Agents), le MiMo-V2-Pro obtient 84 %.
Le M2.7 emprunte une voie totalement différente. Selon le blog technique officiel publié par MiniMax le 18 mars, la quantité de paramètres du M2.7 n'est pas divulguée, mais il présente un mécanisme d'« évolution par auto-itération » : le modèle exécute de manière autonome plus de 100 cycles d'optimisation, incluant l'analyse des échecs, la planification des modifications, la modification de sa propre architecture de code, l'exécution d'évaluations, et une nouvelle itération, pour finalement réaliser une amélioration de 30 % des performances sur son jeu d'évaluation interne. Sur les 22 problèmes de haute difficulté du MLE Bench Lite (évaluation de difficulté de compétition de machine learning), le M2.7 remporte 9 médailles d'or, 5 d'argent et 1 de bronze, avec un taux moyen de médaille de 66,6 %.
Sur cinq dimensions, les orientations des deux approches sont totalement différentes : le MiMo-V2-Pro est nettement supérieur en longueur de contexte et en ingénierie logicielle, tandis que le M2.7 creuse l'écart en automatisation bureautique et capacité d'auto-itération. Selon le même blog technique de MiniMax, le M2.7 obtient un ELO de 1495 sur GDPval-AA (évaluation du traitement de documents bureautiques), se classant premier parmi les modèles open source, et maintient un taux de conformité aux compétences de 97 % dans le test MM-Claw couvrant plus de 40 compétences complexes.
Quatre versions en cinq mois
Non seulement les voies technologiques diffèrent, mais aussi les rythmes d'itération.
D'après les archives des publications publiques, MiniMax a itéré quatre versions majeures en cinq mois, d'octobre 2025 (publication de M2) à mars 2026 (publication de M2.7), soit une version majeure en moyenne tous les 49 jours. L'intervalle entre M2.5 et M2.7 n'était que d'environ 30 jours.
Le rythme de Xiaomi MiMo est différent : publication de MiMo-7B (modèle d'inférence open source de 7B paramètres) en avril 2025, publication de V2-Flash (309B paramètres totaux) en décembre 2025, et publication de V2-Pro (1T paramètres totaux) en mars 2026. Les sauts d'échelle de paramètres entre chaque génération sont plus importants, mais les intervalles entre versions sont aussi plus longs.
MiniMax a choisi d'avancer par petits pas rapides, avec des amplitudes d'itération modestes mais une fréquence très élevée, le mécanisme d'auto-itération du M2.7 étant lui-même conçu pour une « évolution continue ». Xiaomi a choisi de concentrer ses forces pour porter un coup puissant, chaque version représentant un saut majeur en termes d'échelle de paramètres et d'architecture.
Anonymat pendant 8 jours, sommet d'OpenRouter
Outre la voie technologique, la stratégie de lancement de Xiaomi a également brisé les conventions du secteur.
Selon un reportage de Reuters, le 11 mars, un modèle anonyme nommé Hunter Alpha est apparu sur OpenRouter, la plus grande plateforme d'agrégation d'API au monde. Sans背书 de marque, sans conférence de presse, sans blog technique. Son prix d'API était extrêmement bas, mais ses performances étonnamment solides.
La communauté a commencé à spéculer sur son origine. Selon Republic World et de nombreux médias technologiques, l'hypothèse principale était qu'il s'agissait de DeepSeek V4, car la responsable de l'équipe MiMo, Luo Fuli, avait précédemment effectué des recherches chez DeepSeek. Le volume d'appels a rapidement augmenté, dépassant 1 000 milliards de tokens pendant la période d'anonymat, et atteignant la première place du classement hebdomadaire d'OpenRouter.
À l'aube du 19 mars, Xiaomi a levé le voile : Hunter Alpha était le MiMo-V2-Pro. Selon le même reportage de Reuters, l'action de Xiaomi à Hong Kong a connu une hausse pouvant atteindre 5,8 % après cette annonce.
C'est la première fois qu'un grand modèle chinois se prouve sur une plateforme mondiale par un test entièrement aveugle. Sans s'appuyer sur la marque, sans publicité, en laissant les développeurs voter avec leurs pieds en 8 jours.










