Los días 18 y 19 de marzo, dos empresas chinas lanzaron sucesivamente sus grandes modelos de inteligencia artificial en la dirección Agent. La startup china de IA MiniMax presentó el M2.7, mientras que el equipo de modelos de lenguaje de Xiaomi, MiMo, lanzó el V2-Pro. Ambos modelos se situaron en la primera línea global en el benchmark de Agent, pero sus precios de salida de API son 1/21 y 1/8 del Claude Opus 4.6, respectivamente.
Ambas empresas jugaron sus cartas la misma semana, pero con manos completamente diferentes. Representan dos rutas tecnológicas截然 distintas, apostando por dos futuros diferentes en la era Agent.
El mismo examen, 1/17 de la matrícula
Primero, veamos la comparación más直观.
Según los datos de OpenRouter y las páginas de precios oficiales de las empresas, en términos de precio de salida de API (por millón de tokens), el MiniMax M2.7 es de 1.2 dólares, y el MiMo-V2-Pro es de 3 dólares. Como referencia, el precio de salida de Claude Opus 4.6 es de 25 dólares, GPT-5.2 es de 14 dólares, y Claude Sonnet 4.6 es de 15 dólares.
La brecha de precios es de órdenes de magnitud, pero la brecha de capacidad no lo es. En SWE-bench Verified (el benchmark más popular actualmente para medir la capacidad de ingeniería de código), el MiMo-V2-Pro obtuvo un 78%, y Sonnet 4.6 un 79.6%, con una diferencia de menos de dos puntos porcentuales. El resultado de M2.7 en SWE-Pro fue del 56.22%, igualándose con GPT-5.3-Codex. En VIBE-Pro (capacidad de entrega de proyectos de extremo a extremo), M2.7 obtuvo un 55.6%, acercándose al nivel de Opus 4.6.
El punto clave de esta imagen no está en quién es más alto o más bajo—los sistemas de benchmark de cada empresa no están completamente alineados, por lo que hay que ser cauteloso al comparar directamente. El punto clave está en esa "tijera de precio-rendimiento": los modelos Agent chinos ya se han colado en la misma banda de capacidad, pero se sitúan en rangos de precios completamente diferentes.
Billones de parámetros vs. Auto-evolución
El precio es solo la apariencia. Las dos empresas han mostrado dos cartas completamente diferentes.
El MiMo-V2-Pro sigue la ruta de "fuerza bruta para lograr milagros". Según el anuncio oficial de Xiaomi, el V2-Pro tiene más de 1 billón de parámetros totales, con 42B de parámetros activados, y admite un contexto ultra-largo de 1 millón de tokens. Su innovación central es el mecanismo de atención híbrida Hybrid Attention, que ajusta la proporción entre la atención de ventana deslizante (SWA) y la atención global (GA) a 7:1—la generación anterior V2-Flash era 5:1. Esta arquitectura hace que el modelo sea más estable al manejar documentos largos y escenarios Agent con llamadas paralelas a múltiples herramientas. En PinchBench (evaluación de la capacidad de llamada a herramientas Agent), el MiMo-V2-Pro obtuvo un 84%.
El M2.7 siguió un camino completamente diferente. Según el blog técnico oficial publicado por MiniMax el 18 de marzo, la cantidad de parámetros de M2.7 no se ha hecho pública, pero mostró un mecanismo de "evolución auto-iterativa": el modelo ejecuta autónomamente más de 100 ciclos de optimización, incluyendo análisis de trayectorias de fallo, planificación de modificaciones, modificación de su propia arquitectura de código, ejecución de evaluaciones y repetición del ciclo, logrando finalmente una mejora del 30% en el rendimiento en el conjunto de evaluación interno. En las 22 preguntas de alta dificultad de MLE Bench Lite (evaluación de dificultad en competiciones de aprendizaje automático), M2.7 consiguió 9 oros, 5 platas y 1 bronce, con una tasa media de medallas del 66.6%.
Desde cinco dimensiones, los enfoques de las dos rutas son completamente diferentes: el MiMo-V2-Pro es claramente superior en longitud de contexto e ingeniería de código, mientras que el M2.7 marca la diferencia en automatización de oficina y capacidad de auto-iteración. Según el mismo blog técnico de MiniMax, el M2.7 obtuvo una puntuación ELO de 1495 en GDPval-AA (evaluación de procesamiento de documentos de oficina), ocupando el primer lugar entre los modelos de código abierto, y mantuvo una tasa de seguimiento de habilidades del 97% en la prueba MM-Claw, que cubre más de 40 habilidades complejas.
Cuatro versiones en cinco meses
Las dos empresas no solo tienen rutas tecnológicas diferentes, sino también ritmos de iteración completamente distintos.
Según los registros de lanzamiento públicos, desde el lanzamiento de M2 en octubre de 2025 hasta el lanzamiento de M2.7 en marzo de 2026, MiniMax iteró cuatro versiones en cinco meses, con una media de una versión principal cada 49 días. El intervalo entre M2.5 y M2.7 fue de solo unos 30 días.
El ritmo de Xiaomi MiMo es diferente: lanzó MiMo-7B (modelo de inferencia de código abierto con 7B de parámetros) en abril de 2025, V2-Flash (309B de parámetros totales) en diciembre del mismo año, y V2-Pro (1T de parámetros totales) en marzo de 2026. Cada generación implica un salto mayor en la escala de parámetros, pero los intervalos entre versiones también son más largos.
MiniMax optó por pasos pequeños y rápidos, con iteraciones de amplitud pero frecuencia extremadamente alta, y el mecanismo de auto-iteración de M2.7 está diseñado precisamente para la "evolución continua". Xiaomi optó por un golpe concentrado, donde cada versión supone un gran salto en la escala de parámetros y la arquitectura.
8 días anónimos, llegando a la cima de OpenRouter
Además de la ruta tecnológica, la estrategia de lanzamiento de Xiaomi también rompió con las convenciones de la industria.
Según Reuters, el 11 de marzo, un modelo anónimo llamado Hunter Alpha apareció en OpenRouter, la mayor plataforma de agregación de API del mundo. Sin respaldo de marca, sin conferencia de prensa, sin blog técnico. Su precio de API era extremadamente bajo, pero su rendimiento era sorprendentemente fuerte.
La comunidad comenzó a especular sobre su origen. Según Republic World y varios medios de tecnología, la猜测 principal era DeepSeek V4, porque la responsable del equipo MiMo, Luo Fuli, había trabajado previamente en investigación en DeepSeek. El volumen de llamadas aumentó rápidamente, superando 1 billón de tokens durante el período anónimo, y llegó al primer lugar en el ranking semanal de OpenRouter.
En la madrugada del 19 de marzo, Xiaomi reveló la incógnita: Hunter Alpha era el MiMo-V2-Pro. Según el mismo informe de Reuters, las acciones de Xiaomi en Hong Kong experimentaron una subida de hasta el 5.8% tras la revelación.
Esta es la primera vez que un gran modelo chino se prueba a sí mismo a nivel mundial de forma completamente ciega. Sin depender de la marca, sin publicidad, usando 8 días para que los desarrolladores voten con los pies.










