El ámbito global de los modelos de gran capacidad está experimentando una ola de financiación que los profesionales del sector definen como "la víspera de un proceso de consolidación".
Aún sin haber concluido mayo, tres transacciones que suman más de 70.000 millones de dólares han inundado el mercado chino: Kimi completó una ronda de financiación de unos 20.000 millones de dólares a principios de mes, StepFun (Step Fun) está cerca de finalizar una ronda cercana a los 25.000 millones de dólares, y la valoración de DeepSeek, tras aceptar financiación externa por primera vez, ha alcanzado un rango de entre 45.000 y 50.000 millones de dólares.
En los mercados de Europa y Estados Unidos, OpenAI, Anthropic y SpaceX tras su fusión con xAI de Musk, prevén cotizar en bolsa este mismo año, con una valoración combinada que supera los 3 billones de dólares.
Esta corriente de capital transoceánica fluye hacia los últimos jugadores líderes del sector de los modelos de gran capacidad con una velocidad y escala sin precedentes. Es crucial notar que no todas las compañías consiguen financiación; al contrario, para la inmensa mayoría, la música ya se ha detenido.
Pero para las pocas que sí logran obtener capital, este podría ser el último tren hacia el siguiente escalón.
01
El juego de las sillas musicales entra en su fase final
Desde principios de año, el sector chino de modelos de gran capacidad ha presentado al mercado de capitales dos respuestas de gran peso.
Primero, el 8 de enero, Zhipu AI, fundada hace seis años, debutó oficialmente en la Bolsa de Hong Kong, obteniendo el título de "primera acción de modelos de gran capacidad del mundo" con un precio de emisión de 11,6 HKD por acción. En su primer día, las acciones cerraron con una subida del 13,17%, alcanzando una capitalización de mercado de 57.900 millones de HKD.
Solo un día después, MiniMax, fundada a principios de 2022, también cotizó en la Bolsa de Hong Kong, disparándose un 109,09% en su primer día y superando con creces el umbral de los 100.000 millones de HKD, estableciendo un nuevo récord mundial para la IPO más rápida de una empresa de IA desde su fundación.
Además, tras sus respectivas salidas a bolsa, los precios de sus acciones han seguido subiendo. Hasta el 15 de mayo, Zhipu AI subió desde el precio de emisión de 116,2 HKD hasta un máximo de 1.229 HKD, multiplicándose más de 10 veces en cuatro meses. MiniMax también ha dibujado una curva de crecimiento casi vertical.
JPMorgan Chase, en un reciente informe de investigación, mantuvo su calificación de "sobreponderar" para ambas empresas, pero emitió un juicio sobrio: la valoración del mercado ya incorpora las perspectivas de que Zhipu AI alcance unos ingresos recurrentes anualizados (ARR) de 1.000 millones de dólares, y MiniMax 700 millones de dólares, para finales de 2026.
El frenesí del mercado secundario se contagió rápidamente al mercado primario.
El 6 de mayo, se filtró que Moonshot AI (Kimi) estaba a punto de completar una nueva ronda de financiación de unos 20.000 millones de dólares, con una valoración post-inversión que superaba los 20.000 millones de dólares. Esta ronda fue liderada por Meituan Longzhu Capital, con participación de China Mobile, CPE (China Partners Equity) y otros, donde Longzuh invirtió más de 200 millones de dólares.
Sumando las tres rondas desde finales del año pasado, Moonshot AI ha recaudado más de 3.900 millones de dólares en seis meses, con una financiación total superior a los 37.600 millones de yuanes (RMB), convirtiéndose en la startup de modelos de gran capacidad china con mayor financiación acumulada.
Otra empresa estrella, DeepSeek, que causó un revuelo global en el círculo de la IA en 2025 con su modelo DeepSeek-R1, había mantenido previamente una línea de "no aceptar capital externo". Pero esta primavera, la dirección del viento cambió.
Según informó The Wall Street Journal el 7 de mayo, DeepSeek está recaudando decenas de miles de millones de dólares de inversores respaldados por el gobierno, y el Fondo Nacional de Inversión en la Industria de Inteligencia Artificial está negociando profundamente su participación en la ronda.
Según informaron personas familiarizadas con el asunto, el propio Liang Wenfeng (presumiblemente su fundador) planea suscribir personalmente 20.000 millones de yuanes. Según cálculos del sector, la valoración post-inversión podría superar los 50.000 millones de dólares.
Además, se filtró que StepFun completará una ronda de financiación de casi 25.000 millones de dólares, ha desmantelado su estructura VIE y se está preparando intensamente para su IPO en Hong Kong. Entre sus inversores aparecen empresas de la cadena de suministro de electrónica de consumo como Huaqin Technology, Longcheer Technology y ZTE.
Shengshu Technology completó dos grandes rondas de financiación en 2026: una ronda A+ de más de 600 millones de yuanes y una ronda B de casi 20.000 millones de yuanes, acumulando casi 26.000 millones de yuanes en menos de 4 meses.
El proveedor de servicios de infraestructura nativa de IA, Infinite Bit, también anunció oficialmente el 7 de mayo la finalización de una ronda B de financiación de más de 700 millones de yuanes.
Si desviamos la mirada de China hacia la otra orilla del Pacífico, los protagonistas de este festín de capital son aún más grandes.
Según la información pública actual, SpaceX planea cotizar en NASDAQ en junio, con una valoración objetivo de 1,75 billones de dólares. Si se materializa, superaría a Saudi Aramco como la mayor IPO de la historia. OpenAI planea salir a bolsa en el cuarto trimestre, con una valoración estimada de unos 852.000 millones de dólares. Anthropic también planea cotizar este año, y su valoración en el mercado secundario ya supera el billón de dólares.
Solo en las rondas de financiación del mercado primario completadas en febrero y marzo, OpenAI y Anthropic ya han absorbido cada una cientos de miles de millones de dólares en munición. Las tres ballenas juntas tienen una valoración combinada de más de 3 billones de dólares, superando con creces cualquier combinación de IPOs tecnológicos pasados.
Esta carrera de números delinea un hecho central: el capital se está concentrando a una velocidad irreversible en un puñado extremadamente reducido de jugadores líderes del sector.
Haciendo retrospectiva, durante la "guerra de los cien modelos" de 2023, cientos de startups competían en el mismo escenario. Pero para 2025, según estadísticas de medios, las empresas de la capa de modelos de IA solo completaron 22 rondas de financiación, con un importe total divulgado de 9.400 millones de yuanes. La proporción de la financiación de modelos de gran capacidad en la inversión total en IA cayó bruscamente del 51% en 2024 al 14% en 2025. El "battle royale" del sector ha completado una tasa de eliminación superior al 90%.
Sin embargo, cuando en mayo de 2026 más de 70.000 millones de dólares inundaron simultáneamente a tres empresas líderes en tres días, la señal que emitió el sector fue muy clara: el capital ya no está realizando una "transfusión" a todo el sector, sino que está "llenando el depósito" a los últimos competidores.
02
La economía de la fábrica de tokens
Esta fiebre del capital no surgió de la nada. Detrás de ella hay un doble impulso: el cambio en la ruta tecnológica y la reconfiguración de la lógica del mercado. Para comprender esta fiebre, es necesario analizarla desde dos perspectivas: causas internas y externas.
La narrativa del sector ha cambiado fundamentalmente en el último año.
Antes de 2024, la historia central de los modelos de gran capacidad era "quién tiene más parámetros, quién es más inteligente". Los principales fabricantes competían quemando dinero para entrenar modelos, compitiendo por el límite superior de inteligencia.
Pero la explosión de agentes de inteligencia de largo alcance como OpenClaw (apodado "Langosta") en febrero de 2026 abrió completamente la "caja de Pandora" del consumo de potencia de cálculo. Un agente necesita decenas o incluso cientos de llamadas al modelo para procesar una tarea compleja, consumiendo cantidades de tokens que saltan de unos pocos miles en el diálogo tradicional de una sola ronda a cientos de miles o incluso millones.
Desde entonces, el sector ya no compite por el "límite superior de inteligencia" del modelo, sino por quién puede producir cantidades masivas de tokens de manera más estable y a menor coste. Como definió Jensen Huang, fundador de NVIDIA, la "economía de la fábrica de tokens" es una revolución industrial impulsada conjuntamente por la explosión de la demanda real, el desequilibrio de la estructura oferta-demanda y la competencia global en potencia de cálculo.
Los datos de la Administración Nacional de Estadísticas de China (presumiblemente referencia a la Administración Nacional de Datos) marcan claramente cuán "brusca" es esta explosión. El volumen diario de llamadas de tokens en China se disparó desde 100.000 millones a principios de 2024 hasta 14 billones en marzo de 2026, multiplicándose por más de 1.000 en dos años.
Desde 2026, el sector de la potencia de cálculo de IA en el mercado A ha acumulado ganancias superiores al 55%. Los ingresos mensuales de las principales empresas de modelos de gran capacidad superaron los 10.000 millones de yuanes, y algunas empresas generaron más ingresos en 20 días que en todo el año 2025.
El desequilibrio estructural en el lado de la oferta ha provocado que el poder de fijación de precios de los tokens se desplace drásticamente hacia los proveedores aguas arriba.
La memoria de alto ancho de banda HBM está monopolizada por Samsung, SK Hynix y Micron, con ciclos de ampliación de producción de 24 a 36 meses, lo que provoca un déficit de HBM superior al 40% en 2026. Los costes de electricidad representan más del 60% del coste de producción de tokens, y el ciclo de construcción de la infraestructura eléctrica para grandes centros de datos es de 3 a 5 años.
Esto plantea de hecho la "lógica de primer principio" que determina hoy la dirección del sector de los modelos de gran capacidad: los modelos de gran capacidad actuales ya no son solo software, sino un híbrido de "software + computación en la nube + industria de activos pesados". Detrás de cada conversación, búsqueda o respuesta del usuario se queman en tiempo real GPUs y electricidad.
Cuando el "coste marginal" del modelo ya no tiende a cero, quien controle más recursos de computación y pueda producir tokens al menor coste, tendrá poder de fijación de precios. Y la lucha por estos recursos no es de algoritmos, sino de dinero contante y sonante.
A nivel macro, las inversiones astronómicas de los gigantes tecnológicos internacionales en infraestructura de IA también han intensificado la apuesta del sector por los focos de competencia actuales.
Según las últimas guías de gasto de capital publicadas por las empresas en la temporada de resultados del cuarto trimestre de abril de 2026 (nota: el texto original menciona Q4 2026 pero el contexto sugiere que es el informe del primer trimestre 2026 o guía anual), se espera que los gastos de capital en infraestructura de IA de Microsoft para el año alcancen los 190.000 millones de dólares; Alphabet elevó su expectativa de gasto de capital anual a entre 180.000 y 190.000 millones de dólares, un aumento respecto a la guía de febrero; Meta también elevó su expectativa el 29 de abril al publicar resultados, a entre 125.000 y 145.000 millones de dólares, debido al aumento de precios de componentes y los costes de construcción de centros de datos; Amazon mantuvo la suya en unos 200.000 millones de dólares.
Calculando con los límites superiores de las guías, el gasto de capital combinado de los cuatro gigantes en 2026 sería de aproximadamente 725.000 millones de dólares. Claramente, esto no es solo el gasto de una industria, sino la finalización del sistema de suministro eléctrico para una nueva era de la inteligencia, la instalación de la "red eléctrica" de computación para todas las aplicaciones de IA.
Por otro lado, el efecto ventana de salida a bolsa traído por algunas empresas emergentes también ha acelerado el ritmo de financiación en los mercados primarios de capital riesgo chino y estadounidense. En particular, el espectacular aumento tras las IPOs de Zhipu AI y MiniMax estableció en el mercado secundario un punto de referencia sobre "cuánto vale una gran empresa de modelos". Esto estimuló la ansiedad de futuro de las demás empresas no cotizadas. Si no aprovechan la ventana para fijar su precio, una vez que el mercado se fatigue y las valoraciones se ajusten a la baja...
Así, StepFun completó en pocos meses todas las acciones, desde el desmantelamiento de la estructura VIE y la transformación en sociedad anónima hasta el sprint hacia la IPO en Hong Kong. Mientras, la valoración de Kimi se disparó desde unos 4.300 millones de dólares hasta más de 20.000 millones, reflejando tanto una mejora en sus fundamentales como la aceleración del capital por conseguir una entrada para la "próxima empresa que salga a bolsa".
03
La victoria futura
Por un lado está el frenesí del capital, por otro el cambio en el foco de la competencia. El sector coincide en que la competencia futura se concentrará principalmente en tres aspectos.
Primero, la monetización comercial se convertirá en la "prioridad absoluta" de cada empresa.
Debe reconocerse que en 2026 el sector de los modelos de gran capacidad está experimentando un cambio fundamental: la "prima por AGI" (Inteligencia Artificial General) se está enfriando.
En los dos años anteriores, las altas valoraciones que el mercado de capitales daba a las empresas de IA tenían una premisa clave implícita: la Ley de Escalado seguía vigente, la capacidad del modelo saltaba rápidamente con la inversión en computación, y la AGI era solo una cuestión de tiempo. Los inversores estaban dispuestos a aceptar pérdidas a corto plazo, a descontar la "futura revolución de eficiencia" en el precio de las acciones de hoy.
Pero para 2026, la IA sigue avanzando, aunque la forma de avance parece menos uniforme que antes: OpenAI modificó sus documentos de principios, reduciendo las menciones directas a la AGI; Demis Hassabis de DeepMind también admitió públicamente que los sistemas actuales aún tienen brechas significativas en el aprendizaje continuo y la planificación a largo plazo.
En este punto, el foco del mercado ha pasado de "¿quién está más cerca de la AGI?" a "¿quién puede hacer que los clientes paguen? ¿quién puede reducir los costes de inferencia? ¿quién puede sobrevivir?".
De hecho, las señales de monetización de algunos fabricantes líderes ya son muy claras. Doubao de ByteDance, que durante mucho tiempo mantuvo un modelo gratuito con 345 millones de usuarios activos mensuales, lanzó recientemente en la AppStore de Apple un plan de pago que llega hasta los 5.088 yuanes al año. OpenAI, por su parte, reforzó significativamente las capacidades empresariales de pago de Codex, al tiempo que limitó activamente el uso de nivel superior de los usuarios gratuitos.
Esto marca la entrada de la industria global de modelos de gran capacidad en un período de madurez racional, pasando de quemar dinero por tráfico. La proposición central de la competición ha pasado de "qué modelo es más potente" a "qué modelo logra primero ser rentable".
Segundo, el coste de la potencia de cálculo se convierte en el KPI definitivo.
Con el desarrollo del sector de los modelos de gran capacidad, en un futuro previsible, la capacidad de inferencia, el contexto largo y la multimodalidad ya no son barreras de entrada. Cuando DeepSeek V4 elevó los modelos de código abierto a un nivel cercano a GPT-4, el sector tomó conciencia por primera vez de forma sistémica de que la capacidad del modelo en sí es más fácil de igualar de lo que se pensaba.
Cuando los modelos se están "comoditizando" gradualmente, el mercado de capitales comienza a preguntar: además del modelo, ¿qué más tienes?
Esto ha dado lugar a una transferencia en la narrativa del sector.
En 2023, todos competían por "más parámetros, contexto más largo"; hoy, las empresas comienzan a hablar de qué terminales tienen bloqueados, a qué cadenas de suministro están vinculadas, qué puertas de entrada de usuarios controlan.
JPMorgan Chase señala en su informe de investigación que la valoración de mercado de Zhipu AI ya incorpora la expectativa de alcanzar unos ARR de 1.000 millones de dólares para finales de 2026. Bajo este nuevo marco de evaluación, juzgar el valor de una empresa ya no depende solo de sus puntuaciones en evaluaciones, sino de quiénes son sus clientes, si su flujo de caja es saludable, cuántos escenarios de pago ha abierto y qué grado de irreemplazabilidad ha construido entre sus socios.
Tercero, la explosión de los agentes y la divergencia de caminos.
2026 es considerado por el sector como el año de la explosión de los agentes. Mientras prestamos atención a la cantidad y velocidad con que los fabricantes lanzan agentes, es más importante observar la futura divergencia entre los dos caminos: B2B y B2C.
Un camino avanza en la dirección de "integrarse en los procesos de producción", apostando por la mejora determinista de la eficiencia productiva; el otro se dirige hacia los escenarios reales de la vida personal, apostando por la mentalidad y la escala a largo plazo.
No hay un camino correcto o incorrecto, pero el ritmo de consumo de capital y los requisitos de madurez del modelo de negocio son completamente diferentes. Servir a clientes empresariales requiere formar un triángulo de hierro entre fiabilidad, integración y seguridad; es una construcción de confianza a largo plazo. Los escenarios B2C dependen de la rueda de datos y el autorrefuerzo de la mentalidad del usuario, requieren quemar dinero al principio pero tienen un fuerte efecto de escala después.
En un contexto donde las facturas de computación están elevadas y la concentración de la financiación ha alcanzado nuevas cotas, la capacidad de lograr un ciclo cerrado y un flujo de caja positivo en su respectivo carril determinará directamente la clasificación tras la "víspera de la consolidación" de 2026.
04
Conclusión
Para los inversores de hoy, ya no se enfrentan a una elección de "en qué dirección invertir", sino a un juego de reordenamiento de "apuesta final" sobre unos pocos jugadores líderes. Tres variables —la ruta tecnológica, la elección del escenario y la resistencia del capital— determinarán conjuntamente quién se queda en la mesa y quién es invitado a retirarse.
En una era donde los modelos se están comoditizando, el factor decisivo real puede que ya no sea solo la capacidad técnica en sí, sino cómo convertir esa capacidad técnica en un servicio por el que los clientes estén dispuestos a pagar continuamente, cómo convertir la inversión en computación en una producción verificable, cómo convertir un producto en una empresa saludable.
Este artículo procede del WeChat Official Account "Dongjian New Research" (ID:DJXYS-0309), autor: Chen Wen





