Texto| Huahua, Banjun
Durante la semana pasada, la industria china de los modelos de gran escala entró repentinamente en un estado casi frenético de financiación.
Kimi completó una ronda de financiación de 20 mil millones de dólares, con una valoración que supera los 200 mil millones de dólares.
StepFun fue reportado estar cerca de cerrar una financiación de casi 25 mil millones de dólares, mientras acelera la desmantelación de su estructura VIE y avanza hacia la última fase de una OPV en Hong Kong.
Por primera vez se informa que DeepSeek está aceptando financiación externa, con fondos estatales importantes involucrados, y se estima que su valoración oscila entre 45 y 50 mil millones de dólares.
Tres empresas, tres días, más de 70 mil millones de dólares fluyeron simultáneamente. Esto ya no son inyecciones adicionales a posteriori, sino más bien una compra colectiva y febril de cuotas de supervivencia futura.
En superficie, es el momento más candente para la industria de los modelos de gran escala.
Pero las industrias realmente peligrosas suelen ser también las más candentes.
Cuando el capital ya no se distribuye equitativamente, sino que apuesta todas sus fichas por los últimos jugadores destacados, la industria parece excepcionalmente próspera, pero en realidad ya ha entrado en la víspera de un cierre.
La espectacular subida de las acciones de ZhiPu y MiniMax tras su salida a bolsa ha hecho que todo el mundo se dé cuenta gradualmente de que:
El tiempo que les queda a las empresas independientes de modelos de gran escala, puede que no sea mucho.
1. Los modelos comienzan a convertirse en productos básicos
En los últimos dos años, el mayor consenso en la industria de los modelos de gran escala era que existía una enorme brecha generacional en las capacidades de los modelos.
GPT-4 alguna vez pareció inalcanzable. Siempre que una startup se acercaba un poco en alguna dimensión, ya sea contexto largo, razonamiento, multimodalidad o agentes, el capital estaba dispuesto a otorgar un sobreprecio muy alto.
Todos creían que la diferencia de capacidades formaría una barrera a largo plazo.
Pero la situación en 2026 ha cambiado.
El contexto largo ya no es escaso. La capacidad de razonamiento ya no es escasa. La multimodalidad ya no es escasa.
Después de que DeepSeek V4 elevara las capacidades del código abierto a un nivel cercano al de GPT-4 o incluso versiones más nuevas, la industria se dio cuenta por primera vez de que la capacidad del modelo en sí podría ser más fácil de igualar de lo que todos imaginaban.
Todavía existen diferencias entre Qwen, DeepSeek, Gemini, Claude y GPT-5.5, pero ya es difícil que formen una ventaja generacional abrumadora.
Los modelos se están convirtiendo en productos básicos.
Una vez que ocurre esta transformación, el mercado de capitales vuelve a plantear una pregunta: además del modelo, ¿qué queda?
Así que la narrativa de toda la industria cambió repentinamente.
En 2023, todas las empresas hablaban de tener un modelo más fuerte, más parámetros, mejor razonamiento, un contexto más largo. Hoy comienzan a hablar de haber bloqueado el terminal, haber vinculado la cadena industrial, poseer una entrada de usuario, tener valor estratégico a nivel nacional.
Este cambio marca que los modelos de gran escala han pasado oficialmente de una competencia tecnológica a una fase de ocupación de posiciones.
Los datos del mercado de capitales ya reflejan esto.
Durante la "guerra de los cien modelos" en 2023, el número de empresas de modelos de gran escala nacionales creció exponencialmente. Los datos de Ebrun muestran que ese año los "Seis Tigres" recaudaron en conjunto más de 6 mil millones de RMB, más de la mitad del total de financiación inicial para modelos nacionales de gran escala. 2024 fue aún más frenético: a nivel global, hubo 168 rondas de financiación en la cadena de suministro de modelos de gran escala por más de 100 millones de RMB cada una, con un monto total de financiación superior a 400 mil millones de RMB.
Solo los Seis Tigres recaudaron al menos 20 mil millones de RMB en conjunto a lo largo del año, batiendo récords en cada ronda.
Luego llegó 2025. Un cambio brusco.
Según informes del medio TouziJie, las empresas de la capa de modelos de IA solo completaron 22 inversiones durante todo el año, con un monto total divulgado de 9.4 mil millones de RMB, una caída del 52.9% respecto a 2024. La proporción de la financiación para modelos de gran escala dentro de la inversión total en IA cayó en picado del 51% en 2022024 al 14%. Las únicas empresas que obtuvieron rondas de más de 2 mil millones de RMB fueron ZhiPu, MiniMax y Moonshot AI.
De 100 empresas, quedaron menos de 10 que pudieron obtener financiación. En dos años, la tasa de eliminación superó el 90%.
Por eso, cuando vemos que en una semana de mayo de 2026 se cerraron tres rondas por un total de 70 mil millones de dólares, su significado queda claro: el dinero no está fluyendo hacia la industria, sino hacia los últimos jugadores.
Cuantas más grandes sean estas rondas, mayor es la concentración. Cuanto mayor es la concentración, menor es el espacio que queda para los demás.
2. La música no se ha detenido, pero ya no hay suficientes sillas
El alza frenética de las acciones de ZhiPu y MiniMax tras su salida a bolsa hizo algo con un impacto profundo en toda la industria: estableció una referencia en el mercado secundario de cuánto valen los modelos de gran escala nacionales.
Una vez que se establece esta referencia, todas las empresas no cotizadas se enfrentan a una carrera contra el tiempo. Si no logran fijar su valoración aprovechando la ventana actual, una vez que el cansancio del mercado provoque un ajuste, su valoración en el mercado primario se verá destrozada al instante.
La ventana no la abriste tú, los pioneros la mantuvieron abierta por ti. Si no saltas, se cierra.
StepFun planea presentar su solicitud en la bolsa de Hong Kong antes de finales de junio y completar su salida a bolsa a finales de año. La estructura VIE ya está completamente desmantelada. La transformación en sociedad anónima se completó en abril. Todos los pasos preparatorios se comprimieron en unos meses.
Los ingresos recurrentes anuales (ARR) de Kimi pasaron de 100 millones de dólares a 200 millones en un mes. Que los inversores divulguen activamente esta cifra a los medios es extremadamente raro en el mercado primario. Normalmente, una empresa solo permite que fluyan métricas financieras clave cuando se prepara para una nueva ronda de financiación o para impulsar una salida a bolsa.
Esta urgencia por "demostrar solvencia" indica que el mercado primario ya no cree en la mera imaginación, quiere ver ingresos, ver certeza de salida.(Lectura relacionada:Kimi no necesita dinero, necesita DeepSeek)
DeepSeek nunca antes había aceptado financiación externa. Ahora entran en escena fondos estatales.
Lo que hacen las tres empresas parece diferente, pero la lógica subyacente es completamente la misma: fijar su identidad, fijar su valoración, fijar su vía de salida. Mientras la ventana sigue abierta.
3. Cada vez más caro, cada vez menos valioso
¿Por qué precisamente ahora? ¿Por qué no se puede esperar más?
La razón reside en que el modelo económico de la industria de los modelos de gran escala está exponiendo una contradicción cada vez más fatal.
En el lado de los costos, los clústeres de GPU, la capacidad de inferencia, el contexto largo, la multimodalidad, los agentes, cada nueva capacidad devora efectivo.
Pero lo realmente aterrador no es el entrenamiento. Es la inferencia.
El entrenamiento es una inversión única. El costo de inferencia crece al mismo tiempo que la base de usuarios. Cada token, cada llamada, cada tarea de agente, corresponde a un consumo real de GPU.
En la era del internet móvil, cuantos más usuarios, más dinero ganaba la plataforma. En la era de la IA, cuantos más usuarios, más pobre puede volverse primero la empresa de modelos.
Un usuario más en WeChat, el costo marginal para Tencent casi no cambia. Un usuario más en Douyin, ByteDance gana un espacio publicitario más. Un usuario frecuente más en Doubao, corresponde a un gasto de inferencia en continuo aumento.(Lectura relacionada:Cuanto más usuarios, más pobre se vuelve ByteDance)
Las empresas de modelos de gran escala necesitan inherentemente una capacidad continua de financiación. Y el dinero del mercado primario no puede suministrarse infinitamente.
La razón por la que salir a bolsa se ha vuelto de repente tan increíblemente importante no es solo por la salida; lo crucial es obtener un canal de capital público que permita una transfusión a largo plazo.
Este es el verdadero punto de ansiedad para todas las empresas de modelos independientes hoy.
El lado de los ingresos es aún más brutal.
DeepSeek llevó la guerra de precios realmente a la industria de los modelos de gran escala. Alta capacidad, código abierto, precio extremadamente bajo, tres cosas se dieron por primera vez al mismo tiempo.
Esto fue un impacto devastador para toda la industria. El margen de beneficio en el mercado de APIs se comprimió directamente.
Toda la industria descubrió de repente que quizás la capacidad del modelo no era lo más escaso. Lo realmente escaso es la capacidad de seguir quemando dinero, la capacidad de soportar pérdidas a largo plazo, la capacidad de aguantar una guerra de precios.
Y estas capacidades, las startups las tienen naturalmente en menor medida que los gigantes.
Lo aterrador de los gigantes no está en el modelo. Está en que poseen una capacidad de subsidio cruzado que las startups nunca tendrán. ByteDance puede mantener Doubao gratuito a largo plazo porque su negocio publicitario le transfunde constantemente. Recientemente, Doubao planea cobrar, lo que demuestra lo insostenible que es el consumo, mostrando cuán frenético es quemar dinero.
Tencent puede lanzar Yuanbao a bajo precio porque los juegos y las redes sociales siguen siendo rentables. Los modelos de las startups deben aprender a mantenerse por sí mismos.
Los gigantes compiten por el ecosistema. Las startups compiten por la supervivencia.
Hay otro cambio que mucha gente aún no ha percibido.
En 2023, cuando el capital invertía en modelos de gran escala, esencialmente estaba comprando "posibilidades".
Porque todos creían que, con solo crear el próximo GPT-4, se podría redefinir internet. Así que en esa etapa, la financiación aún miraba los antecedentes del fundador, el equipo técnico, la capacidad del modelo y el espacio para la imaginación.
Pero hoy, el capital comienza a mirar otro conjunto de cosas.
Comienza a preguntar: ¿tienes flujo de caja, tienes una entrada de usuario final, tienes un ecosistema vinculado, puedes sobrevivir a la próxima guerra de precios?
Esto significa que la lógica de financiación de la industria de los modelos de gran escala ha pasado de la inversión de riesgo a comenzar a convertirse en inversión en infraestructura.
La inversión de riesgo cree en el futuro. La inversión en infraestructura solo cree en la tasa de supervivencia.
Una vez que una industria entra en la etapa de infraestructura, el capital se concentra naturalmente en los líderes. Porque la industria de infraestructura nunca ha necesitado muchos jugadores.
4. Un deja vu de los "Cuatro Dragones"
Este guion no es la primera vez que se representa.
Alrededor de 2018, los "Cuatro Dragones" de la visión por computadora, SenseTime, Megvii (Face++), CloudWalk y Yitu, experimentaron una trama casi idéntica: financiación frenética, valoración disparada, récords en cada ronda. Todos creían que había llegado la era de la IA.
¿Qué pasó después?
Tencent, Alibaba, Huawei entraron en el campo por completo. La visión por computadora se convirtió en una función estándar dentro de los servicios en la nube. La prima tecnológica de las empresas independientes se evaporó al instante, la comercialización no logró alcanzar escala, y finalmente, tras salir a bolsa, experimentaron un largo período de caída por debajo del precio de salida y estancamiento.
Hoy, el campo de los modelos de gran escala está entrando en la misma etapa. La diferencia es que esta vez la apuesta es mayor, la velocidad de quema de dinero es más rápida, la presión de los gigantes es más directa. Lo que ByteDance gasta en IA en un año podría superar la suma total de financiación de los "Seis Tigres".
El dinero global también cuenta la misma historia. En el tercer trimestre de 2025, el volumen total de financiación de las startups de IA a nivel mundial alcanzó los 97 mil millones de dólares, de los cuales casi el 46%, unos 44.6 mil millones de dólares, se concentraron en no más de cinco empresas líderes de modelos base como Anthropic y xAI.
Al entrar en 2026, la financiación de las principales empresas de modelos se aceleró aún más, alcanzando niveles más altos:
OpenAI completó una ronda de 122 mil millones de dólares en marzo, con una valoración posterior a la inversión de 852 mil millones de dólares; Anthropic completó una ronda Serie G de 30 mil millones de dólares en febrero, con una valoración de 380 mil millones de dólares, y luego inició otra ronda de financiación previa a la OPV de unos 50 mil millones de dólares, con un objetivo de valoración de hasta 900 mil millones de dólares.
El capital se está concentrando en los actores más importantes con una fuerza sin precedentes, mientras que las empresas de la capa intermedia atraviesan el invierno de liquidez más largo.
Esta tendencia también se cumple en China. Durante todo 2025, la proporción de financiación para modelos de gran escala dentro de la inversión total en IA cayó del 51% al 14%, pero las tres principales se llevaron la mayor parte. El dinero no desapareció, simplemente ya no se distribuyó equitativamente.
Y la velocidad de eliminación es mucho más rápida que en la generación anterior. La transición de la "guerra de los cien grupos" de internet móvil al monopolio de Alibaba y Tencent tardó casi una década. La transición de la "guerra de los cien modelos" al cierre en la industria de los modelos de gran escala podría llevar solo tres años.
Hace un año, Baichuan AI era una de las empresas más parecidas a un OpenAI chino. Wang Xiaochuan aparecía en casi todas las discusiones sobre modelos de gran escala. Hoy, rara vez aparece en el centro de las noticias de financiación. 01.AI fue un equipo emprendedor estrella, Li Kaifu anunció con gran fanfarria que estaba "All in AI". Pero la industria ya discute cada vez menos si podrá acceder a la siguiente ronda.
La industria de los modelos de gran escala elimina empresas, no necesita que su tecnología quede obsoleta. Solo necesita que la ventana de capital se cierre primero.
5. Tres caminos, tres apuestas
Las empresas de modelos de gran escala de hoy ya se han dividido en tres rutas completamente diferentes.
DeepSeek eligió convertirse en un activo tecnológico a nivel nacional.
Su valoración de 45 mil millones de dólares no proviene completamente de la comercialización, sino del significado estratégico de su barrera tecnológica. Su liderazgo en eficiencia algorítmica lo convierte en una reserva a nivel nacional. La entrada de fondos estatales importantes indica que su posicionamiento ya trasciende la competencia comercial. Su riesgo está en otro lado: su estructura organizativa es frágil, y varios investigadores clave ya se han ido.
StepFun eligió vincularse a la cadena de suministro de hardware. Jugadores clave de la cadena de electrónica de consumo como Huaqin, Longcheer, OmniVision y ZTE participaron colectivamente.
La lógica del presidente de StepFun, Yin Qi, es clara: la capacidad del modelo base finalmente se nivelará, la verdadera ventaja competitiva radica en quién pueda incrustar el modelo en la cadena de suministro del terminal, de modo que un competidor no pueda reemplazarte sin reemplazar toda la cadena. Hasta finales de 2025, 42 millones de teléfonos preinstalados, cubriendo el 60% de las principales marcas, la importancia de estas cifras no está en la escala, sino en la profundidad de la integración.
Kimi eligió la escala de usuarios y la velocidad. Sus ingresos recurrentes anuales (ARR) pasaron de 100 millones a 200 millones de dólares en un mes, con un crecimiento simultáneo de suscripciones de pago y API. Pero su problema también es el más agudo: sus usuarios activos mensuales (MAU) cayeron de un pico de 36 millones a 8.33 millones, los 350 millones de MAU de Doubao de ByteDance ejercen una presión absoluta, y el precio de su API para empresas fue socavado por DeepSeek.
El producto de Kimi sigue siendo excelente. Pero tener un producto excelente ya no es suficiente.
Las tres rutas son completamente diferentes, pero tienen un punto en común: Ninguna sigue hablando de querer hacer el mejor modelo de China. Todos han comenzado a hablar de qué posición han bloqueado.
6. El final de la financiación no es la expansión
¿Por qué 70 mil millones de dólares fluyeron simultáneamente en solo tres días?
En superficie, la industria está caliente. Pero cuando la industria realmente está más caliente, la financiación debería ser más pausada, las empresas elegirían a los inversores con calma, alargarían los ciclos, esperarían una valoración más alta.
La palabra clave ahora es solo una: competir.
StepFun compite por salir a bolsa. Kimi compite por demostrar ingresos. DeepSeek compite por confirmar su identidad.
No compiten por dinero. El dinero es solo una herramienta. Lo que realmente están compitiendo por es la última ventana para sobrevivir de forma independiente.
Es posible que la industria de los modelos de gran escala no termine dejando muchos jugadores independientes. La industria de infraestructura siempre ha sido así: la computación en la nube terminó en manos de unos pocos gigantes, las redes de comunicación finalmente se redujeron a tres operadores, el sistema eléctrico está altamente concentrado.
Cuando la capacidad del modelo se convierte en un producto básico, el precio de las APIs se acerca a cero, y los gigantes cosechan usuarios con estrategias gratuitas, las empresas de modelos independientes o salen a bolsa para obtener capacidad de financiación continua, o son integradas en algún ecosistema, o desaparecen.
Salir a bolsa es obtener un carnet de identidad. El respaldo estatal es otro tipo de carnet de identidad. El carnet no garantiza que vayas a ganar. Pero sin ese carnet, ni siquiera puedes entrar en la siguiente ronda.
Y aquellos nombres que no aparecieron en las noticias de esta semana, su silencio en sí mismo ya es la respuesta.
Una palabra [Fuera de la Página]:
En 2023, la pregunta más frecuente en el campo de los modelos de gran escala nacionales era: ¿quién puede crearlo?
En 2026, esa pregunta se ha convertido en: ¿quién puede sobrevivir?
De crearlo a sobrevivir, solo hay tres años de diferencia. Pero esos tres años son suficientes para que una industria pase directamente de la primavera al otoño.
Este artículo proviene del WeChat Official Account "Fuera de la Página", autor: Huahua







