Nota del editor: Los laboratorios de IA chinos se están convirtiendo en una fuerza cada vez más difícil de ignorar en la competencia global por los grandes modelos lingüísticos. Su ventaja no solo radica en la abundancia de talento, la fuerte capacidad de ingeniería y la rápida iteración, sino también en una forma de organización muy pragmática: menos conceptos, más modelos; menos énfasis en individuos estrella, más en la ejecución del equipo; menos dependencia de servicios externos y más inclinación a dominar su propia pila tecnológica central.
Tras visitar varios de los principales laboratorios de IA en China, el autor de este artículo, Nathan Lambert, descubrió que el ecosistema de IA chino no es exactamente igual al estadounidense. Estados Unidos pone más énfasis en los paradigmas originales, la inversión de capital y la influencia personal de científicos de élite. China, por otro lado, es más hábil para seguir rápidamente direcciones ya establecidas y, mediante código abierto, optimización de ingeniería y la dedicación de una gran cantidad de jóvenes investigadores, llevar las capacidades de los modelos a la vanguardia con rapidez.
Lo más interesante no es si la IA china ya ha superado a la estadounidense, sino que se están formando dos rutas de desarrollo diferentes: Estados Unidos se parece más a una carrera de vanguardia impulsada por el capital y laboratorios estrella, mientras que China se asemeja más a una competencia industrial impulsada conjuntamente por la capacidad de ingeniería, el ecosistema de código abierto y la conciencia del autocontrol tecnológico.
Esto significa que la futura competencia en IA no será solo una lucha por los rankings de modelos, sino también una batalla de capacidades organizativas, ecosistema de desarrolladores y capacidad de ejecución industrial. El verdadero cambio en la IA china radica en que ya no se limita a replicar Silicon Valley, sino que está participando en la vanguardia global a su manera.
A continuación, el texto original:
Sentado en un moderno tren de alta velocidad que iba de Hangzhou a Shanghái, miré por la ventana y vi perfiles montañosos claramente definidos, salpicados de aerogeneradores que formaban siluetas bajo la luz del sol poniente. Las montañas constituían el fondo, mientras que ante mí se extendía un paisaje entrecruzado de vastos campos y densos grupos de rascacielos.
Regresé de China con una enorme humildad. Ir a un lugar tan ajeno y ser recibido con tanta calidez fue una experiencia muy reconfortante y profundamente humana. Tuve el privilegio de conocer a muchas personas del ecosistema de la IA, personas a las que solo había conocido de lejos; y me recibieron con amplias sonrisas y entusiasmo, recordándome una vez más que mi trabajo y todo el ecosistema de la IA en sí mismo son globales.
La mentalidad de los investigadores chinos
Se podría decir que las empresas chinas que están construyendo modelos lingüísticos están excepcionalmente bien adaptadas para ser "seguidoras rápidas" de esta tecnología. Se basan en las tradiciones de larga data de la cultura educativa y laboral de China, al tiempo que tienen una forma de construir empresas tecnológicas ligeramente diferente a la occidental.
Si solo miramos los resultados, es decir, los modelos más nuevos y grandes, y los flujos de trabajo de tipo agente que estos modelos sustentan; y luego los insumos, como científicos destacados, datos a gran escala y recursos de computación acelerada, los laboratorios chinos y estadounidenses parecen en gran medida similares. Las diferencias verdaderamente perdurables aparecen en cómo se organizan y moldean estos elementos.
Siempre he pensado que una de las razones por las que los laboratorios chinos son tan buenos para ponerse al día y mantenerse cerca de la vanguardia es que están culturalmente muy alineados con esta tarea. Pero antes de hablar directamente con la gente, no me sentía cómodo atribuyendo esta intuición a una influencia significativa. Después de conversar con muchos científicos excelentes, humildes y abiertos de los principales laboratorios chinos, muchas de mis ideas se aclararon.
En la actualidad, construir los mejores grandes modelos lingüísticos depende en gran medida de un trabajo meticuloso a lo largo de toda la pila tecnológica: desde los datos, pasando por los detalles de la arquitectura, hasta la implementación de algoritmos de aprendizaje por refuerzo. Cada eslabón del modelo puede aportar alguna mejora, y combinar estas mejoras es un proceso complejo. En este proceso, el trabajo de individuos muy inteligentes puede tener que dejarse de lado para maximizar el modelo general en una optimización multiobjetivo.
Los investigadores estadounidenses obviamente también son muy hábiles para resolver problemas de componentes individuales, pero en EE.UU. hay más una cultura de "abogar por uno mismo". Como científico, cuando abogas activamente por la atención hacia tu trabajo, sueles tener más éxito; y la cultura contemporánea está impulsando una nueva vía hacia la fama: convertirse en un "científico estrella de la IA". Esto genera un conflicto directo.
Se rumorea ampliamente que la organización de Llama colapsó debido a presiones políticas después de que estas demandas de interés se integraran en una estructura jerárquica. También he escuchado a otros laboratorios decir que a veces puede ser necesario "apaciguar" a un investigador destacado para que deje de quejarse de que sus ideas no se incluyeron en el modelo final. Ya sea esto completamente cierto o no, el mensaje es claro: el ego y el deseo de progresión profesional pueden, de hecho, obstaculizar la construcción de los mejores modelos. Incluso una pequeña diferencia direccional en esta cultura entre EE.UU. y China podría tener un impacto significativo en el resultado final.
Parte de esta diferencia tiene que ver con quién está realmente construyendo estos modelos en China. En todos los laboratorios, una realidad directa es: una gran proporción de los contribuyentes clave son estudiantes que aún están en la universidad. Estos laboratorios son bastante jóvenes, lo que me recordó nuestra forma de organizarnos en Ai2: los estudiantes son tratados como compañeros y se integran directamente en los equipos de grandes modelos lingüísticos.
Esto es muy diferente a los principales laboratorios estadounidenses. En EE.UU., empresas como OpenAI, Anthropic o Cursor ni siquiera ofrecen pasantías. Otras como Google ofrecen nominalmente pasantías relacionadas con Gemini, pero muchos se preocupan de si su pasantía estará aislada del trabajo realmente central.
En resumen, esta leve diferencia cultural podría mejorar la capacidad de construcción de modelos de las siguientes maneras: las personas están más dispuestas a realizar trabajos menos glamurosos para mejorar el modelo final; quienes comienzan a participar en la construcción de IA pueden no estar influenciados por ciclos previos de hype de la IA, adaptándose así más rápido a nuevos métodos tecnológicos modernos. De hecho, un científico chino con el que hablé señaló esto explícitamente como una ventaja; el menor ego facilita cierta escalabilidad organizativa, porque la gente intenta menos "jugar con el sistema"; la abundancia de talento es muy adecuada para resolver problemas que ya tienen prueba de concepto en otros lugares, etc.
Esta inclinación hacia capacidades más favorables para construir los modelos lingüísticos actuales contrasta con un estereotipo conocido: a menudo se piensa que los investigadores chinos producen menos investigación académica "de 0 a 1", más creativa y capaz de abrir nuevos campos.
En varias visitas a laboratorios más académicas durante este viaje, muchos responsables comentaron que están cultivando esta cultura de investigación más ambiciosa. Mientras tanto, algunos de los responsables técnicos con los que hablamos dudaban de que esta reinvención de la forma de hacer ciencia fuera posible a corto plazo, porque requeriría rediseñar el sistema educativo y de incentivos, un cambio demasiado grande para ocurrir en el equilibrio económico actual.
Esta cultura parece estar formando a un grupo de estudiantes e ingenieros excepcionalmente hábiles en el "juego de construir grandes modelos lingüísticos". Y, por supuesto, también son extremadamente numerosos.
Estos estudiantes me dijeron que en China también está ocurriendo una fuga de talento similar a la de EE.UU.: muchas personas que antes consideraban una carrera académica ahora planean quedarse en la industria. Una de las frases más interesantes vino de un investigador que originalmente quería ser profesor. Dijo que quería ser profesor para estar cerca del sistema educativo; pero luego comentó que la educación ya está resuelta por los grandes modelos lingüísticos: "¡¿Para qué van a venir los estudiantes a hablar conmigo?!"
Que los estudiantes entren en el campo de los grandes modelos lingüísticos con ojos frescos es una ventaja. En los últimos años, hemos visto cómo los paradigmas clave de los grandes modelos lingüísticos cambiaban constantemente: desde escalar MoE, hasta escalar el aprendizaje por refuerzo, y luego soportar agentes. Hacer bien cualquiera de estas cosas requiere absorber una enorme cantidad de información de fondo extremadamente rápido, tanto de la literatura más amplia como de la pila tecnológica interna de la empresa.
Los estudiantes están acostumbrados a hacer este tipo de cosas y están dispuestos a dejar de lado, con humildad, todos los presupuestos sobre "qué debería funcionar". Se sumergen de cabeza, dedican su vida a ello, solo por la oportunidad de mejorar un modelo.
Estos estudiantes también son notablemente directos y carecen de las divagaciones filosóficas que distraen a algunos científicos. Cuando les pregunté sobre el impacto económico de los modelos o los riesgos sociales a largo plazo, había claramente muchos menos investigadores chinos con puntos de vista complejos que desearan influir en estos temas. Consideran que su papel es construir los mejores modelos.
Esta diferencia es sutil y fácil de negar. Pero es más fácil de sentir cuando se tiene una conversación prolongada con un investigador elegante, inteligente y capaz de expresarse claramente en inglés: cuando planteas preguntas más filosóficas sobre la IA, estas preguntas fundamentales quedan suspendidas en el aire, y la otra persona muestra una simple perplejidad. Para ellos, es un error categórico.
Incluso un investigador citó el famoso juicio de Dan Wang: en comparación con un EE.UU. dominado por abogados, China está gobernada por ingenieros. Al hablar de estos temas, usó esta analogía para enfatizar su deseo de construir. En China, no existe una vía sistemática para cultivar la influencia estrella de los científicos chinos, como lo hacen en EE.UU. podcasts superpopulares como los de Dwarkesh o Lex.
Intenté que los científicos chinos comentaran sobre la incertidumbre económica futura provocada por la IA, cuestiones que van más allá de las simples capacidades de AGI, o debates éticos sobre cómo deberían comportarse los modelos; estas preguntas finalmente me hicieron ver el entorno de crecimiento y educativo de estos científicos (editado 1). Están extremadamente enfocados en su trabajo, pero crecieron en un sistema que no fomenta la discusión y expresión sobre cómo debería organizarse o cambiar la sociedad.
Visto desde lejos, especialmente Pekín, me pareció muy similar al Área de la Bahía: un laboratorio competitivo podría estar a solo unos minutos a pie o en taxi. Después de aterrizar, pasé por el campus de Alibaba en Pekín de camino al hotel. En las siguientes 36 horas, fuimos a Zhipu AI, Moonshot AI, la Universidad Tsinghua, Meituan, Xiaomi y 01.ai.
Moverse en Didi por China es fácil. Si eliges un vehículo XL, a menudo te asignan una furgoneta eléctrica pequeña con sillas de masaje. Preguntamos a los investigadores sobre la guerra por el talento, y dijeron que es muy similar a lo que experimentamos en EE.UU. Es normal que los investigadores cambien de trabajo, y dónde eligen ir depende en gran medida de dónde haya mejor ambiente en ese momento.
En China, la comunidad de grandes modelos lingüísticos se siente más como un ecosistema que como tribus en guerra. En muchas conversaciones privadas, escuché casi exclusivamente respeto por los colegas. Todos los laboratorios chinos miran con cautela a ByteDance y su popular modelo Doubao, porque es el único laboratorio chino de vanguardia que es cerrado. Al mismo tiempo, todos los laboratorios respetan profundamente a DeepSeek, considerándolo el laboratorio con mejor gusto investigador a nivel de ejecución. En EE.UU., cuando tienes conversaciones privadas con miembros de laboratorios, las chispas suelen volar rápidamente.
Lo que más me impresionó de la humildad de los investigadores chinos es que a menudo también se encogen de hombros a nivel comercial, diciendo que ese no es su problema. Mientras que en EE.UU., todo el mundo parece obsesionado con diversas tendencias industriales del ecosistema, desde vendedores de datos, hasta potencia de cálculo y financiación.
Diferencias y similitudes de la industria de IA china con los laboratorios occidentales
Lo que hace tan interesante construir un modelo de IA hoy es que ya no se trata solo de reunir a un grupo de investigadores brillantes en un mismo edificio para crear una maravilla de ingeniería. Antes era más así, pero para sostener un negocio de IA, los grandes modelos lingüísticos se están convirtiendo en un híbrido: implica construcción, despliegue, financiación e impulsar la adopción de esta creación.
Las principales empresas de IA existen dentro de ecosistemas complejos. Estos ecosistemas proporcionan capital, potencia de cálculo, datos y más recursos para seguir impulsando la frontera hacia adelante.
En el ecosistema occidental, la forma en que se integran los diversos insumos necesarios para crear y mantener grandes modelos lingüísticos ha sido relativamente bien conceptualizada y mapeada. Anthropic y OpenAI son ejemplos típicos. Por lo tanto, si podemos detectar diferencias claras en la forma de pensar de los laboratorios chinos sobre estos temas, podemos vislumbrar en qué diferencias significativas podrían apostar las empresas en el futuro. Por supuesto, este futuro también estará fuertemente influenciado por las restricciones de financiación y/o potencia de cálculo.
Resumo a continuación algunos de los mayores aprendizajes a nivel de "industria de la IA" obtenidos tras hablar con estos laboratorios:
Primero, hay signos tempranos de demanda interna de IA.
Existe una hipótesis ampliamente discutida de que el mercado chino de IA sería más pequeño, porque las empresas chinas tradicionalmente no están dispuestas a pagar por software, por lo que nunca liberarían un mercado de inferencia lo suficientemente grande como para sostener laboratorios.
Pero este juicio solo se aplica al gasto en software correspondiente al ecosistema SaaS. Y el ecosistema SaaS históricamente siempre ha sido pequeño en China. Por otro lado, China claramente aún tiene un enorme mercado en la nube.
Una pregunta clave y aún sin respuesta es: ¿se parecerá más el gasto de las empresas chinas en IA al mercado SaaS (es decir, más pequeño) o al mercado en la nube (es decir, un gasto fundamental)? Esto se discute incluso dentro de los laboratorios chinos. En general, tengo la sensación de que la IA se está acercando más al mercado en la nube, y a nadie le preocupa realmente que el mercado en torno a las nuevas herramientas no pueda crecer.
Segundo, la mayoría de los desarrolladores están profundamente influenciados por Claude.
Aunque Claude está nominalmente bloqueado en China, la mayoría de los desarrolladores de IA chinos están fascinados con Claude y con cómo cambió su forma de construir software. Solo porque China haya sido reacia históricamente a comprar software, no significa que crea que no habrá una enorme oleada de crecimiento en la demanda de inferencia.
Los técnicos chinos son muy pragmáticos, humildes y motivados. Esta impresión es más fuerte para mí que cualquier hábito histórico de "no gastar en software".
Algunos investigadores chinos mencionan que usan sus propias herramientas para construir, como las herramientas de línea de comandos de Kimi o GLM, pero todos mencionan que usan Claude. Sorprendentemente, pocos mencionan Codex, que claramente está ganando popularidad rápidamente en el Área de la Bahía.
Tercero, las empresas chinas tienen una mentalidad de propiedad tecnológica.
La cultura china se combina con un motor económico rugiente, produciendo resultados difíciles de predecir. Una impresión duradera que me quedó es que la gran cantidad de modelos de IA refleja un equilibrio pragmático en la realidad para muchas empresas tecnológicas aquí. No existe un plan maestro general.
Esta industria está definida por un respeto hacia ByteDance y Alibaba. Son los grandes actores establecidos que se cree que ganarán muchos mercados debido a sus fuertes recursos. DeepSeek es un líder tecnológico respetado, pero está lejos de ser un líder de mercado. Marcan la dirección, pero no tienen la estructura para ganar mercados económicamente.
Esto deja espacio para empresas como Meituan o Ant Group. Los occidentales podrían sorprenderse de por qué también están construyendo estos modelos. Pero, en realidad, claramente ven los grandes modelos lingüísticos como el núcleo de futuros productos tecnológicos, por lo que necesitan una base sólida.
Cuando ajustan un modelo general potente, la retroalimentación de la comunidad de código abierto fortalece su pila tecnológica, al tiempo que pueden mantener versiones ajustadas internamente para sus propios productos. La mentalidad de "apertura primero" en esta industria está muy definida por el pragmatismo: ayuda a que el modelo obtenga una buena retroalimentación, contribuye a la comunidad de código abierto y potencia su propia misión.
Cuarto, el apoyo gubernamental es real, pero su escala no está clara.
A menudo se afirma que el gobierno chino está ayudando activamente en la competencia por los grandes modelos lingüísticos abiertos. Pero este es un sistema gubernamental relativamente descentralizado con muchos niveles, y cada nivel no tiene un manual claro de operaciones sobre qué debe hacer exactamente.
Diferentes distritos de Pekín compiten para que las empresas tecnológicas establezcan allí sus oficinas. La "ayuda" ofrecida a estas empresas casi seguramente incluye eliminar trámites burocráticos en procesos como las licencias. Pero, ¿hasta dónde puede llegar esta ayuda? ¿Pueden los diferentes niveles del gobierno ayudar a atraer talento? ¿Pueden ayudar a importar chips de contrabando?
A lo largo de la visita, efectivamente hubo muchas menciones sobre el interés o la ayuda del gobierno, pero la información está muy lejos de permitirme reportar detalles de manera afirmativa, o de formarme una visión del mundo segura sobre cómo exactamente el gobierno podría cambiar la trayectoria del desarrollo de la IA en China.
Y, por supuesto, tampoco hay ningún indicio de que los niveles más altos del gobierno chino influyan en ninguna decisión técnica de los modelos.
Quinto, la industria de datos está mucho menos desarrollada que en Occidente.
Habíamos escuchado que Anthropic u OpenAI gastan más de 10 millones de dólares en un solo entorno, con un gasto acumulado anual para impulsar la frontera del aprendizaje por refuerzo que alcanza cientos de millones de dólares. Por lo tanto, queríamos saber si los laboratorios chinos también estaban comprando los mismos entornos a empresas estadounidenses, o si existía un ecosistema interno espejo que los apoyara.
La respuesta no es un "no hay industria de datos" en sentido absoluto, sino que, según su experiencia, la calidad de la industria de datos es relativamente pobre, por lo que a menudo es mejor construir entornos o datos internamente. Los propios investigadores dedican mucho tiempo a crear entornos de entrenamiento para aprendizaje por refuerzo, mientras que empresas más grandes como ByteDance o Alibaba pueden tener equipos internos de anotación de datos para apoyar esto. Todo esto hace eco de la mentalidad de "construir en lugar de comprar" mencionada anteriormente.
Sexto, la sed de más chips de Nvidia es muy fuerte.
La potencia de cálculo de Nvidia es el estándar de oro para el entrenamiento, y el progreso de todos está limitado por no tener más potencia de cálculo. Si el suministro fuera abundante, obviamente la comprarían. Otros aceleradores, incluidos pero no limitados a Huawei, recibieron valoraciones positivas para inferencia. Innumerables laboratorios pueden usar chips Huawei.
Estos puntos pintan un ecosistema de IA muy diferente. Aplicar rápidamente las formas de operar de los laboratorios occidentales a sus contrapartes chinas a menudo resulta en un error categórico. La pregunta clave es: ¿producirán estos diferentes ecosistemas tipos de modelos con diferencias sustanciales? O, ¿siempre se interpretará a los modelos chinos como similares a los modelos de vanguardia estadounidenses de hace 3 a 9 meses?
Conclusión: Equilibrio global
Antes de este viaje, sabía muy poco sobre China; y al partir, sentí que apenas empezaba a aprender. China no es un lugar que se pueda expresar con reglas o fórmulas, sino un lugar con dinámicas y química muy diferentes. Su cultura es tan antigua, tan profunda, y todavía está completamente entrelazada con la forma en que se construye la tecnología internamente. Todavía tengo mucho por aprender.
Muchas partes de la actual estructura de poder en EE.UU. utilizan su visión existente de China como una herramienta mental clave en la toma de decisiones. Después de tener intercambios cara a cara, formales e informales, con casi todos los principales laboratorios de IA en China, descubrí que China tiene muchas cualidades e instintos que son difíciles de modelar para los modos de decisión occidentales.
Incluso cuando pregunté directamente a estos laboratorios por qué lanzan abiertamente sus modelos más fuertes, todavía me resultó difícil concatenar completamente la intersección entre la "mentalidad de propiedad" y el "apoyo sincero al ecosistema".
Los laboratorios aquí son muy pragmáticos, no necesariamente absolutistas en cuanto a código abierto, y no todos los modelos que construyen se lanzan abiertamente. Pero tienen una intención profunda de apoyar a los desarrolladores, apoyar el ecosistema y usar la apertura como una forma de conocer mejor sus propios modelos.
Casi todas las grandes empresas tecnológicas chinas están construyendo su propio modelo de lenguaje general. Ya hemos visto que empresas de servicios tipo plataforma como Meituan, o grandes empresas de tecnología de consumo como Xiaomi, han publicado modelos de pesos abiertos. Las empresas similares en EE.UU. normalmente solo comprarían servicios.
Estas empresas construyen grandes modelos lingüísticos no para figurar en la nueva tendencia de moda, sino por un deseo profundo y fundamental: controlar su propia pila tecnológica y desarrollar la tecnología más importante del momento. Cuando levantaba la vista de mi portátil y siempre veía grupos de grúas en el horizonte, esto claramente encaja con la cultura y energía de construcción más amplia de China.
El toque humano, el encanto y la calidez genuina de los investigadores chinos son profundamente entrañables. A nivel personal, el tipo de discusiones geopolíticas despiadadas a las que estamos acostumbrados en EE.UU. no se había filtrado en absoluto en ellos. El mundo podría tener más de esta positividad simple. Como miembro de la comunidad de IA, ahora me preocupa más que estén surgiendo grietas entre miembros y grupos en torno a las etiquetas de nacionalidad.
Si dijera que no deseo que los laboratorios estadounidenses sean los líderes claros en cada parte de la pila tecnológica de IA, estaría mintiendo. Especialmente en el área de modelos abiertos donde dedico mucho tiempo, soy estadounidense, es una preferencia honesta.
Al mismo tiempo, deseo que el propio ecosistema abierto prospere globalmente, porque puede crear una IA más segura, más accesible y más útil para el mundo. Y la pregunta ahora es si los laboratorios estadounidenses actuarán para ocupar esta posición de liderazgo.
Mientras escribo este artículo, circulan más rumores sobre el impacto de las órdenes ejecutivas en los modelos abiertos. Esto podría complicar aún más la relación entre el liderazgo estadounidense y el ecosistema global, algo que no me da más confianza.
Agradezco a todas las personas excelentes con las que tuve el privilegio de conversar en Moonshot AI, Zhipu, Meituan, Xiaomi, Tongyi Qianwen, Ant Lingguang, 01.ai y otras instituciones. Todos fueron tan cálidos y generosos con su tiempo. A medida que mis ideas tomen forma, seguiré compartiendo observaciones sobre China, tanto a nivel cultural más amplio como en el campo de la IA en sí.
Obviamente, este conocimiento estará directamente relacionado con la historia que se está desarrollando en el frente de la IA.






