Informe de IA de Stanford de 423 páginas: La brecha entre China y EE.UU. es solo del 2.7%, DeepSeek de Tsinghua entra en el top 10 mundial
marsbitPublicado a 2026-04-15Actualizado a 2026-04-15
Resumen
El informe de IA 2026 de Stanford revela que la brecha entre EE.UU. y China se ha reducido al 2.7%, con modelos como DeepSeek de China entre los 10 mejores del mundo. La capacidad técnica avanza rápidamente, con un 90% de los modelos líderes desarrollados por la industria. Sin embargo, persisten desafíos como la "frontera irregular" (por ejemplo, los modelos resuelven problemas olímpicos de matemáticas pero fallan en leer relojes analógicos) y la reducción del 20% en empleos para desarrolladores de 22-25 años. La inversión global en IA se duplicó a 5817 mil millones de dólares, pero la transparencia disminuye: el 80% de los modelos no publican su código de entrenamiento. La adopción laboral de IA supera el 80% en China, frente al 58% global. El informe concluye que la IA avanza aceleradamente, pero su gobernanza y medición no siguen el mismo ritmo.
Autor: New Zhiyuan
Editado por: Haokun Taoz
【Resumen de New Zhiyuan】¡El "Informe del Índice de IA 2026" de Stanford ya está aquí! Este extenso documento de 432 páginas tiene un valor extremadamente alto: el duelo entre China y EE.UU. en IA casi se ha igualado, reduciéndose a solo un 2.7%. De los 95 mejores modelos de IA a nivel mundial, la mayoría se concentra en grandes compañías. Lo más crudo es que el empleo de desarrolladores de 22 a 25 años se ha reducido en un 20%.
¡Hoy, Stanford HAI ha publicado el "Informe del Índice de IA 2026"!
Este informe anual de 423 páginas revela completamente el panorama más reciente del poder global en la industria de la IA.
Ofrece una conclusión central: la capacidad de la IA está creciendo rápidamente; pero la capacidad humana para medirla y gestionarla no ha seguido el mismo ritmo.
Entre las conclusiones, la más impactante es:
La brecha de rendimiento entre los modelos de IA de China y EE.UU. ha desaparecido prácticamente, con ambos intercambiando frecuentemente el liderazgo en este duelo, y actualmente la ventaja de Anthropic es de solo un 2.7%.
EE.UU. invierte más dinero en IA que nadie, pero le resulta cada vez más difícil atraer talento de primer nivel.
El informe también señala que la evolución de la IA no solo no ha encontrado un "cuello de botella", sino que avanza a una velocidad sin precedentes.
En el último año, más del 90% de los modelos líderes a nivel mundial han igualado o superado el rendimiento humano en problemas científicos a nivel doctoral, razonamiento multimodal y matemáticas de competición.
Especialmente en capacidad de codificación, el rendimiento en SWE-bench ha aumentado del 60% a casi el 100% en un año.
Sin embargo, la IA muestra un "favoritismo" extremadamente grave, presentando una situación distorsionada:
Los LLM pueden ganar medallas de oro en la Olimpiada Internacional de Matemáticas (IMO), pero no pueden leer correctamente un reloj analógico, con una tasa de acierto de solo el 50.1%.
Al mismo tiempo, el tema de la IA quitando puestos de trabajo ha pasado de ser una predicción a una realidad, y los primeros afectados son los jóvenes trabajadores actuales.
A continuación, lo más destacado: las 12 tendencias más importantes del "Informe del Índice de IA 2026".
Otros puntos destacados:
-
La capacidad de computación de IA global ha aumentado 30 veces en 3 años, NVIDIA posee el 60%, y casi todos los chips provienen de una sola empresa, TSMC.
-
Inversión empresarial global en IA en 2025: 581.7 mil millones de dólares, el doble que el año anterior, EE.UU. se lleva casi la mitad.
-
Los investigadores de IA que entran en EE.UU. han caído un 89% en 7 años, solo el último año cayeron un 80%.
-
El empleo de desarrolladores de software de 22 a 25 años ha caído un 20% desde 2024, los puestos de entrada han sido eliminados precisamente.
-
China ha construido 85 supercomputadoras públicas de IA, más del doble que Norteamérica, es la primera del mundo.
-
La tasa de uso de IA en el lugar de trabajo en China supera el 80%, muy por encima del promedio global del 58%.
-
Los modelos más potentes son cada vez más opacos, 80 de los 95 modelos representativos no han publicado el código de entrenamiento.
La brecha entre China y EE.UU. es de solo 2.7%
Stanford ha graficado en el mismo sistema de coordenadas al número uno de EE.UU. y al de China en el ranking Arena desde mayo de 2023.
En mayo de 2023, gpt-4-0314 lideraba con 1320 puntos, mientras que en China estaba chatglm-6b, con una diferencia de más de 300 puntos.
En febrero de 2025, DeepSeek-R1 igualó brevemente por primera vez a los modelos líderes de EE.UU.
En marzo de 2026, Claude Opus 4.6 de EE.UU. obtuvo 1503 puntos, y dola-seed-2.0-preview de China obtuvo 1464 puntos.
Actualmente, la brecha entre la IA y la de EE.UU. es de solo 39 puntos. Convertido a porcentaje, 2.7%.
Vale la pena mencionar la frecuencia de intercambio en el último año. Desde principios de 2025, los modelos líderes de ambos países han intercambiado posiciones varias veces en Arena.
En cantidad también están casi igualados.
En 2025, EE.UU. publicó 50 "modelos significativos", y China siguió de cerca publicando 30 modelos de IA líderes.
En la primera línea, OpenAI, Google, Alibaba, Anthropic, xAI comparten el escenario, repartiéndose equitativamente el top 5 global.
Bajando al TOP 10, las instituciones y empresas chinas ocupan cuatro puestos: Alibaba, DeepSeek, Tsinghua, ByteDance.
El ecosistema de código abierto también se ha desplazado claramente hacia el este este año.
DeepSeek, Qwen, GLM, MiniMax, Kimi han empujado consistentemente la curva de capacidad de los pesos de código abierto hacia adelante.
Sumando el volumen de publicaciones de papers, citas, producción de patentes, instalación de robots industriales, China es número uno en todo a nivel mundial.
El precio es otro frente.
Desarrolladores en el extranjero calcularon en X que el precio de salida de Seed 2.0 Pro es aproximadamente una décima parte del de Claude Opus 4.6.
Rendimiento similar, precio diez veces menor. Las reacciones en cadena de esto apenas comienzan.
El 90% de los modelos de vanguardia provienen de la industria, velocidad de deificación sin precedentes
De los 95 modelos más representativos publicados el año pasado, más del noventa por ciento provienen de la industria, no de instituciones académicas ni laboratorios gubernamentales.
El mundo académico ya no puede seguir el ritmo de la vanguardia.
La velocidad de publicación también se acelera de manera anormal.
Solo en febrero de 2026, en un mes, llegaron al mercado unos ocho o nueve modelos insignia: Gemini 3.1 Pro, Claude Opus 4.6, GPT-5.3 Codex, Grok 4.20, Qwen 3.5, Seed 2.0 Pro, MiniMax M2.5, GLM-5.
El ciclo de deificación pasó de "años" a "meses".
Los benchmarks se saturan en un año, la IA no tiene cuellos de botella
La curva más impresionante es la de programación.
SWE-bench Verified, este benchmark real de corrección de bugs, pasó del 60% a casi el 100% en un año.
No subió unos puntos, básicamente llegó al tope.
Terminal-Bench prueba la capacidad de los Agent para manejar tareas reales en terminales, pasó del 20% el año pasado al 77.3%.
La tasa de éxito de los Agent de ciberseguridad para resolver problemas pasó del 15% al 93%.
Gemini Deep Think obtuvo una medalla de oro en la Olimpiada Internacional de Matemáticas.
Preguntas científicas a nivel doctoral (GPQA Diamond), matemáticas de competición (AIME), razonamiento multimodal (MMMU), estos huesos duros considerados originalmente "inalcanzables para los humanos", todos han sido superados por los modelos de vanguardia.
El que mejor ilustra el punto es Humanity's Last Exam.
Esta es una prueba diseñada específicamente para "frustrar a la IA y favorecer a los expertos humanos", con preguntas proporcionadas por expertos líderes en varios campos.
El año pasado, o1 de OpenAI obtuvo un 8.8%, los modelos de vanguardia empujaron la puntuación otros 30 puntos porcentuales en un año, actualmente Claude Opus 4.6 y Gemini 3.1 Pro ya han superado el 50%.
Frontera irregular: Puede ganar oro en la IMO pero no puede leer un reloj
Pero el mismo índice arroja otro conjunto de números.
La tasa de precisión del modelo más potente en la tarea de "leer un reloj analógico" es del 50.1%.
La tasa de éxito de los robots en entornos de simulación de laboratorio (RLBench) ha alcanzado el 89.4%. Pero al trasladarlos a escenarios domésticos reales para realizar tareas domésticas como lavar platos o doblar ropa, la tasa de éxito cae inmediatamente al 12%.
Entre el laboratorio y la cocina, hay una diferencia de 77 puntos porcentuales.
Los investigadores han denominado a este fenómeno "frontera irregular" (jagged frontier). La distribución de la capacidad de la IA es irregular, puede ganar una medalla de oro en matemáticas, pero no puede decirte de manera estable qué hora es.
La IA puede ganar medallas de oro en matemáticas, pero solo tiene la mitad de probabilidades de entender un reloj analógico. La IA se está acelerando, pero no en la misma dirección.
Además, en tareas de agentes, en la prueba OSWorld, la capacidad de la IA de vanguardia (66.3%) se está acercando a la línea base humana.
Sin embargo, en la prueba PaperArena, que evalúa específicamente la lógica de investigación, un Agent potenciado por la IA más fuerte obtuvo solo un 39%, la mitad de la capacidad de un estudiante de doctorado.
<极div>
Pero esta irregularidad ya no impide que las empresas implementen IA en sus líneas de producción.
Otro número que da el AI Index es que la tasa de adopción de IA por parte de las empresas globales alcanza el 88%. Nueve de cada diez empresas ya han integrado la IA en algún flujo de trabajo.
El costo también está aumentando simultáneamente. Los incidentes registrados relacionados con la IA aumentaron de 233 en 2024 a 362.
La inversión empresarial global en IA en 2025 alcanzó los 581.7 mil millones de dólares, un aumento interanual del 130%. De esto, la inversión privada fue de 344.7 mil millones de dólares, un aumento interanual del 127.5%.
Ambas curvas casi se duplicaron.
Por países, EE.UU. va muy por delante. La inversión privada en IA en EE.UU. en 2025 fue de 285.9 mil millones de dólares. Además, añadió 1953 nuevas startups de IA en un año, también más de 10 veces el número del segundo clasificado.

极div>
El dinero fluye aceleradamente hacia EE.UU. Pero otro recurso central de EE.UU. está fluyendo en la dirección opuesta.
La gente se va: Los investigadores de IA que entran en EE.UU. caen un 89%
Hay un conjunto de números que hace parpadear.
Desde 2017 hasta ahora, el número de investigadores y desarrolladores de IA que entran en EE.UU. ha disminuido en un 89%.
Lo más crucial es que esta disminución se está acelerando. Solo en el último año, la caída fue del 80%.
EE.UU. sigue siendo el país con la mayor densidad de investigadores de IA del mundo, pero el grifo de entrada se está cerrando.
Las curvas de dinero y personas comienzan a ir en direcciones opuestas. Esta es una situación que no se había visto en la última década.
La capacidad de computación aumenta 30 veces en 3 años, los puntos críticos están en manos de una sola empresa
La curva de capacidad de la IA se acelera, y detrás de ella, la curva de capacidad de computación corre aún más rápido.
Desde 2021 hasta ahora, la capacidad total de computación de IA global ha aumentado 30 veces. En los últimos tres años, se ha triplicado cada año.
Sostener esta curva depende de unas pocas empresas.
Las GPU de NVIDIA por sí solas representan más del 60% de la capacidad de computación de IA del mundo. Amazon y Google ocupan el segundo y tercer lugar con sus propios chips, pero juntos están muy lejos de NVIDIA.
Y casi todos estos chips provienen de una sola fundición, TSMC. Cuanto más empinada es la curva de computación, más estrecho es el punto crítico.
Al mismo tiempo, el costo también aumenta.
La potencia total de los centros de datos de IA globales ha alcanzado los 29.6 GW, equivalente a la demanda total de electricidad del estado de Nueva York en horas pico. Se estima que el entrenamiento único de xAI Grok 4 emite 72,816 toneladas de CO2 equivalente, similar a las emisiones de escape de 17,000 automóviles circulando durante un año.
Dónde se construyen los centros de datos, de dónde viene la electricidad, de dónde se producen los chips, estas tres preguntas se han convertido en el mayor dolor de cabeza este año para todos los CEO de empresas de IA.
La IA generativa se渗透 el 53% en tres años, la tasa de uso en el lugar de trabajo en China supera el 80%
La IA generativa ha alcanzado una渗透率 del 53% de la población global en tres años.
Esta velocidad es más rápida que la de las computadoras personales, más rápida que Internet.
Pero la velocidad de渗透 está altamente correlacionada con el país. Singapur 61%, Emiratos Árabes Unidos 54%, ambos por delante de EE.UU. EE.UU. solo ocupa el puesto 24 entre los países encuestados, con una渗透率 del 28.3%.
Si cambiamos la dimensión de consumidores a lugar de trabajo, el contraste es mayor.
Otro conjunto de datos en el informe muestra que en 2025, el 58% de los empleados a nivel mundial ya usaban la IA con regularidad en el trabajo. Pero en China, India, Nigeria, Emiratos Árabes Unidos y Arabia Saudita, este比例 superó el 80%.
La渗透率 de la IA en el lugar de trabajo en China ya supera el promedio global en más de 20 puntos porcentuales.
Más interesante es el valor para el consumidor.
AI Index estima que, para principios de 2026, las herramientas de IA generativa crean un valor de 172 mil millones de dólares anuales para los consumidores estadounidenses. Desde 2025 hasta 2026, el valor mediano por usuario se triplicó.
La gran mayoría de los usuarios todavía usan la versión gratuita.
El dinero que la gente común está dispuesta a pagar por la IA es mucho menor que el valor que la IA les crea. Esta diferencia es algo que todas las empresas de IA están tratando de cerrar ahora.
Los puestos de entrada se reducen drasticamente: Los puestos de desarrollo para 22-25 años cortados en un 20%
La parte que probablemente más silencio cause entre los lectores de habla china en todo el AI Index podría ser la relacionada con el empleo juvenil.
El grupo de desarrolladores de software de 22 a 25 años, desde 2024 hasta ahora, ha visto una disminución en el empleo de aproximadamente el 20%.
En el mismo período, los grupos de colegas mayores actually crecieron.
No solo los puestos de desarrollo. Otros sectores con alta exposición a la IA, como el servicio al cliente, también muestran el mismo patrón.
Más preocupante es el resultado de las encuestas empresariales. Los ejecutivos entrevistados普遍 esperan que los futuros recortes de personal sean mayores que en los últimos meses.
No se trata de la tasa de desempleo macro, se trata de que los puestos de entrada han sido eliminados con precisión.
Si el primer trabajo desaparece, todo el escalafón profesional pierde un peldaño. El impacto a largo plazo de esto, nadie puede calcularlo ahora.
La IA está reescribiendo la forma de hacer descubrimientos científicos
Si la parte del empleo es fría, la parte científica es caliente.
Los artículos relacionados con la IA en ciencias naturales, ciencias físicas y ciencias de la vida aumentaron entre un 26% y un 28% interanual en 2025.
En cuanto a aplicaciones, este año por primera vez una IA ejecutó completamente el proceso de pronóstico del tiempo de extremo a extremo. Desde datos de observación meteorológica en bruto hasta emitir directamente el pronóstico final de temperatura, velocidad del viento, humedad, sin ninguna intervención de modelos numéricos tradicionales en el medio.
La IA está pasando de "ayudarte a escribir papers" y "ayudarte a calcular números" a "hacer descubrimientos por sí misma".
En los hospitales ocurre lo mismo. En 2025, muchos hospitales comenzaron a implementar herramientas de IA que pueden generar automáticamente registros clínicos a partir de conversaciones de consulta. Médicos de múltiples sistemas hospitalarios informaron que el tiempo dedicado a escribir historias clínicas se redujo hasta en un 83%, y el agotamiento laboral disminuyó significativamente.
Pero el mismo índice arroja un balde de agua fría sobre la IA médica. Una revisión de más de 500 estudios clínicos de IA发现 que casi la mitad de los estudios dependían de conjuntos de datos tipo examen, y solo el 5% utilizaba datos clínicos reales.
Que la IA pueda reducir el tiempo que los médicos pasan tecleando es un hecho. El valor clínico de la IA en pacientes reales目前仍有大量问号.
La ola de autoaprendizaje explota globalmente, la educación formal se ha quedado atrás
La educación formal no puede seguir el ritmo de la IA.
En EE.UU., 4 de cada 5 estudiantes de secundaria y universidad ahora usan IA para completar sus tareas escolares. Pero solo la mitad de las escuelas secundarias tienen políticas sobre el uso de IA, y solo el 6% de los teachers creen que estas políticas están claramente redactadas.
Los estudiantes van por delante, los teachers se quedan atrás, las reglas aún no aparecen.
Mientras la educación formal se queda atrás, la ola de autoaprendizaje explota globalmente. Dice que los tres países con el crecimiento más rápido en el aprendizaje de habilidades de ingeniería de IA son Emiratos Árabes Unidos, Chile y Sudáfrica.
No son EE.UU., no es Europa.
El segmento más empinado de la curva de habilidades crece en lugares donde nadie está mirando.
Los modelos más fuertes se vuelven los más opacos, expertos y público se dividen
Los modelos más potentes se están convirtiendo en los menos transparentes.
El Foundation Model Transparency Index promedió 40 puntos este año, frente a 58 del año pasado. AI Index点名指出, Google, Anthropic, OpenAI ya han dejado de公开 el tamaño de los datos de entrenamiento y la duración del entrenamiento de sus últimos modelos.
De los 95 modelos más representativos publicados el año pasado, 80 no公开aron el código de entrenamiento.
La emoción del público también se vuelve más compleja.
A nivel mundial, la比例 de personas que creen que los beneficios de la IA superan los daños aumentó del 52% al 59%. Pero同期, la比例 de personas que se sienten nerviosas por la IA aumentó del 50% al 52%.
Ambas direcciones crecen simultaneously.
El más dividido es EE.UU. Solo el 33% de los estadounidenses cree que la IA mejorará su trabajo, el promedio global es del 40%. La confianza de los estadounidenses en su propio gobierno para regular la IA es la más baja entre los países encuestados, 31%.
La confianza de los singapurenses en su gobierno para regular la IA es del 81%.
Después del reciente incidente del ataque a la casa de Sam Altman, los círculos de Silicon Valley "se sorprendieron al发现" que los comentarios de personas comunes en Instagram no simpatizaban, incluso有些人 pensaban que "debería ser más激烈".
No se dieron cuenta de que las cosas ya estaban tan mal.
Los datos de Pew e Ipsos citados en el informe de investigación muestran que la brecha de percepción entre expertos y el público sobre el impacto de la IA en el empleo, la atención médica, la economía,普遍 supera los 30 puntos porcentuales, llegando a 50 puntos en un item.
Por un lado, las curvas en el laboratorio se disparan, por otro, la inquietud en la gente común se acumula.
No hay puente en el medio.
Para finalizar
El informe de 423 páginas tiene cientos de gráficos, pero en realidad solo dibuja un gráfico.
El eje horizontal es el tiempo, el eje vertical es la capacidad.
La curva de capacidad de los modelos vuela, la curva de capacidad de computación vuela, la curva de inversión vuela, la curva de tasa de adopción vuela. Todo lo demás se queda estancado o va hacia abajo.
Este es el contenido completo del AI Index 2026.
La IA se acelera. Todas las demás cosas se están desincronizando.
Si estás en esta industria, la pregunta que debes hacerte ahora no es "cómo será el futuro", sino "en qué curva estás parado".