En los últimos tres años, la narrativa sobre la potencia computacional de IA ha girado casi exclusivamente en torno a las GPU.
Desde las H100 y H200 de NVIDIA, hasta las GB200, GB300, y los clústeres de cientos de miles de tarjetas que las empresas de la nube se apresuran a expandir, toda la narrativa industrial cuenta una misma historia: el cuello de botella de la potencia computacional está en la GPU. En esta historia, la CPU ha sido durante mucho tiempo considerada por defecto un papel de "complemento" menos importante, que sigue a la GPU y se encarga de las tareas que la GPU no quiere hacer.
Pero a partir de 2026, esta narrativa comenzó a mostrar algunas grietas.
El 1 de junio, Intel presentó en Beijing el procesador Xeon 6+, diseñado específicamente para cargas de trabajo nativas de la nube, de IA basada en agentes y de redes intensivas. Es la primera CPU para centros de datos fabricada en el proceso Intel 18A.
En la descripción de Intel, el Xeon 6+ no cumple el rol de "complemento" para la GPU, sino que es el "plano de control" de la infraestructura de IA, responsable de la orquestación, la concurrencia y el flujo de datos.
"El camino para escalar la IA no radica en la suma de componentes, sino en la operación sinérgica del sistema", dijo Kevork Kechichian, vicepresidente ejecutivo de Intel y gerente general de la División de Plataformas y Soluciones para Centros de Datos, en la sesión informativa. "A medida que la IA avanza hacia la era de los agentes, la orquestación, la concurrencia y el flujo de datos se han convertido en nuevos factores limitantes.
Esto refuerza un hecho central: la CPU sigue siendo el plano de control de la infraestructura moderna de IA."
No es solo el juicio de Intel. En febrero de este año, el instituto de investigación independiente de semiconductores, SemiAnalysis, publicó un informe titulado "El Regreso de la CPU", que analiza el panorama de las CPU para centros de datos en 2026 y ofrece un juicio igualmente directo: en el contexto del despliegue masivo actual del entrenamiento e inferencia de IA, la CPU está siendo necesitada de una manera radicalmente diferente a la de los últimos tres años.
Solo que este "regreso" necesita ser analizado en detalle. No se trata de que la CPU vuelva a ser la protagonista, sino de que la CPU está siendo redefinida en una nueva posición.
I. Las grietas en el enfoque centrado en la GPU
Para entender por qué la CPU "regresa", primero hay que volver a los cambios que están ocurriendo en las propias cargas de trabajo de IA.
En los últimos dos años, la narrativa principal de la potencia computacional de IA ha sido el entrenamiento. La escala de entrenamiento de los grandes modelos aumenta de cuatro a diez veces al año. El entrenamiento requiere cálculos paralelos masivos, y en esto la GPU es absolutamente la protagonista. Pero el entrenamiento no es la totalidad de las cargas de trabajo de IA.
Según el análisis de Intel en la sesión informativa, las cargas de trabajo de la potencia computacional de IA pueden dividirse aproximadamente en tres categorías:
La primera son las cargas de trabajo fundamentales. Almacenamiento, bases de datos, web, microservicios, CDN. Estas no son IA, pero son los servicios subyacentes necesarios para que la IA funcione. Esta sigue siendo el campo de batalla principal de las CPU tradicionales.
La segunda es el entrenamiento. El entrenamiento de los grandes modelos de vanguardia depende casi por completo de las GPU y los aceleradores especializados. Esta ha sido la parte por la que todos competían en los últimos tres años.
La tercera es la inferencia y los agentes. Esta parte está creciendo rápidamente, y es significativamente diferente del entrenamiento.
La diferencia clave de la tercera categoría radica en la forma misma de la carga de trabajo. El entrenamiento es el proceso de "calcular" un modelo desde cero, con un paralelismo extremadamente alto y una demanda muy alta de potencia computacional máxima puntual. Pero la inferencia y los agentes no lo son; se trata de desplegar el modelo ya entrenado para que funcione en los negocios reales.
Esto significa que muchas de las tareas no son de "cálculo", sino de orquestación: programar la colaboración de múltiples modelos, gestionar el contexto, coordinar el flujo de datos entre diferentes agentes, manejar solicitudes concurrentes de usuarios, garantizar una latencia predecible.
Estas son cosas en las que la GPU no es experta.
"En este escenario, podemos ver cargas de trabajo que combinan aceleración a nivel de GPU, pero cuyo núcleo sigue siendo la CPU tradicional", dijo Kevork Kechichian en la sesión informativa.
Detrás de esto hay un hecho industrial más concreto. SemiAnalysis, en su informe "El Regreso de la CPU", puso un ejemplo: en el centro de datos "Fairwater" que Microsoft construyó para OpenAI, un edificio de 48 MW de CPU y almacenamiento soporta un clúster de GPU de 295 MW.
Es decir, para que ese clúster de GPU de 295 MW funcione realmente, se necesitan miles de CPU manejando los flujos de datos de nivel PB generados por las GPU, programando tareas, gestionando el almacenamiento.
Cuanto más se impulse la potencia computacional de la GPU, mayor será la "demanda de potencia computacional periférica" que genera. Y esta demanda de potencia computacional periférica termina recayendo en la CPU.
En otras palabras, el regreso de la CPU no es que "la CPU vuelva a ser más rápida que la GPU". Es que cuando la forma de la potencia computacional de IA se expande desde "entrenar un gran modelo" hasta "ejecutar miles de agentes", la orquestación y el flujo de datos se convierten nuevamente en el cuello de botella. La GPU no puede resolver esto, la CPU sí.
Esta es la otra cara que ha sido pasada por alto en la narrativa de IA de los últimos tres años.
II. ¿En qué camino está apostando el Xeon 6+?
La apuesta de Intel se refleja en la definición del producto Xeon 6+.
El número más llamativo es: hasta 288 núcleos, y todos son núcleos de eficiencia (E-core).
Los E-core y los P-core son la bifurcación arquitectónica que Intel ha implementado en las CPU en los últimos años. Los P-core son núcleos de rendimiento, buscan el rendimiento máximo por núcleo, el objetivo de diseño tradicional de las CPU para servidores. Los E-core son núcleos de eficiencia, con un rendimiento por núcleo más bajo, pero más pequeños en área y de menor consumo energético, lo que permite empaquetar más núcleos en la misma área de chip.
El Xeon 6+ lleva esta bifurcación al extremo. 288 núcleos de eficiencia significa que Intel no está apostando por "qué tan rápido es cada núcleo", sino por "cuántos núcleos se pueden empaquetar en una sola CPU".
La lógica de esta definición de producto es: la carga de trabajo de la IA basada en agentes no es un problema de qué tan rápido puede ejecutar un solo núcleo, sino de si puede ejecutar simultáneamente miles de tareas livianas. Cuando un servidor necesita orquestar simultáneamente cientos de agentes, procesar miles de solicitudes de inferencia y mantener decenas de miles de conexiones concurrentes, la capacidad de procesamiento de 288 E-core es mucho más importante que el rendimiento por núcleo de 64 P-core.
Esta es una definición de producto contraria a la corriente principal. Durante décadas, la narrativa dominante de las CPU para servidores ha sido competir en rendimiento por núcleo: mayor frecuencia, IPC más fuerte, caché más grande. La ruta de los E-core esencialmente admite: esa narrativa podría estar llegando a su fin.
Pero hay varios aspectos que deben considerarse en conjunto.
Primero, la ruta de los E-core no es exclusiva de Intel. AMD lanzó Bergamo en 2023, basado en núcleos Zen 4c optimizados para densidad. Las series Graviton de AWS y AmpereOne de Ampere también llevan tiempo siguiendo la ruta de "núcleos de alta densidad + prioridad en eficiencia energética". En la hoja de ruta AmpereOne Aurora que Ampere presentó en 2024, el número de núcleos ya alcanzaba los 512.
En otras palabras, el Xeon 6+ es el intento de Intel de alcanzar una dirección industrial que ya existe; Intel no es el líder, sino un jugador que se está alineando con la dirección de la industria.
Segundo, el Xeon 6+ es la primera CPU para centros de datos fabricada en el proceso Intel 18A, lo que en el contexto de Intel puede ser más importante que los "288 núcleos E-core".
Intel 18A es la apuesta más grande de Intel en los últimos años. No se trata solo de una CPU, sino de si Intel Foundry, el negocio de fundición de Intel, puede establecerse. Si el proceso 18A no puede ofrecer un producto competitivo al mercado, la historia de Intel Foundry no se sostendrá.
Que el Xeon 6+ esté fabricado con el proceso 18A, que lleve el número de núcleos de eficiencia a 288, y que anuncie públicamente un "liderazgo en densidad de rendimiento", es una de las respuestas que Intel entrega al mercado. Si será reconocido por el mercado, si podrá mantenerse frente a la competencia de la misma generación del N2 de TSMC y los 2nm de Samsung, es otra cuestión.
Tercero, en la lista de clientes del Xeon 6+ aparecen nombres con significado industrial: Ericsson lo está probando para redes centrales 5G, y T-Systems, parte de Deutsche Telekom, lo está utilizando para construir infraestructura privada de IA basada en agentes. Ambos clientes son compradores tradicionales y sólidos de CPU para centros de datos, y su elección de compra es en sí misma una señal de mercado.
Considerando estos tres aspectos en conjunto, el Xeon 6+ apuesta por este camino: aprovechar la ventaja en eficiencia energética del proceso 18A, lograr una alta densidad de núcleos con 288 E-core, y apostar por el tipo de carga de trabajo "alta densidad, alta eficiencia, alto rendimiento" en los escenarios de inferencia de IA y agentes.
Esta no es la historia de que la CPU regrese al escenario principal de la potencia computacional, sino la historia de que la CPU encuentra una nueva posición.
III. ¿Es realmente viable este planteamiento?
¿Es realmente viable la historia del "regreso de la CPU" que cuenta Intel? Depende de ver otras variables dentro de la industria.
La primera variable es la reacción de los fabricantes de GPU.
NVIDIA también ha estado trabajando en asuntos relacionados con la "orquestación" en los últimos dos años. La combinación de la CPU Grace + GPU Hopper es en sí misma el intento de NVIDIA de completar el componente de la CPU. Si los fabricantes de GPU convierten la solución integral "CPU + GPU" en la corriente principal, la posición de los fabricantes de CPU como actores independientes se verá comprimida. Este es el mayor oponente de la narrativa de Intel sobre que "la CPU es el plano de control"; no es AMD, es la propia NVIDIA.
La segunda variable son las CPU desarrolladas internamente por los proveedores de la nube.
La AWS Graviton ya se ha desplegado a gran escala en los propios centros de datos de AWS, asumiendo una parte considerable de las cargas de trabajo de computación general dentro de AWS. Microsoft está desarrollando Cobalt, Google está desarrollando Axion, Alibaba está desarrollando Yitian, casi todos los principales proveedores de la nube están desarrollando sus propias CPU para servidores basadas en arquitectura ARM.
Estas CPU de desarrollo interno también siguen la ruta de "alta densidad, prioridad en eficiencia energética", lo que las sitúa en competencia directa con la definición de producto del Xeon 6+.
En otras palabras, el mercado que el Xeon 6+ intenta capturar lo están cubriendo los propios proveedores de la nube. Intel necesita demostrar que, más allá de las CPU de desarrollo interno de los proveedores de la nube, todavía existe un mercado lo suficientemente grande. Por ejemplo, operadores de telecomunicaciones, nubes privadas, centros de datos de sectores verticales.
La tercera variable es el propio proceso 18A.
El Xeon 6+ es la primera CPU para centros de datos en Intel 18A, lo que significa en sí mismo que este chip asume un significado industrial que va mucho más allá del producto en sí. Si el proceso 18A presenta problemas en el rendimiento de fabricación en masa, la estabilidad del rendimiento o la validación por parte de los clientes, el desempeño en el mercado del Xeon 6+ se verá afectado. Por el contrario, si el 18A demuestra ser estable, el Xeon 6+ podría incluso dar algo de espacio de maniobra a Intel Foundry.
Pero el 18A no opera en el vacío; el proceso N2 de TSMC comenzará su producción en masa en la segunda mitad de 2026, y los 2nm de Samsung también están en camino. Lo que Intel 18A quiere lograr no es solo "fabricarlo", sino "fabricarlo y seguir siendo líder", un estándar mucho más alto.
Considerando estas tres variables en conjunto, el resultado final del Xeon 6+ no depende solo de sí mismo, sino también de si NVIDIA se apoderará del rol de la CPU por sí misma, de si los proveedores de la nube continuarán desarrollando sus propias CPU, y de si Intel 18A se mantendrá frente a la competencia de la misma generación de TSMC y Samsung.
Esta es la razón por la cual, si bien el "regreso de la CPU" parece válido desde un juicio a nivel industrial, desde la perspectiva de si Intel mismo podrá aprovechar este impulso de regreso, sigue siendo una incógnita.
La lucha por la posición de la CPU en el escenario de la potencia computacional de IA ha durado tres años.
El guion de los últimos tres años ha sido "la GPU es el centro, la CPU es el complemento". Este guion comenzó a resquebrajarse en 2026, no porque la CPU vuelva a ser más rápida que la GPU, sino porque la propia potencia computacional de IA está cambiando. Cuando la IA pasa de "entrenar un modelo" a "ejecutar miles de agentes", la orquestación, la concurrencia y el flujo de datos vuelven a ser cuellos de botella del sistema, y la CPU se vuelve insustituible en esta posición.
Intel ha apostado por esto, y el Xeon 6+ es su respuesta. Pero si esto será viable, y si Intel mismo podrá aprovechar este impulso, finalmente se verá en las salas de servidores de los clientes en 2027 y 2028. AMD, el ecosistema ARM, las CPU de desarrollo interno de los proveedores de la nube, NVIDIA desarrollando sus propias CPU, cada variable puede cambiar el rumbo del guion.
El regreso de la CPU es real, pero quién liderará este regreso aún no está decidido.






