La CPU, regresando sigilosamente al centro del escenario de la potencia computacional de IA

marsbitPublicado a 2026-06-03Actualizado a 2026-06-03

Resumen

En los últimos tres años, la narrativa del cómputo de IA se centró casi exclusivamente en las GPU. Sin embargo, a partir de 2026, esta visión está cambiando. A medida que las cargas de trabajo de IA evolucionan desde el entrenamiento de modelos a gran escala hacia la inferencia masiva y la ejecución de agentes inteligentes, surge un nuevo cuello de botella: la orquestación, la concurrencia y el flujo de datos. El CPU está recuperando un papel central, no como proveedor principal de cómputo paralelo, sino como el "plano de control" de la infraestructura de IA. Este cambio es impulsado por la necesidad de gestionar miles de tareas ligeras, peticiones de inferencia y agentes simultáneamente, tareas para las cuales la arquitectura de GPU no está optimizada. Un ejemplo concreto: en los centros de datos de IA avanzados, como el proyecto "Fairwater" de Microsoft para OpenAI, extensos clusters de CPU son necesarios para sostener y gestionar las operaciones de los masivos clusters de GPU, manejando el flujo de datos y la planificación de tareas. Intel, con su nuevo procesador Xeon 6+ (fabricado en su proceso Intel 18A y con hasta 288 núcleos de eficiencia -E-cores), apuesta precisamente por este nicho. Su diseño prioriza la alta densidad de núcleos y la eficiencia energética para manejar cargas de trabajo de alto rendimiento y alta concurrencia propias de la inferencia y los agentes de IA. Sin embargo, el éxito de este "regreso del CPU" no está garantizado para Intel. Enfrenta una...

En los últimos tres años, la narrativa sobre la potencia computacional de IA ha girado casi exclusivamente en torno a las GPU.

Desde las H100 y H200 de NVIDIA, hasta las GB200, GB300, y los clústeres de cientos de miles de tarjetas que las empresas de la nube se apresuran a expandir, toda la narrativa industrial cuenta una misma historia: el cuello de botella de la potencia computacional está en la GPU. En esta historia, la CPU ha sido durante mucho tiempo considerada por defecto un papel de "complemento" menos importante, que sigue a la GPU y se encarga de las tareas que la GPU no quiere hacer.

Pero a partir de 2026, esta narrativa comenzó a mostrar algunas grietas.

El 1 de junio, Intel presentó en Beijing el procesador Xeon 6+, diseñado específicamente para cargas de trabajo nativas de la nube, de IA basada en agentes y de redes intensivas. Es la primera CPU para centros de datos fabricada en el proceso Intel 18A.

En la descripción de Intel, el Xeon 6+ no cumple el rol de "complemento" para la GPU, sino que es el "plano de control" de la infraestructura de IA, responsable de la orquestación, la concurrencia y el flujo de datos.

"El camino para escalar la IA no radica en la suma de componentes, sino en la operación sinérgica del sistema", dijo Kevork Kechichian, vicepresidente ejecutivo de Intel y gerente general de la División de Plataformas y Soluciones para Centros de Datos, en la sesión informativa. "A medida que la IA avanza hacia la era de los agentes, la orquestación, la concurrencia y el flujo de datos se han convertido en nuevos factores limitantes.

Esto refuerza un hecho central: la CPU sigue siendo el plano de control de la infraestructura moderna de IA."

No es solo el juicio de Intel. En febrero de este año, el instituto de investigación independiente de semiconductores, SemiAnalysis, publicó un informe titulado "El Regreso de la CPU", que analiza el panorama de las CPU para centros de datos en 2026 y ofrece un juicio igualmente directo: en el contexto del despliegue masivo actual del entrenamiento e inferencia de IA, la CPU está siendo necesitada de una manera radicalmente diferente a la de los últimos tres años.

Solo que este "regreso" necesita ser analizado en detalle. No se trata de que la CPU vuelva a ser la protagonista, sino de que la CPU está siendo redefinida en una nueva posición.

I. Las grietas en el enfoque centrado en la GPU

Para entender por qué la CPU "regresa", primero hay que volver a los cambios que están ocurriendo en las propias cargas de trabajo de IA.

En los últimos dos años, la narrativa principal de la potencia computacional de IA ha sido el entrenamiento. La escala de entrenamiento de los grandes modelos aumenta de cuatro a diez veces al año. El entrenamiento requiere cálculos paralelos masivos, y en esto la GPU es absolutamente la protagonista. Pero el entrenamiento no es la totalidad de las cargas de trabajo de IA.

Según el análisis de Intel en la sesión informativa, las cargas de trabajo de la potencia computacional de IA pueden dividirse aproximadamente en tres categorías:

La primera son las cargas de trabajo fundamentales. Almacenamiento, bases de datos, web, microservicios, CDN. Estas no son IA, pero son los servicios subyacentes necesarios para que la IA funcione. Esta sigue siendo el campo de batalla principal de las CPU tradicionales.

La segunda es el entrenamiento. El entrenamiento de los grandes modelos de vanguardia depende casi por completo de las GPU y los aceleradores especializados. Esta ha sido la parte por la que todos competían en los últimos tres años.

La tercera es la inferencia y los agentes. Esta parte está creciendo rápidamente, y es significativamente diferente del entrenamiento.

La diferencia clave de la tercera categoría radica en la forma misma de la carga de trabajo. El entrenamiento es el proceso de "calcular" un modelo desde cero, con un paralelismo extremadamente alto y una demanda muy alta de potencia computacional máxima puntual. Pero la inferencia y los agentes no lo son; se trata de desplegar el modelo ya entrenado para que funcione en los negocios reales.

Esto significa que muchas de las tareas no son de "cálculo", sino de orquestación: programar la colaboración de múltiples modelos, gestionar el contexto, coordinar el flujo de datos entre diferentes agentes, manejar solicitudes concurrentes de usuarios, garantizar una latencia predecible.

Estas son cosas en las que la GPU no es experta.

"En este escenario, podemos ver cargas de trabajo que combinan aceleración a nivel de GPU, pero cuyo núcleo sigue siendo la CPU tradicional", dijo Kevork Kechichian en la sesión informativa.

Detrás de esto hay un hecho industrial más concreto. SemiAnalysis, en su informe "El Regreso de la CPU", puso un ejemplo: en el centro de datos "Fairwater" que Microsoft construyó para OpenAI, un edificio de 48 MW de CPU y almacenamiento soporta un clúster de GPU de 295 MW.

Es decir, para que ese clúster de GPU de 295 MW funcione realmente, se necesitan miles de CPU manejando los flujos de datos de nivel PB generados por las GPU, programando tareas, gestionando el almacenamiento.

Cuanto más se impulse la potencia computacional de la GPU, mayor será la "demanda de potencia computacional periférica" que genera. Y esta demanda de potencia computacional periférica termina recayendo en la CPU.

En otras palabras, el regreso de la CPU no es que "la CPU vuelva a ser más rápida que la GPU". Es que cuando la forma de la potencia computacional de IA se expande desde "entrenar un gran modelo" hasta "ejecutar miles de agentes", la orquestación y el flujo de datos se convierten nuevamente en el cuello de botella. La GPU no puede resolver esto, la CPU sí.

Esta es la otra cara que ha sido pasada por alto en la narrativa de IA de los últimos tres años.

II. ¿En qué camino está apostando el Xeon 6+?

La apuesta de Intel se refleja en la definición del producto Xeon 6+.

El número más llamativo es: hasta 288 núcleos, y todos son núcleos de eficiencia (E-core).

Los E-core y los P-core son la bifurcación arquitectónica que Intel ha implementado en las CPU en los últimos años. Los P-core son núcleos de rendimiento, buscan el rendimiento máximo por núcleo, el objetivo de diseño tradicional de las CPU para servidores. Los E-core son núcleos de eficiencia, con un rendimiento por núcleo más bajo, pero más pequeños en área y de menor consumo energético, lo que permite empaquetar más núcleos en la misma área de chip.

El Xeon 6+ lleva esta bifurcación al extremo. 288 núcleos de eficiencia significa que Intel no está apostando por "qué tan rápido es cada núcleo", sino por "cuántos núcleos se pueden empaquetar en una sola CPU".

La lógica de esta definición de producto es: la carga de trabajo de la IA basada en agentes no es un problema de qué tan rápido puede ejecutar un solo núcleo, sino de si puede ejecutar simultáneamente miles de tareas livianas. Cuando un servidor necesita orquestar simultáneamente cientos de agentes, procesar miles de solicitudes de inferencia y mantener decenas de miles de conexiones concurrentes, la capacidad de procesamiento de 288 E-core es mucho más importante que el rendimiento por núcleo de 64 P-core.

Esta es una definición de producto contraria a la corriente principal. Durante décadas, la narrativa dominante de las CPU para servidores ha sido competir en rendimiento por núcleo: mayor frecuencia, IPC más fuerte, caché más grande. La ruta de los E-core esencialmente admite: esa narrativa podría estar llegando a su fin.

Pero hay varios aspectos que deben considerarse en conjunto.

Primero, la ruta de los E-core no es exclusiva de Intel. AMD lanzó Bergamo en 2023, basado en núcleos Zen 4c optimizados para densidad. Las series Graviton de AWS y AmpereOne de Ampere también llevan tiempo siguiendo la ruta de "núcleos de alta densidad + prioridad en eficiencia energética". En la hoja de ruta AmpereOne Aurora que Ampere presentó en 2024, el número de núcleos ya alcanzaba los 512.

En otras palabras, el Xeon 6+ es el intento de Intel de alcanzar una dirección industrial que ya existe; Intel no es el líder, sino un jugador que se está alineando con la dirección de la industria.

Segundo, el Xeon 6+ es la primera CPU para centros de datos fabricada en el proceso Intel 18A, lo que en el contexto de Intel puede ser más importante que los "288 núcleos E-core".

Intel 18A es la apuesta más grande de Intel en los últimos años. No se trata solo de una CPU, sino de si Intel Foundry, el negocio de fundición de Intel, puede establecerse. Si el proceso 18A no puede ofrecer un producto competitivo al mercado, la historia de Intel Foundry no se sostendrá.

Que el Xeon 6+ esté fabricado con el proceso 18A, que lleve el número de núcleos de eficiencia a 288, y que anuncie públicamente un "liderazgo en densidad de rendimiento", es una de las respuestas que Intel entrega al mercado. Si será reconocido por el mercado, si podrá mantenerse frente a la competencia de la misma generación del N2 de TSMC y los 2nm de Samsung, es otra cuestión.

Tercero, en la lista de clientes del Xeon 6+ aparecen nombres con significado industrial: Ericsson lo está probando para redes centrales 5G, y T-Systems, parte de Deutsche Telekom, lo está utilizando para construir infraestructura privada de IA basada en agentes. Ambos clientes son compradores tradicionales y sólidos de CPU para centros de datos, y su elección de compra es en sí misma una señal de mercado.

Considerando estos tres aspectos en conjunto, el Xeon 6+ apuesta por este camino: aprovechar la ventaja en eficiencia energética del proceso 18A, lograr una alta densidad de núcleos con 288 E-core, y apostar por el tipo de carga de trabajo "alta densidad, alta eficiencia, alto rendimiento" en los escenarios de inferencia de IA y agentes.

Esta no es la historia de que la CPU regrese al escenario principal de la potencia computacional, sino la historia de que la CPU encuentra una nueva posición.

III. ¿Es realmente viable este planteamiento?

¿Es realmente viable la historia del "regreso de la CPU" que cuenta Intel? Depende de ver otras variables dentro de la industria.

La primera variable es la reacción de los fabricantes de GPU.

NVIDIA también ha estado trabajando en asuntos relacionados con la "orquestación" en los últimos dos años. La combinación de la CPU Grace + GPU Hopper es en sí misma el intento de NVIDIA de completar el componente de la CPU. Si los fabricantes de GPU convierten la solución integral "CPU + GPU" en la corriente principal, la posición de los fabricantes de CPU como actores independientes se verá comprimida. Este es el mayor oponente de la narrativa de Intel sobre que "la CPU es el plano de control"; no es AMD, es la propia NVIDIA.

La segunda variable son las CPU desarrolladas internamente por los proveedores de la nube.

La AWS Graviton ya se ha desplegado a gran escala en los propios centros de datos de AWS, asumiendo una parte considerable de las cargas de trabajo de computación general dentro de AWS. Microsoft está desarrollando Cobalt, Google está desarrollando Axion, Alibaba está desarrollando Yitian, casi todos los principales proveedores de la nube están desarrollando sus propias CPU para servidores basadas en arquitectura ARM.

Estas CPU de desarrollo interno también siguen la ruta de "alta densidad, prioridad en eficiencia energética", lo que las sitúa en competencia directa con la definición de producto del Xeon 6+.

En otras palabras, el mercado que el Xeon 6+ intenta capturar lo están cubriendo los propios proveedores de la nube. Intel necesita demostrar que, más allá de las CPU de desarrollo interno de los proveedores de la nube, todavía existe un mercado lo suficientemente grande. Por ejemplo, operadores de telecomunicaciones, nubes privadas, centros de datos de sectores verticales.

La tercera variable es el propio proceso 18A.

El Xeon 6+ es la primera CPU para centros de datos en Intel 18A, lo que significa en sí mismo que este chip asume un significado industrial que va mucho más allá del producto en sí. Si el proceso 18A presenta problemas en el rendimiento de fabricación en masa, la estabilidad del rendimiento o la validación por parte de los clientes, el desempeño en el mercado del Xeon 6+ se verá afectado. Por el contrario, si el 18A demuestra ser estable, el Xeon 6+ podría incluso dar algo de espacio de maniobra a Intel Foundry.

Pero el 18A no opera en el vacío; el proceso N2 de TSMC comenzará su producción en masa en la segunda mitad de 2026, y los 2nm de Samsung también están en camino. Lo que Intel 18A quiere lograr no es solo "fabricarlo", sino "fabricarlo y seguir siendo líder", un estándar mucho más alto.

Considerando estas tres variables en conjunto, el resultado final del Xeon 6+ no depende solo de sí mismo, sino también de si NVIDIA se apoderará del rol de la CPU por sí misma, de si los proveedores de la nube continuarán desarrollando sus propias CPU, y de si Intel 18A se mantendrá frente a la competencia de la misma generación de TSMC y Samsung.

Esta es la razón por la cual, si bien el "regreso de la CPU" parece válido desde un juicio a nivel industrial, desde la perspectiva de si Intel mismo podrá aprovechar este impulso de regreso, sigue siendo una incógnita.

La lucha por la posición de la CPU en el escenario de la potencia computacional de IA ha durado tres años.

El guion de los últimos tres años ha sido "la GPU es el centro, la CPU es el complemento". Este guion comenzó a resquebrajarse en 2026, no porque la CPU vuelva a ser más rápida que la GPU, sino porque la propia potencia computacional de IA está cambiando. Cuando la IA pasa de "entrenar un modelo" a "ejecutar miles de agentes", la orquestación, la concurrencia y el flujo de datos vuelven a ser cuellos de botella del sistema, y la CPU se vuelve insustituible en esta posición.

Intel ha apostado por esto, y el Xeon 6+ es su respuesta. Pero si esto será viable, y si Intel mismo podrá aprovechar este impulso, finalmente se verá en las salas de servidores de los clientes en 2027 y 2028. AMD, el ecosistema ARM, las CPU de desarrollo interno de los proveedores de la nube, NVIDIA desarrollando sus propias CPU, cada variable puede cambiar el rumbo del guion.

El regreso de la CPU es real, pero quién liderará este regreso aún no está decidido.

Preguntas relacionadas

QSegún el artículo, ¿por qué el CPU está volviendo al centro del escenario del poder de cómputo de IA, y qué función clave desempeña ahora?

AEl CPU está volviendo porque el poder de cómputo de la IA está evolucionando de 'entrenar un modelo grande' a 'ejecutar miles de agentes inteligentes'. En este nuevo escenario, la orquestación, la concurrencia y el flujo de datos se han convertido en nuevos cuellos de botella del sistema, funciones para las que el GPU no está optimizado. El CPU ahora actúa como el 'plano de control' de la infraestructura de IA, responsable de la orquestación, coordinación y gestión del flujo de datos.

Q¿Cuál es la estrategia principal de diseño del procesador Intel Xeon 6+, y por qué representa un enfoque 'contrario a la corriente principal'?

ALa estrategia principal del Intel Xeon 6+ es integrar hasta 288 núcleos de eficiencia (E-core) en un solo chip, priorizando una alta densidad de núcleos y eficiencia energética sobre el rendimiento máximo de un solo núcleo. Esto es 'contrario a la corriente principal' porque la narrativa dominante de las CPU para servidores durante décadas se ha centrado en competir por una mayor frecuencia, IPC y caché para un solo núcleo. El Xeon 6+ reconoce que para las cargas de trabajo de inferencia de IA y agentes inteligentes, la capacidad de procesar miles de tareas ligeras concurrentes es más crucial que la velocidad de un solo núcleo.

Q¿Qué tres grandes variables o desafíos determina el artículo que influirán en el éxito de la narrativa del 'regreso del CPU' de Intel y de su Xeon 6+?

ALas tres grandes variables son: 1) La reacción de los fabricantes de GPU, especialmente NVIDIA, que podría integrar la función de CPU en sus propias soluciones (como Grace CPU). 2) Las CPU de desarrollo propio de los proveedores de la nube (como AWS Graviton, Microsoft Cobalt), que siguen una estrategia de diseño similar (alta densidad, ARM). 3) El propio proceso de fabricación Intel 18A, que debe demostrar ser competitivo en rendimiento, estabilidad y rendimiento frente a los procesos N2 de TSMC y 2nm de Samsung que llegarán al mercado al mismo tiempo.

QEl artículo menciona un ejemplo concreto de un centro de datos de Microsoft para OpenAI. ¿Qué ilustra este ejemplo sobre la relación entre CPU y GPU en la infraestructura de IA a gran escala?

AEl ejemplo del centro de datos 'Fairwater' de Microsoft para OpenAI muestra que un edificio de 48 megavatios dedicado a CPU y almacenamiento es necesario para sostener un clúster de GPU de 295 megavatios. Esto ilustra que, a medida que la potencia de cálculo del GPU escala (haciéndose más grande y potente), la 'demanda de cálculo periférico' que genera también aumenta enormemente. Esta demanda periférica (flujo de datos a gran escala, gestión de tareas, almacenamiento) recae inevitablemente en miles de CPU, destacando su papel indispensable como soporte y plano de control, incluso en una infraestructura dominada por GPU.

QSegún la conclusión del artículo, ¿la narrativa del 'regreso del CPU' es definitivamente cierta? ¿Qué matiz importante se introduce sobre quién se beneficiará de este cambio?

ASí, la narrativa del 'regreso del CPU' es cierta en el sentido de que su papel como plano de control para la orquestación y el flujo de datos en la era de los agentes de IA se ha vuelto indispensable y es un cuello de botella renovado. Sin embargo, el artículo introduce un matiz crucial: aunque el regreso de la función del CPU es un hecho a nivel de la industria, quién dominará y se beneficiará de este cambio aún está por decidirse. El resultado dependerá de la competencia entre Intel, AMD, el ecosistema ARM (incluidas las CPU propias de los proveedores de la nube) y las soluciones integradas de NVIDIA. La respuesta final se verá en los centros de datos de los clientes en 2027-2028.

Lecturas Relacionadas

¿Ha Comenzado una Temporada de Altcoins? Esto Es Lo Que Dice el Índice de Temporada de Altcoins

Recientemente, algunos altcoins han experimentado fuertes subidas, impulsando la idea de un posible "alt season" o temporada de altcoins. Sin embargo, el Índice de Temporada de Altcoins, que mide el rendimiento de los 100 principales altcoins frente al Bitcoin durante 90 días, se sitúa actualmente en una puntuación de 36, muy por debajo del umbral de 75 necesario para confirmar el comienzo de dicha fase. Además, el dominio de Bitcoin en el mercado cripto ha vuelto a aumentar, superando el 59.88%, lo que contradice la tendencia típica de un alt season, donde su dominio suele caer drásticamente. Los datos sugieren que los repuntes actuales son rallyes puntuales y que, para que comience una verdadera temporada alcista de altcoins, Ethereum, su líder histórico, tendría que empezar a superar el rendimiento de Bitcoin. Por lo tanto, según el índice y el dominio de BTC, todavía no ha comenzado un alt season.

bitcoinistHace 14 min(s)

¿Ha Comenzado una Temporada de Altcoins? Esto Es Lo Que Dice el Índice de Temporada de Altcoins

bitcoinistHace 14 min(s)

Pulso del Mercado de BTC: Semana 19

El pulso del mercado de BTC en la semana 19 muestra una fase de consolidación. La oferta por encima del precio actual está frenando el impulso alcista a corto plazo, evidenciado por una caída del 3.5% en el momentum, una reducción del 28.6% en la presión de compra neta y un descenso del 13.3% en la actividad de trading, lo que sugiere un menor entusiasmo. En futuros, el interés abierto subió un 3.0%, indicando mayor interés especulativo. Sin embargo, un fuerte cambio en el CVD perpetuo a negativo destaca una presión de venta significativa. En opciones, el aumento del sesgo (skew) del 6.75% refleja cautela ante riesgos a la baja. Desde las finanzas tradicionales, los ETFs spot de EE.UU. registraron salidas netas de $783.4M y menor volumen, apuntando a una demanda institucional más suave. En la cadena, las direcciones activas diarias aumentaron un 6.4%, pero el volumen de transferencias ajustado cayó un 7.4%. Las métricas de liquidez y posicionamiento apuntan a una estructura estable, con una ligera mejora en la rentabilidad y menor presión bajista. En general, el mercado se consolida, con flujos institucionales más débiles compensados por una participación de usuarios constante y un sentimiento que mejora gradualmente.