Entrevista a los cofundadores de CoreWeave, acción relacionada con Nvidia: La demanda de IA parece 'intensificarse' cada día

marsbitPublicado a 2026-06-19Actualizado a 2026-06-19

Resumen

CoreWeave, líder en neocloud, analiza la evolución de la demanda de IA con sus ejecutivos Brannin McBee y Nick Robbins. La necesidad de capacidad de computación para IA no se está enfriando, sino que se intensifica cada día, impulsada por las aplicaciones de agentes inteligentes, inferencia y IA empresarial. La entrevista destaca un cambio estructural: el cuello de botella ya no son solo las GPU, sino problemas de infraestructura más complejos como la disponibilidad de centros de datos con energía ("powered shells"), CPU, almacenamiento, cadena de suministro y costos. CoreWeave, que sirve a clientes como OpenAI, Anthropic y grandes tecnológicas, observa un aumento relativo en la necesidad de CPU (como las futuras Vera de Nvidia) y almacenamiento junto a las GPU, lo que ha llevado a rediseñar sus centros de datos. La competencia en infraestructura de IA ya no se centra solo en adquirir chips, sino en la capacidad de ejecución: desplegar rápida y eficientemente sistemas complejos. CoreWeave atribuye su éxito a su historial de ejecución, su rendimiento superior y su plataforma madura para llevar la IA a producción. Actualmente, la principal limitación es la disponibilidad de instalaciones de centros de datos listas, aunque la escasez y el costo de componentes como la memoria HBM son factores gestionados mediante contratos que trasladan los costos a los clientes. Se espera que el despliegue masivo de la próxima generación de servidores, como Vera Rubin, gane fuerza a lo largo ...

Título original: An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day

Autor original: Tae Kim

Compilación original: Peggy, BlockBeats

Nota del editor: Esta entrevista ofrece una ventana para observar el ciclo de la potencia computacional para IA: la demanda no se ha enfriado tras la última oleada de compras de GPU, sino que sigue siendo impulsada por agentes inteligentes, inferencia y aplicaciones empresariales de IA.

Este artículo entrevista a Brannin McBee, cofundador y Director de Desarrollo de CoreWeave, y a Nick Robbins, Vicepresidente de Desarrollo Corporativo y Relaciones con Inversores, para discutir el estado actual de la demanda de IA y el mercado de neocloud. La premisa central de los ejecutivos de CoreWeave es directa: la demanda de IA parece intensificarse cada día de nuevas maneras, y el cuello de botella real está pasando de "tener o no GPU" a problemas de infraestructura más complejos: envolventes de centros de datos con suministro eléctrico, CPU, almacenamiento, electricistas, capacidad de ejecución de la cadena de suministro y cuánto están dispuestos a pagar los clientes por la potencia computacional de nueva generación.

La particularidad de CoreWeave radica en su posición intermedia en la cadena de infraestructura de IA: sirve tanto a clientes líderes como OpenAI, Anthropic, Meta, Google, Microsoft y Nvidia, como también percibe directamente los cambios en la demanda de laboratorios de investigación, clientes empresariales y proveedores de nube a hiperescala. Por lo tanto, lo que ve no es solo si "hay escasez de GPU", sino que las propias cargas de trabajo de IA están experimentando un cambio estructural. Con el auge de la IA agentiva y los modelos de razonamiento, la demanda de potencia computacional ya no gira únicamente en torno a las GPU; la importancia de las CPU y el almacenamiento también está aumentando, y el diseño de los centros de datos de nueva generación debe reservar espacio para CPU Vera, servidores Vera Rubin y más almacenamiento.

Esto también explica por qué la competencia en infraestructura de IA está pasando de la mera adquisición de chips a capacidades de entrega de ingeniería más integrales. Quien pueda conseguir más rápido centros de datos con suministro eléctrico, desplegar servidores, agilizar la cadena de suministro y optimizar el coste por token, estará más cerca del núcleo de este ciclo de gasto de capital en IA. CoreWeave enfatiza repetidamente la "impulsión por el cliente", lo que en realidad refleja una conclusión más amplia: los proveedores de nube de IA ya no solo venden potencia computacional, sino que están reconfigurando con antelación la próxima generación de fábricas de IA basándose en las hojas de ruta de los clientes más avanzados.

Para inversores y observadores de la industria, lo más destacable de esta entrevista no es una cifra concreta, sino la dirección del cambio en la demanda de infraestructura de IA: las GPU siguen siendo importantes, pero los cuellos de botella se están diversificando; Nvidia sigue siendo el núcleo, pero las CPU, la HBM, el almacenamiento y la capacidad de suministro eléctrico de los centros de datos se están convirtiendo en nuevas variables; la demanda de IA sigue creciendo, pero el éxito futuro puede depender de quién pueda entregar de manera constante, estable y a escala esta infraestructura compleja.

A continuación, el texto original:

CoreWeave es considerado un innovador líder de mercado temprano en el campo del neocloud (servicios en la nube de nueva generación).

Es el único proveedor de servicios en la nube que ha recibido la máxima calificación "Platinum" de la firma de investigación de IA SemiAnalysis. Fundada en 2017, CoreWeave proporciona potencia computacional masiva de GPU a startups y grandes empresas.

Key Context entrevistó recientemente a Brannin McBee, cofundador y Director de Desarrollo de CoreWeave, y a Nick Robbins, Vicepresidente de Desarrollo Corporativo y Relaciones con Inversores, para discutir la demanda de IA y el estado del mercado de neocloud.

A continuación, los puntos clave editados de esta conversación:

La demanda de IA continúa intensificándose

Tae: ¿Cuándo empezó realmente a despegar la ola de demanda de IA de agentes inteligentes?

Brannin: Vimos el verdadero comienzo en el cuarto trimestre del año pasado. En ese momento, estábamos en conversaciones de ingeniería con los clientes, discutiendo los productos que esperaban lanzar al mercado en el primer trimestre de este año.

Esta ha sido siempre una perspectiva muy importante para ver la demanda de los clientes. Tenemos una relación de ingeniería profundamente interconectada con ellos. Es precisamente esta relación la que nos permite ver las tendencias con antelación, en lugar de reaccionar pasivamente una vez que ocurren los cambios.

Desde la perspectiva de los productos en el mercado de IA, diría que el primer trimestre fue el momento del gran punto de inflexión en la inferencia y el consumo de IA, y esta aceleración aún continúa hoy.

Tae: ¿En qué estado se encuentra la demanda de IA actualmente? ¿En comparación con hace unos meses, no hay indicios de desaceleración en las últimas semanas?

Nick: Parece intensificarse cada día de nuevas maneras.

Tae: Hablen sobre la tendencia al alza de la demanda de CPU en relación con las GPU en la ola de IA de agentes inteligentes. ¿Desplegarán filas de bastidores de CPU Vera junto a los servidores de GPU de Nvidia?

Brannin: CoreWeave ha estado ejecutando CPU desde 2023. Siempre hemos tenido una oferta completa en la nube. Así que la pregunta no es si acabamos de empezar a añadir CPU, sino ¿qué necesitan realmente los clientes? ¿Está aumentando esta demanda en términos relativos? La respuesta es, muy claramente, sí.

A medida que las capacidades de agentes inteligentes y de inferencia realmente surgen en los modelos, la demanda de almacenamiento también está aumentando en comparación con generaciones anteriores. Creo que esta tendencia continuará.

Nick: La respuesta a tu pregunta es sí. Definitivamente verás una gran cantidad de CPU Vera desplegadas junto a una gran cantidad de servidores Vera Rubin. El año pasado, de hecho, rediseñamos fundamentalmente la solución de centro de datos base para dejar espacio para más almacenamiento y más CPU, para que puedan desplegarse junto a las GPU.

Hicimos esto porque ocupamos una posición muy singular en todo el ecosistema. Somos el único proveedor de nube independiente que sirve a todos los usuarios de tecnología más avanzada. Ningún otro proveedor de nube de IA independiente puede decir que Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, etc., son sus clientes.

Esto crea un volante de inercia beneficioso, o un ciclo de retroalimentación positiva, para nuestro negocio: podemos entender hacia dónde están llevando la tecnología los clientes y planificar en consecuencia.

El cuello de botella ya no son solo las GPU

Tae: ¿Principalmente usarán CPU Vera de Nvidia en el futuro?

Nick: Depende de la carga de trabajo concreta. Actuamos impulsados por la demanda del cliente. Es cierto que esperamos ser un adoptante temprano e importante de las CPU Vera, algo que ya hemos comunicado. En la actualidad, nuestra flota sigue siendo mayoritariamente AMD, pero esto podría cambiar con el tiempo según la demanda de los clientes. El interés de los clientes por las CPU Vera es muy alto.

Brannin: Esto también es un buen recordatorio para hablar de cómo funcionan nuestros contratos. Como sabes, más del 98% de nuestros ingresos están impulsados por contratos. No estamos adivinando qué tipo de infraestructura quieren los clientes. Los clientes nos dicen de manera muy explícita qué configuraciones necesitan. Todo está impulsado por el cliente. Son los clientes quienes definen lo que construimos.

Tae: Hablen sobre el panorama competitivo. Frente a neoclouds como SpaceX, Nebius, Oracle, y proveedores de nube a hiperescala como Azure, AWS, Google, ¿cómo entraron en el mercado y compiten?

Brannin: En cuanto a la diferenciación, prefiero verlo desde el ángulo de la validación de terceros. Nueve de los diez principales laboratorios de IA del mundo (excluyendo China) utilizan nuestra plataforma. SemiAnalysis nos ha clasificado consistentemente por separado en el nivel más alto en cuanto a rendimiento. No creo que hayamos obtenido esta asignación de GPU debido a una amistad personal con Jensen.

Esto indica que los proveedores tienen una profunda confianza en nuestro historial de ejecución y capacidad de ingeniería, creyendo que podemos representar mejor las capacidades de sus productos a nivel mundial.

Nick: Podemos ganar clientes de nube a hiperescala porque somos muy buenos en ejecución. Podemos montar estos sistemas extremadamente rápido y funcionan muy bien. Podemos ganar clientes de laboratorios de investigación porque ofrecemos la versión más potente de la tecnología y el mejor rendimiento por token.

Podemos ganar clientes empresariales porque la infraestructura realmente funciona bien, y hemos construido una capa de orquestación excelente, de clase mundial, que también es la fuente de reconocimientos como la calificación Platinum.

Pero cada vez es más importante que, entre los proveedores de nube de IA, hayamos construido la capa de capacidad más madura, que cubre herramientas de inferencia y desarrollo, para ayudar a las empresas a poner la IA realmente en producción.

Esto significa que estamos construyendo y entregando algunos productos que, en última instancia, ayudan a empresas con una madurez tecnológica relativamente menor a convertir datos en modelos, y luego en agentes inteligentes que pueden ejecutar internamente, y también podemos vender de manera cruzada los servicios en la nube de CoreWeave en este proceso.

Tae: ¿Cuál es el cuello de botella actual? ¿Son las envolventes de centros de datos con suministro eléctrico listo? ¿Las GPU? ¿O los electricistas?

Brannin: Son las powered shells, es decir, las envolventes de centros de datos con suministro eléctrico listo. Más concretamente, los componentes dentro de estas envolventes. Mencionaste específicamente a los electricistas, y es totalmente correcto. Es un área compleja.

Pero lo importante es que ya tenemos 49 de estos sitios en funcionamiento. No estamos depositando nuestras esperanzas en uno o dos sitios. Lo hemos hecho 49 veces.

Este es un historial de ejecución muy sólido.

También significa que hemos acumulado un gran conocimiento sobre cómo manejar problemas de la cadena de suministro, qué proveedores son adecuados para colaborar en esta cadena de suministro y cuáles no.

Nota del editor: powered shells se refiere al edificio del centro de datos en sí, excluyendo el hardware real de los servidores de cálculo.

Tae: ¿Qué pueden revelar sobre el coste y la escasez de la memoria HBM? ¿Cómo lo afrontan? ¿Los clientes tienen que asumir el aumento de costes?

Nick: La respuesta es sí. Nuestro modelo de negocio está diseñado para, al mismo tiempo que firmamos órdenes de compra de GPU y determinamos cuánto coste vamos a pagar, fijar el precio que cobramos a los clientes por las GPU. En términos más amplios, es decir, el precio del servidor, y el precio del servidor obviamente incluye el coste de la HBM.

Así es como aislarnos del impacto de las fluctuaciones diarias de precios.

Si el coste de nuestros componentes aumenta en la próxima transacción, reflejaremos ese coste en el precio que creemos que podemos cobrar al cliente, protegiendo así nuestro margen de beneficio. Estamos muy bien protegidos a la hora de trasladar estos costes a los clientes. Es algo que seguimos muy de cerca.

En este momento, conseguir componentes no es el mayor cuello de botella. El mayor cuello de botella es la powered shell. Pero en algún momento futuro, esta respuesta podría cambiar.

Tae: ¿Cómo esperan que se desarrolle la fase de despliegue y rampa de Vera Rubin? ¿Cómo será la segunda mitad de este año?

Nick: Obviamente, somos la primera empresa del mundo en poner en marcha y validar completamente VR, es decir, los bastidores Vera Rubin. Hicimos lo mismo el año pasado con GB200, GB300. Espero que VR comience a aparecer a finales de este año.

Espero que la fase de despliegue y rampa realmente masiva y muy fuerte se extienda a lo largo de todo 2027. Este ritmo es similar al de GB: GB comenzó a aparecer en 2025, pero la rampa realmente masiva se extendió durante todo 2026. Es decir, a finales del año pasado ya se habían desplegado bastantes, pero este año es el año del despliegue realmente masivo de GB.

Espero que VR siga un ritmo muy similar en los próximos 12 a 18 meses.

Preguntas relacionadas

QSegún los ejecutivos de CoreWeave, ¿cómo está evolucionando la demanda de inteligencia artificial (IA) actualmente?

ALa demanda de IA parece intensificarse cada día de nuevas maneras. Los ejecutivos de CoreWeave destacan que, tras un punto de inflexión masivo en el primer trimestre para la inferencia y el consumo de IA, la aceleración continúa. El cambio estructural hacia IA agentica y de razonamiento está impulsando esta demanda.

QAdemás de las GPUs, ¿qué otros componentes de infraestructura están ganando importancia como cuellos de botella según CoreWeave?

ALos principales cuellos de botella ya no son solo las GPUs, sino los componentes de infraestructura más complejos. CoreWeave identifica como limitaciones críticas a las 'envolturas con energía' (centros de datos con suministro eléctrico listo), las CPUs, el almacenamiento, la disponibilidad de electricistas y la capacidad de ejecución de la cadena de suministro. También mencionan el costo de la memoria HBM.

Q¿Por qué CoreWeave afirma tener una posición única para anticipar las tendencias de la infraestructura de IA?

ACoreWeave sostiene que su posición es única porque es el único proveedor de servicios en la nube independiente que sirve a todos los usuarios tecnológicos más avanzados, incluyendo a Anthropic, OpenAI, Meta, Google, Microsoft y Nvidia. Esta relación profunda con clientes líderes les permite entender hacia dónde se dirige la tecnología y planificar en consecuencia, creando un ciclo de retroalimentación positiva.

Q¿Cómo protege CoreWeave su modelo de negocio de la volatilidad en los costos de componentes como la memoria HBM?

ACoreWeave protege su modelo de negocio y márgenes bloqueando el precio que cobrará a los clientes por las GPUs en el momento de firmar los pedidos de compra de hardware. Si el costo de los componentes sube para la siguiente transacción, reflejan ese aumento en el precio que cobran a sus clientes, aislando así el negocio de las fluctuaciones diarias de precios.

Q¿Cuál es la perspectiva de CoreWeave sobre el despliegue de los futuros servidores Vera Rubin (VR) de Nvidia?

ACoreWeave espera ser uno de los primeros adoptantes significativos de la CPU Vera y ya validó completamente los gabinetes Vera Rubin (VR). Prevén que los despliegues de VR comenzarán a aparecer más tarde este año, pero que la fase de escalada masiva y sólida ocurrirá a lo largo de todo 2027, siguiendo un ritmo similar al de la generación anterior (GB), que tuvo su mayor despliegue un año después de su lanzamiento inicial.

Lecturas Relacionadas

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

El 1 de junio, NVIDIA presentó su primera CPU independiente, Vera, en el GTC Taipei 2026, marcando su entrada directa en este mercado. Simultáneamente, AMD ha duplicado su previsión del tamaño del mercado de CPUs para servidores a más de 1,2 billones de dólares, reflejando el crecimiento explosivo impulsado por la IA. Según UBS, se espera que el mercado de CPUs para servidores alcance unos 170.000 millones de dólares en 2030. El motivo principal de este resurgimiento es la transición de la IA hacia la fase de inferencia y los Agentes Inteligentes (Agentic AI). En este contexto, las CPUs asumen un papel crucial, gestionando hasta el 90% de la latencia en tareas complejas que involucran razonamiento múltiple, llamadas a herramientas externas y gestión de datos. A diferencia del entrenamiento, dominado por las GPUs, los Agentes generan grandes volúmenes de datos intermedios (KV Cache) que superan la capacidad de memoria de las GPUs, trasladándose a la memoria masiva de las CPUs. Esto ha alterado la proporción típica entre GPU y CPU, acercándose a 1:1 en escenarios de Agentes, frente a la proporción anterior de 1:8. Esta mayor demanda ha provocado un aumento de precios del 10%-15% en CPUs de servidor, la primera subida significativa en más de una década, y ha generado escasez de suministro. Se prevé que el mercado se divida en CPUs de alto rendimiento para clústeres de IA (~700.000 millones dólares) y CPUs desplegadas de forma independiente para Agentes (~700.000 millones dólares), un segmento nuevo desde 2026. NVIDIA, con su CPU Vera basada en ARM, apunta a un ratio 1:1 con sus GPUs Rubin. AMD superó a Intel en ingresos por centro de datos en el primer trimestre de 2026. En China, fabricantes como Hygon (arquitectura x86) y Huawei (ARM) se benefician de esta tendencia global y de las políticas de sustitución de importaciones, enfrentándose a una ventana de oportunidad crítica antes de 2027. En resumen, la era de los Agentes de IA ha reposicionado a la CPU como un cuello de botella crítico y un motor de crecimiento clave, donde la capacidad de colaboración entre CPU y GPU será más decisiva que el rendimiento individual de cada chip.

marsbitHace 8 hora(s)

La CPU regresa a la mesa: comienza un 'ascenso' de 170.000 millones de dólares

marsbitHace 8 hora(s)

TechFlow Inteligencia: Director de IA de AMD critica públicamente a Claude Code por "volverse más tonto y perezoso"; Trump anuncia alto al fuego en el estrecho de Ormuz, pero quedan 80 minas sin despejar

Resumen de TechFlow Intelligence: **IA y Tecnología:** - El Director de IA de AMD critica que Claude Code se ha vuelto "más torpe y perezoso". - SK Telecom, socio de Anthropic, bajo escrutinio de control de exportaciones de EE.UU. por posible transferencia de tecnología del modelo Mythos. - Z.AI lanza GLM-5.2, modelo chino que rivaliza con Claude Opus sin usar chips de Nvidia. - 0G Labs supera el hito de 1000 mil millones de tokens en inferencia de IA descentralizada. - DeepSeek genera gran debate en Zhihu por sus nuevas capacidades visuales. - Investigadores del MIT crean su propio sistema operativo para estudiar chips. **Cripto/Web3:** - Bithumb lista el par comercial de ReProtocol (RE) en won coreano. - Upbit elimina el par de KernelDAO (KERNEL). **Semiconductores/Hardware:** - Disputa entre EE.UU. y ASML sobre si máquinas litográficas EUV de última generación han llegado a China. - Amazon negocia la venta externa de sus chips de IA Trainium/Inferentia. - El A21 Pro de Apple usará exclusivamente el proceso N2P de TSMC. **Empresas Tecnológicas:** - Se descubren 10,000 repositorios en GitHub distribuyendo malware. - Apple parcha una vulnerabilidad crítica de escucha en Beats Studio Buds. - Ingenieros de Amazon investigados por criticar la expansión de centros de datos de IA. - Microsoft y Amazon Web Services, posibles objetivos de una estricta regulación antimonopolio de la UE. **Mercados/Macroeconomía:** - Trump afirma que se logró un "alto al fuego total" en el estrecho de Ormuz, pero la asociación de petroleros Intertanko advierte que aún hay unas 80 minas sin despejar en la ruta principal. - Cerca de 80 superpetroleros, cargados con 80 millones de barriles de petróleo, esperan una "señal de seguridad" para navegar. - Irán pospone viaje diplomático a Suiza, ensombreciendo las perspectivas de las conversaciones de paz. - Trump califica el acuerdo con Irán como "rendición incondicional" y afirma tener "poder ilimitado" como presidente. - Sector semiconductores en auge en bolsa: Intel sube un 10.6%, SpaceX cae un 3.5%. **Línea Subyacente:** Mientras la "paz" geopolítica en Ormuz es temporal y frágil (minas, viajes cancelados, petroleros a la espera), la guerra por los chips y la redefinición de las cadenas de suministro tecnológico (como los modelos chinos sin Nvidia o Amazon vendiendo sus chips) avanza de forma más permanente.

marsbitHace 8 hora(s)

TechFlow Inteligencia: Director de IA de AMD critica públicamente a Claude Code por "volverse más tonto y perezoso"; Trump anuncia alto al fuego en el estrecho de Ormuz, pero quedan 80 minas sin despejar

marsbitHace 8 hora(s)

Trading

Spot
Futuros
活动图片