Nota del editor: Esta entrevista ofrece una ventana al ciclo de la potencia de computación para la IA: la demanda no se ha enfriado tras la última ola de compras de GPU, sino que continúa siendo impulsada por los agentes inteligentes, la inferencia y las aplicaciones empresariales de IA.
Este artículo entrevista a Brannin McBee, cofundador y director de desarrollo de CoreWeave, y a Nick Robbins, vicepresidente de desarrollo empresarial y relaciones con inversores, para discutir el estado actual de la demanda de IA y el mercado de los neocloud (nubes de nueva generación). El mensaje central de los ejecutivos de CoreWeave es directo: la demanda de IA parece intensificarse cada día de nuevas formas, y el verdadero cuello de botella está pasando de "tener o no GPU" a problemas de infraestructura más complejos: la capacidad de alimentación de las carcasas de los centros de datos, las CPU, el almacenamiento, la disponibilidad de electricistas, la capacidad de ejecución de la cadena de suministro y la voluntad de los clientes de pagar por la nueva generación de potencia de computación.
La particularidad de CoreWeave radica en su posición intermedia en la cadena de infraestructura de IA: sirve tanto a clientes líderes como OpenAI, Anthropic, Meta, Google, Microsoft y Nvidia, como también percibe directamente los cambios en la demanda de laboratorios de investigación, clientes empresariales y proveedores de servicios cloud a hiperescala. Por lo tanto, lo que ven no es solo si "hay escasez de GPU", sino que las propias cargas de trabajo de IA están experimentando un cambio estructural. Con el auge de la IA agentiva y los modelos de razonamiento, la demanda de potencia de computación ya no se centra solo en las GPU; la importancia de las CPU y el almacenamiento también está aumentando. El diseño de la nueva generación de centros de datos debe reservar espacio para las CPU Vera, los servidores Vera Rubin y más almacenamiento.
Esto también explica por qué la competencia en infraestructura de IA está pasando de la mera adquisición de chips a capacidades de entrega de ingeniería más integrales. Quien pueda conseguir más rápido centros de datos con alimentación, desplegar servidores, optimizar la cadena de suministro y reducir el coste por token, estará más cerca del núcleo de este ciclo de gasto de capital en IA. CoreWeave enfatiza repetidamente que está "impulsado por el cliente", lo que en realidad esconde una conclusión más amplia: los proveedores de nube para IA ya no solo venden potencia de computación, sino que están reconfigurando de manera anticipada la próxima generación de fábricas de IA basándose en la hoja de ruta de sus clientes más avanzados.
Para inversores y observadores del sector, lo más interesante de esta entrevista no es una cifra concreta, sino la dirección del cambio en la demanda de infraestructura de IA: las GPU siguen siendo importantes, pero los cuellos de botella se están diversificando; Nvidia sigue siendo el núcleo, pero las CPU, la memoria HBM, el almacenamiento y la capacidad de alimentación de los centros de datos se están convirtiendo en nuevas variables; la demanda de IA sigue creciendo, pero el éxito futuro puede depender de quién pueda entregar de manera continua, estable y a gran escala una infraestructura compleja.
A continuación, el texto original:
CoreWeave es considerado un líder de mercado temprano e innovador en el campo de los neocloud (servicios de nube de nueva generación).
Es el único proveedor de servicios en la nube que ha recibido la máxima calificación "Platino" del instituto de investigación de IA SemiAnalysis. Fundada en 2017, CoreWeave ofrece potencia de computación masiva con GPU a startups y grandes empresas.
Key Context entrevistó recientemente a Brannin McBee, cofundador y director de desarrollo de CoreWeave, y a Nick Robbins, vicepresidente de desarrollo empresarial y relaciones con inversores, para discutir el estado actual de la demanda de IA y el mercado de los neocloud.
A continuación, los puntos clave editados de la conversación:
La demanda de IA sigue intensificándose
Tae: ¿Cuándo empezó a despegar realmente la ola de demanda de IA agentiva?
Brannin: Vimos el verdadero comienzo en el cuarto trimestre del año pasado. En ese momento, estábamos manteniendo conversaciones de ingeniería con los clientes sobre los productos que esperaban lanzar al mercado en el primer trimestre de este año.
Esta ha sido siempre una perspectiva muy importante para nosotros al observar la demanda de los clientes. Tenemos una relación de ingeniería profundamente interconectada con ellos. Es esta relación la que nos permite ver las tendencias con antelación, en lugar de reaccionar pasivamente una vez que se producen los cambios.
Si nos fijamos en el mercado de productos de IA, diría que el primer trimestre fue un momento de enorme punto de inflexión para la inferencia y el consumo de IA, y esta aceleración continúa aún ahora.
Tae: ¿En qué estado se encuentra actualmente la demanda de IA? ¿En comparación con hace unos meses, no hay absolutamente ningún signo de desaceleración en las últimas semanas?
Nick: Parece intensificarse cada día de nuevas formas.
Tae: Hablad de la tendencia al alza de la demanda de CPU en relación con las GPU en la ola de la IA agentiva. ¿Desplegaréis filas de bastidores con CPU Vera junto a los servidores con GPU de Nvidia?
Brannin: CoreWeave lleva ejecutando CPU desde 2023. Siempre hemos tenido una oferta completa de nube. Así que la pregunta no es si acabamos de empezar a añadir CPU, sino qué necesitan realmente los clientes. ¿Está aumentando esa demanda en términos relativos? La respuesta es, de manera muy clara, sí.
A medida que las capacidades de los agentes y de la inferencia cobran verdadera fuerza en los modelos, la demanda de almacenamiento también está aumentando en comparación con las generaciones anteriores. Creo que esta tendencia continuará.
Nick: La respuesta a tu pregunta es sí. Definitivamente verás grandes cantidades de CPU Vera desplegadas junto a grandes cantidades de servidores Vera Rubin. El año pasado, de hecho, rediseñamos fundamentalmente nuestra propuesta básica de centro de datos para dejar espacio a más almacenamiento y más CPU, de modo que puedan desplegarse junto a las GPU.
Hicimos esto porque ocupamos una posición muy única en todo el ecosistema. Somos el único proveedor de nube independiente de IA que sirve a todos los usuarios de tecnología más avanzada. Ningún otro proveedor de nube de IA independiente puede decir que Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, etc., sean sus clientes.
Esto crea un círculo virtuoso, o ciclo de retroalimentación positiva, para nuestro negocio: podemos entender hacia dónde están llevando la tecnología nuestros clientes y planificar en consecuencia.
El cuello de botella ya no son solo las GPU
Tae: ¿Utilizaréis principalmente CPU Vera de Nvidia en el futuro?
Nick: Depende de la carga de trabajo concreta. Nuestras acciones están impulsadas por la demanda del cliente. Es cierto que esperamos ser uno de los primeros y más importantes adoptantes de las CPU Vera, algo que ya hemos revelado. Actualmente, nuestra flota está compuesta principalmente por AMD, pero con el tiempo esto podría cambiar según la demanda de los clientes. El interés de los clientes por las CPU Vera es muy alto.
Brannin: Esto también es un buen recordatorio para hablar de cómo funcionan nuestros contratos. Como sabes, más del 98% de nuestros ingresos están impulsados por contratos. No estamos adivinando qué tipo de infraestructura quieren los clientes. Los clientes nos dicen con mucha claridad qué configuraciones necesitan. Todo está impulsado por el cliente. Son los clientes quienes definen lo que construimos.
Tae: Hablad del panorama competitivo. ¿Cómo os habéis introducido en el mercado y competís frente a neocloud como SpaceX, Nebius y Oracle, y a proveedores de servicios cloud a hiperescala como Azure, AWS y Google?
Brannin: En cuanto a la diferenciación, prefiero verlo desde la perspectiva de la validación de terceros. Nueve de los diez principales laboratorios de IA del mundo (excluyendo China) utilizan nuestra plataforma. SemiAnalysis siempre nos ha clasificado por separado en el nivel más alto en cuanto a rendimiento. No creo que la asignación de GPU que obtenemos se deba a una amistad personal con Jensen.
Esto demuestra que los proveedores tienen una gran confianza en nuestro historial de ejecución y capacidades de ingeniería, y creen que podemos representar mejor las capacidades de sus productos a nivel mundial.
Nick: Podemos ganar clientes de proveedores de servicios cloud a hiperescala porque somos muy buenos ejecutando. Podemos montar estos sistemas extremadamente rápido y funcionan muy bien. Podemos ganar clientes de laboratorios de investigación porque ofrecemos la versión más potente de la tecnología y somos los mejores en eficiencia por token.
Podemos ganar clientes empresariales porque la infraestructura realmente funciona bien, y hemos construido una capa de orquestación excelente y líder en su categoría, que también es reconocida por calificaciones como la de Platino.
Pero cada vez es más importante que, entre los proveedores de nube de IA, ya hayamos construido la capa de capacidades más madura, que cubre herramientas de inferencia y desarrollo, para ayudar a las empresas a poner realmente la IA en producción.
Esto significa que estamos construyendo y entregando productos que, en última instancia, ayudan a empresas con una madurez tecnológica relativamente menor a transformar los datos en modelos y luego en agentes inteligentes que pueden ejecutar internamente, y nosotros podemos, en ese proceso, vender de forma cruzada los servicios en la nube de CoreWeave.
Tae: ¿Cuál es el cuello de botella actual? ¿Las carcasas de los centros de datos con alimentación disponible? ¿Las GPU? ¿O los electricistas?
Brannin: Son los "powered shells", es decir, las carcasas de los centros de datos con capacidad de alimentación. O más precisamente, los componentes dentro de esas carcasas. Mencionaste específicamente a los electricistas, y es totalmente correcto. Es un área compleja.
Pero lo importante es que ya tenemos 49 de estos sitios operativos y funcionando. No estamos depositando nuestras esperanzas en uno o dos sitios. Lo hemos hecho 49 veces.
Es un historial de ejecución muy sólido.
También significa que hemos acumulado un gran conocimiento sobre cómo manejar problemas de la cadena de suministro, qué proveedores son adecuados para colaborar en esta cadena y cuáles no.
Tae: ¿Qué podéis revelar sobre el coste y la escasez de memoria HBM? ¿Cómo lo afrontáis? ¿Los clientes tienen que asumir el aumento de coste?
Nick: La respuesta es sí. Nuestro modelo de negocio está diseñado para que, al firmar un pedido de compra de GPU y determinar cuánto vamos a pagar, fijemos también el precio al que cobramos las GPU a los clientes. En un sentido más amplio, es decir, el precio del servidor, que obviamente incluye el coste de la HBM.
Así es como aislarnos del impacto de las fluctuaciones diarias de precios.
Si en la próxima transacción aumenta el coste de nuestros componentes, reflejaremos ese coste en el precio que creemos que podemos cobrar al cliente, protegiendo así nuestro margen de beneficio. Estamos muy bien protegidos a la hora de transferir estos costes a los clientes. Es algo que vigilamos muy de cerca.
Actualmente, la obtención de componentes no es el mayor cuello de botella. El mayor cuello de botella son los "powered shells". Pero en algún momento futuro, esta respuesta podría cambiar.
Tae: ¿Cómo esperáis que se desarrolle el despliegue y la rampa de producción de Vera Rubin? ¿Cómo será la segunda mitad de este año?
Nick: Obviamente, somos la primera empresa del mundo en poner en marcha y validar completamente VR, es decir, los armarios Vera Rubin. Lo hicimos igual el año pasado con GB200, GB300. Espero que VR empiece a aparecer a finales de este año.
Espero que la verdadera rampa de despliegue a gran escala y muy fuerte se extienda a lo largo de todo 2027. Este ritmo es similar al de GB: GB empezó a aparecer en 2025, pero la verdadera rampa a gran escala se extendió en realidad a lo largo de todo 2026. Es decir, ya se desplegó bastante a finales del año pasado, pero este año es realmente el año del despliegue a gran escala de GB.
Espero que VR tenga un ritmo muy similar en los próximos 12 a 18 meses.






