Titre original : An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day
Auteur original : Tae Kim
Compilation originale : Peggy, BlockBeats
Note de la rédaction : Cet entretien offre une fenêtre sur le cycle de la puissance de calcul en IA : la demande ne s'est pas refroidie après la dernière vague de ruée vers les GPU, mais est au contraire encore stimulée par les agents, l'inférence et les applications d'IA de niveau entreprise.
Cet article a interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds. Le message central des dirigeants de CoreWeave est direct — la demande d'IA semble s'intensifier chaque jour de nouvelles manières, et le véritable goulot d'étranglement passe de la simple « disponibilité des GPU » à des problèmes d'infrastructure plus complexes : l'alimentation des bâtiments de centres de données, les CPU, le stockage, les électriciens, la capacité d'exécution de la chaîne d'approvisionnement, et la volonté des clients de payer pour la nouvelle génération de puissance de calcul.
La particularité de CoreWeave est qu'elle se situe au milieu de la chaîne de l'infrastructure IA : elle sert à la fois des clients leaders comme OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, mais ressent aussi directement les changements de demande des laboratoires de recherche, des clients entreprises et des fournisseurs de cloud hyperscale. Ainsi, elle ne voit pas seulement la « pénurie de GPU », mais aussi les changements structurels dans la nature même des charges de travail d'IA. Avec l'essor de l'IA agentielle et des modèles de raisonnement, la demande en puissance de calcul ne se concentre plus uniquement sur les GPU, l'importance des CPU et du stockage augmente également. La conception des nouveaux centres de données doit donc prévoir de l'espace pour les CPU Vera, les serveurs Vera Rubin et plus de stockage.
Cela explique pourquoi la concurrence dans l'infrastructure IA passe d'un simple approvisionnement en puces à une capacité de livraison d'ingénierie plus complète. Celui qui peut obtenir plus rapidement des centres de données alimentés, déployer des serveurs, fluidifier la chaîne d'approvisionnement et optimiser le coût par token est plus proche du cœur de ce cycle de dépenses en capital pour l'IA. CoreWeave insiste à plusieurs reprises sur le fait d'être « axé sur le client », ce qui cache en réalité un constat plus large : les fournisseurs de cloud IA ne vendent plus seulement de la puissance de calcul, mais restructurent à l'avance l'usine d'IA de la prochaine génération en fonction des feuilles de route de leurs clients les plus avancés.
Pour les investisseurs et les observateurs du secteur, le point le plus important de cet entretien n'est pas un chiffre ponctuel, mais la direction du changement de la demande en infrastructure IA : les GPU restent importants, mais les goulots d'étranglement se diffusent ; Nvidia reste central, mais les CPU, la HBM, le stockage et la capacité d'alimentation des centres de données deviennent de nouvelles variables ; la demande en IA continue de croître, mais les futurs gagnants pourraient être déterminés par la capacité à livrer de manière continue, stable et à grande échelle une infrastructure complexe.
Voici le texte original :
CoreWeave est considéré comme un leader de marché précoce et innovant dans le domaine des néo-clouds (nouveaux services cloud).
C'est le seul fournisseur de services cloud à avoir obtenu la note la plus élevée, la « note platine », de la part de l'institut de recherche en IA SemiAnalysis. Fondé en 2017, CoreWeave fournit une puissance de calcul GPU à grande échelle aux startups comme aux grandes entreprises.
Key Context a récemment interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds.
Voici les points édités de cette conversation :
La demande d'IA continue de s'intensifier
Tae : La vague de demande pour l'IA agentielle a-t-elle réellement commencé à exploser et à quel moment ?
Brannin : Nous avons vraiment vu le début au quatrième trimestre de l'année dernière. À l'époque, nous avions des discussions techniques avec les clients sur les produits qu'ils prévoyaient de lancer sur le marché au premier trimestre de cette année.
Cette perspective a toujours été très importante pour la façon dont nous percevons la demande de nos clients. Nous avons une relation technique profondément interconnectée avec nos clients. C'est cette relation qui nous permet de voir les tendances à l'avance, plutôt que de réagir après coup.
Si l'on considère les produits sur le marché de l'IA, je dirais que le premier trimestre a été le moment d'un énorme point d'inflexion pour l'inférence et la consommation d'IA, et cette accélération se poursuit encore aujourd'hui.
Tae : À quel stade en est la demande d'IA ? Y a-t-il un quelconque signe de ralentissement ces dernières semaines par rapport à il y a quelques mois ?
Nick : Elle semble s'intensifier chaque jour de nouvelles manières.
Tae : Parlez-nous de la tendance à la hausse de la demande en CPU par rapport aux GPU dans la vague de l'IA agentielle. Déployez-vous des rangées de racks de CPU Vera à côté de vos serveurs GPU Nvidia ?
Brannin : CoreWeave utilise des CPU depuis 2023. Nous avons toujours eu une gamme complète de produits cloud. Donc la question n'est pas de savoir si nous commençons juste à ajouter des CPU, mais plutôt de savoir ce dont les clients ont réellement besoin ? Cette demande augmente-t-elle de manière relative ? La réponse est oui, très clairement, c'est le cas.
Avec l'essor réel des capacités des agents et de l'inférence dans les modèles, la demande de stockage augmente également par rapport aux générations précédentes. Je pense que cette tendance va se poursuivre.
Nick : La réponse à votre question est oui. Vous verrez absolument un grand nombre de CPU Vera déployés à côté d'un grand nombre de serveurs Vera Rubin. L'année dernière, nous avons en fait fondamentalement repensé notre conception de base des centres de données pour prévoir de l'espace pour plus de stockage et plus de CPU, afin qu'ils puissent être déployés à côté des GPU.
Nous avons fait cela parce que nous occupons une position très unique dans l'écosystème. Nous sommes le seul fournisseur de cloud indépendant à servir tous les utilisateurs de technologie de pointe. Aucun autre fournisseur de cloud IA indépendant ne peut dire qu'Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, etc. sont ses clients.
Cela crée une boucle de rétroaction positive, ou un effet de levier bénéfique, pour notre activité : nous comprenons où les clients emmènent la technologie, et nous planifions en conséquence.
Le goulot d'étranglement n'est plus seulement les GPU
Tae : Utiliserez-vous principalement les CPU Vera de Nvidia à l'avenir ?
Nick : Cela dépend de la charge de travail spécifique. Nous sommes guidés par la demande des clients. Nous nous attendons effectivement à être un adopteur précoce et important des CPU Vera, ce que nous avons déjà indiqué. Actuellement, notre parc est principalement composé d'AMD, mais cela pourrait changer avec le temps en fonction de la demande des clients. L'intérêt des clients pour les CPU Vera est très fort.
Brannin : C'est aussi un bon rappel de la façon dont fonctionnent nos contrats. Comme vous le savez probablement, plus de 98 % de nos revenus sont générés par des contrats. Nous ne devinons pas l'infrastructure que les clients veulent. Les clients nous indiquent très clairement la configuration dont ils ont besoin. Tout est axé sur le client. Ce sont les clients qui définissent ce que nous construisons.
Tae : Parlez-nous du paysage concurrentiel. Comment entrez-vous sur le marché et concurrencez-vous des néo-clouds comme SpaceX, Nebius, Oracle, ainsi que des fournisseurs de cloud hyperscale comme Azure, AWS, Google ?
Brannin : En termes de différenciation, je préfère voir les choses du point de vue de la validation par des tiers. Hors Chine, neuf des dix principaux laboratoires d'IA au monde utilisent notre plateforme. SemiAnalysis nous classe systématiquement au plus haut niveau en termes de performances. Je ne pense pas que nous obtenions notre allocation de GPU à cause d'une amitié personnelle avec Jensen.
Cela montre que les fournisseurs ont une grande confiance dans notre historique d'exécution et notre capacité technique, croyant que nous pouvons représenter au mieux leurs capacités produit à l'échelle mondiale.
Nick : Nous parvenons à gagner des clients hyperscale parce que nous sommes très doués pour l'exécution. Nous pouvons déployer ces systèmes très rapidement, et ils fonctionnent très bien. Nous gagnons des clients laboratoires de recherche parce que nous fournissons la version technologique la plus performante et la plus efficace par token.
Nous gagnons des clients entreprises parce que l'infrastructure fonctionne vraiment bien, et nous avons construit une couche d'orchestration exceptionnelle, reconnue par la note platine, entre autres.
Mais ce qui devient de plus en plus important, c'est que parmi les fournisseurs de cloud IA, nous avons construit la couche la plus mature de capacités couvrant l'inférence et les outils de développement, aidant réellement les entreprises à mettre l'IA en production.
Cela signifie que nous construisons et livrons des produits qui aident finalement les entreprises avec une maturité technologique relativement plus faible, à transformer les données en modèles, puis en agents pouvant être exécutés en interne, et nous pouvons vendre des services cloud CoreWeave en cross-selling dans ce processus.
Tae : Quel est le goulot d'étranglement actuel ? Les bâtiments de centres de données alimentés (powered shells) ? Les GPU ? Ou les électriciens ?
Brannin : Ce sont les powered shells, c'est-à-dire les bâtiments de centres de données avec l'alimentation. Plus précisément, les composants à l'intérieur de ces bâtiments. Vous avez mentionné les électriciens, c'est tout à fait juste. C'est un domaine complexe.
Mais le point important est que nous avons déjà 49 de ces sites en ligne et opérationnels. Nous ne misons pas tout sur un ou deux sites. Nous l'avons fait 49 fois.
C'est un historique d'exécution très solide.
Cela signifie également que nous avons accumulé une grande quantité de connaissances sur la façon de gérer les problèmes de chaîne d'approvisionnement, sur les fournisseurs avec lesquels il est approprié de travailler dans cette chaîne, et ceux avec lesquels ce n'est pas le cas.
Note de la rédaction : powered shells désigne le bâtiment du centre de données en lui-même, à l'exclusion du matériel serveur de calcul proprement dit.
Tae : Pouvez-vous nous dire quelque chose sur les coûts et les pénuries de mémoire HBM ? Comment gérez-vous cela ? Les clients doivent-ils supporter le coût de l'augmentation des prix ?
Nick : La réponse est oui. Notre modèle économique est conçu pour, au moment de signer les bons de commande GPU et de déterminer le coût que nous allons payer, verrouiller également le prix que nous facturons aux clients pour les GPU. Plus généralement, le prix du serveur, qui inclut évidemment le coût de la HBM.
C'est ainsi que nous isolons notre activité des fluctuations de prix quotidiennes.
Si le coût de nos composants augmente pour la prochaine transaction, nous refléterons ce coût dans le prix que nous pensons pouvoir facturer au client, protégeant ainsi notre marge bénéficiaire. Nous sommes très bien protégés pour répercuter ces coûts aux clients. C'est quelque chose que nous surveillons de très près.
Actuellement, l'obtention des composants n'est pas le plus grand goulot d'étranglement. Le plus grand goulot d'étranglement est le powered shell. Mais à un moment donné à l'avenir, cette réponse pourrait changer.
Tae : Comment prévoyez-vous le déploiement et la montée en puissance de Vera Rubin ? À quoi ressemblera le second semestre de cette année ?
Nick : Nous sommes manifestement la première entreprise au monde à avoir démarré et entièrement validé un rack VR, c'est-à-dire Vera Rubin. Nous l'avons fait l'année dernière pour le GB200 et le GB300. Je prévois que VR commencera à apparaître plus tard cette année.
Je prévois qu'une montée en puissance vraiment massive et très forte se poursuivra tout au long de 2027. Ce rythme est similaire à celui de la GB : la GB a commencé à apparaître en 2025, mais la montée en puissance vraiment massive a en fait eu lieu tout au long de 2026. C'est-à-dire qu'il y avait déjà un bon déploiement fin de l'année dernière, mais cette année est celle du déploiement vraiment massif de la GB.
Je prévois un rythme très similaire pour VR au cours des 12 à 18 prochains mois.





