Entretien avec les cofondateurs de CoreWeave, « action liée à Nvidia » : La demande d'IA semble s'intensifier chaque jour

marsbitPublié le 2026-06-19Dernière mise à jour le 2026-06-19

Résumé

Interview des dirigeants de CoreWeave : La demande d'IA semble « s'intensifier » quotidiennement CoreWeave, leader des services cloud de nouvelle génération (neocloud), a récemment partagé ses perspectives sur le marché de l'infrastructure IA. Ses dirigeants, Brannin McBee et Nick Robbins, soulignent que la demande ne faiblit pas ; au contraire, elle s'accentue chaque jour, portée par l'essor des agents IA, du raisonnement et des applications d'inférence en entreprise. Ils observent un changement structurel : le goulot d'étranglement ne se limite plus aux GPU. L'attention se porte désormais sur des défis d'infrastructure plus larges : la disponibilité des centres de données (powered shells), l'approvisionnement en CPU, en mémoire HBM, en stockage, ainsi que les capacités d'exécution de la chaîne logistique. CoreWeave, qui sert des clients majeurs comme OpenAI, Anthropic et Meta, constate une demande croissante pour les CPU (notamment les futurs Vera CPU de NVIDIA) et le stockage, nécessitant une refonte des conceptions de data centers. La différenciation de CoreWeave réside dans son excellence opérationnelle, sa rapidité de déploiement et ses performances validées par des tiers. Son modèle commercial, basé sur des contrats à long terme, lui permet de protéger ses marges en répercutant les coûts des composants comme la mémoire HBM. Le déploiement à grande échelle des nouvelles plates-formes comme Vera Rubin (VR) devrait suivre un calendrier similaire à celui des systèmes G...

Titre original : An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day

Auteur original : Tae Kim

Compilation originale : Peggy, BlockBeats

Note de la rédaction : Cet entretien offre une fenêtre sur le cycle de la puissance de calcul en IA : la demande ne s'est pas refroidie après la dernière vague de ruée vers les GPU, mais est au contraire encore stimulée par les agents, l'inférence et les applications d'IA de niveau entreprise.

Cet article a interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds. Le message central des dirigeants de CoreWeave est direct — la demande d'IA semble s'intensifier chaque jour de nouvelles manières, et le véritable goulot d'étranglement passe de la simple « disponibilité des GPU » à des problèmes d'infrastructure plus complexes : l'alimentation des bâtiments de centres de données, les CPU, le stockage, les électriciens, la capacité d'exécution de la chaîne d'approvisionnement, et la volonté des clients de payer pour la nouvelle génération de puissance de calcul.

La particularité de CoreWeave est qu'elle se situe au milieu de la chaîne de l'infrastructure IA : elle sert à la fois des clients leaders comme OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, mais ressent aussi directement les changements de demande des laboratoires de recherche, des clients entreprises et des fournisseurs de cloud hyperscale. Ainsi, elle ne voit pas seulement la « pénurie de GPU », mais aussi les changements structurels dans la nature même des charges de travail d'IA. Avec l'essor de l'IA agentielle et des modèles de raisonnement, la demande en puissance de calcul ne se concentre plus uniquement sur les GPU, l'importance des CPU et du stockage augmente également. La conception des nouveaux centres de données doit donc prévoir de l'espace pour les CPU Vera, les serveurs Vera Rubin et plus de stockage.

Cela explique pourquoi la concurrence dans l'infrastructure IA passe d'un simple approvisionnement en puces à une capacité de livraison d'ingénierie plus complète. Celui qui peut obtenir plus rapidement des centres de données alimentés, déployer des serveurs, fluidifier la chaîne d'approvisionnement et optimiser le coût par token est plus proche du cœur de ce cycle de dépenses en capital pour l'IA. CoreWeave insiste à plusieurs reprises sur le fait d'être « axé sur le client », ce qui cache en réalité un constat plus large : les fournisseurs de cloud IA ne vendent plus seulement de la puissance de calcul, mais restructurent à l'avance l'usine d'IA de la prochaine génération en fonction des feuilles de route de leurs clients les plus avancés.

Pour les investisseurs et les observateurs du secteur, le point le plus important de cet entretien n'est pas un chiffre ponctuel, mais la direction du changement de la demande en infrastructure IA : les GPU restent importants, mais les goulots d'étranglement se diffusent ; Nvidia reste central, mais les CPU, la HBM, le stockage et la capacité d'alimentation des centres de données deviennent de nouvelles variables ; la demande en IA continue de croître, mais les futurs gagnants pourraient être déterminés par la capacité à livrer de manière continue, stable et à grande échelle une infrastructure complexe.

Voici le texte original :

CoreWeave est considéré comme un leader de marché précoce et innovant dans le domaine des néo-clouds (nouveaux services cloud).

C'est le seul fournisseur de services cloud à avoir obtenu la note la plus élevée, la « note platine », de la part de l'institut de recherche en IA SemiAnalysis. Fondé en 2017, CoreWeave fournit une puissance de calcul GPU à grande échelle aux startups comme aux grandes entreprises.

Key Context a récemment interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds.

Voici les points édités de cette conversation :

La demande d'IA continue de s'intensifier

Tae : La vague de demande pour l'IA agentielle a-t-elle réellement commencé à exploser et à quel moment ?

Brannin : Nous avons vraiment vu le début au quatrième trimestre de l'année dernière. À l'époque, nous avions des discussions techniques avec les clients sur les produits qu'ils prévoyaient de lancer sur le marché au premier trimestre de cette année.

Cette perspective a toujours été très importante pour la façon dont nous percevons la demande de nos clients. Nous avons une relation technique profondément interconnectée avec nos clients. C'est cette relation qui nous permet de voir les tendances à l'avance, plutôt que de réagir après coup.

Si l'on considère les produits sur le marché de l'IA, je dirais que le premier trimestre a été le moment d'un énorme point d'inflexion pour l'inférence et la consommation d'IA, et cette accélération se poursuit encore aujourd'hui.

Tae : À quel stade en est la demande d'IA ? Y a-t-il un quelconque signe de ralentissement ces dernières semaines par rapport à il y a quelques mois ?

Nick : Elle semble s'intensifier chaque jour de nouvelles manières.

Tae : Parlez-nous de la tendance à la hausse de la demande en CPU par rapport aux GPU dans la vague de l'IA agentielle. Déployez-vous des rangées de racks de CPU Vera à côté de vos serveurs GPU Nvidia ?

Brannin : CoreWeave utilise des CPU depuis 2023. Nous avons toujours eu une gamme complète de produits cloud. Donc la question n'est pas de savoir si nous commençons juste à ajouter des CPU, mais plutôt de savoir ce dont les clients ont réellement besoin ? Cette demande augmente-t-elle de manière relative ? La réponse est oui, très clairement, c'est le cas.

Avec l'essor réel des capacités des agents et de l'inférence dans les modèles, la demande de stockage augmente également par rapport aux générations précédentes. Je pense que cette tendance va se poursuivre.

Nick : La réponse à votre question est oui. Vous verrez absolument un grand nombre de CPU Vera déployés à côté d'un grand nombre de serveurs Vera Rubin. L'année dernière, nous avons en fait fondamentalement repensé notre conception de base des centres de données pour prévoir de l'espace pour plus de stockage et plus de CPU, afin qu'ils puissent être déployés à côté des GPU.

Nous avons fait cela parce que nous occupons une position très unique dans l'écosystème. Nous sommes le seul fournisseur de cloud indépendant à servir tous les utilisateurs de technologie de pointe. Aucun autre fournisseur de cloud IA indépendant ne peut dire qu'Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, etc. sont ses clients.

Cela crée une boucle de rétroaction positive, ou un effet de levier bénéfique, pour notre activité : nous comprenons où les clients emmènent la technologie, et nous planifions en conséquence.

Le goulot d'étranglement n'est plus seulement les GPU

Tae : Utiliserez-vous principalement les CPU Vera de Nvidia à l'avenir ?

Nick : Cela dépend de la charge de travail spécifique. Nous sommes guidés par la demande des clients. Nous nous attendons effectivement à être un adopteur précoce et important des CPU Vera, ce que nous avons déjà indiqué. Actuellement, notre parc est principalement composé d'AMD, mais cela pourrait changer avec le temps en fonction de la demande des clients. L'intérêt des clients pour les CPU Vera est très fort.

Brannin : C'est aussi un bon rappel de la façon dont fonctionnent nos contrats. Comme vous le savez probablement, plus de 98 % de nos revenus sont générés par des contrats. Nous ne devinons pas l'infrastructure que les clients veulent. Les clients nous indiquent très clairement la configuration dont ils ont besoin. Tout est axé sur le client. Ce sont les clients qui définissent ce que nous construisons.

Tae : Parlez-nous du paysage concurrentiel. Comment entrez-vous sur le marché et concurrencez-vous des néo-clouds comme SpaceX, Nebius, Oracle, ainsi que des fournisseurs de cloud hyperscale comme Azure, AWS, Google ?

Brannin : En termes de différenciation, je préfère voir les choses du point de vue de la validation par des tiers. Hors Chine, neuf des dix principaux laboratoires d'IA au monde utilisent notre plateforme. SemiAnalysis nous classe systématiquement au plus haut niveau en termes de performances. Je ne pense pas que nous obtenions notre allocation de GPU à cause d'une amitié personnelle avec Jensen.

Cela montre que les fournisseurs ont une grande confiance dans notre historique d'exécution et notre capacité technique, croyant que nous pouvons représenter au mieux leurs capacités produit à l'échelle mondiale.

Nick : Nous parvenons à gagner des clients hyperscale parce que nous sommes très doués pour l'exécution. Nous pouvons déployer ces systèmes très rapidement, et ils fonctionnent très bien. Nous gagnons des clients laboratoires de recherche parce que nous fournissons la version technologique la plus performante et la plus efficace par token.

Nous gagnons des clients entreprises parce que l'infrastructure fonctionne vraiment bien, et nous avons construit une couche d'orchestration exceptionnelle, reconnue par la note platine, entre autres.

Mais ce qui devient de plus en plus important, c'est que parmi les fournisseurs de cloud IA, nous avons construit la couche la plus mature de capacités couvrant l'inférence et les outils de développement, aidant réellement les entreprises à mettre l'IA en production.

Cela signifie que nous construisons et livrons des produits qui aident finalement les entreprises avec une maturité technologique relativement plus faible, à transformer les données en modèles, puis en agents pouvant être exécutés en interne, et nous pouvons vendre des services cloud CoreWeave en cross-selling dans ce processus.

Tae : Quel est le goulot d'étranglement actuel ? Les bâtiments de centres de données alimentés (powered shells) ? Les GPU ? Ou les électriciens ?

Brannin : Ce sont les powered shells, c'est-à-dire les bâtiments de centres de données avec l'alimentation. Plus précisément, les composants à l'intérieur de ces bâtiments. Vous avez mentionné les électriciens, c'est tout à fait juste. C'est un domaine complexe.

Mais le point important est que nous avons déjà 49 de ces sites en ligne et opérationnels. Nous ne misons pas tout sur un ou deux sites. Nous l'avons fait 49 fois.

C'est un historique d'exécution très solide.

Cela signifie également que nous avons accumulé une grande quantité de connaissances sur la façon de gérer les problèmes de chaîne d'approvisionnement, sur les fournisseurs avec lesquels il est approprié de travailler dans cette chaîne, et ceux avec lesquels ce n'est pas le cas.

Note de la rédaction : powered shells désigne le bâtiment du centre de données en lui-même, à l'exclusion du matériel serveur de calcul proprement dit.

Tae : Pouvez-vous nous dire quelque chose sur les coûts et les pénuries de mémoire HBM ? Comment gérez-vous cela ? Les clients doivent-ils supporter le coût de l'augmentation des prix ?

Nick : La réponse est oui. Notre modèle économique est conçu pour, au moment de signer les bons de commande GPU et de déterminer le coût que nous allons payer, verrouiller également le prix que nous facturons aux clients pour les GPU. Plus généralement, le prix du serveur, qui inclut évidemment le coût de la HBM.

C'est ainsi que nous isolons notre activité des fluctuations de prix quotidiennes.

Si le coût de nos composants augmente pour la prochaine transaction, nous refléterons ce coût dans le prix que nous pensons pouvoir facturer au client, protégeant ainsi notre marge bénéficiaire. Nous sommes très bien protégés pour répercuter ces coûts aux clients. C'est quelque chose que nous surveillons de très près.

Actuellement, l'obtention des composants n'est pas le plus grand goulot d'étranglement. Le plus grand goulot d'étranglement est le powered shell. Mais à un moment donné à l'avenir, cette réponse pourrait changer.

Tae : Comment prévoyez-vous le déploiement et la montée en puissance de Vera Rubin ? À quoi ressemblera le second semestre de cette année ?

Nick : Nous sommes manifestement la première entreprise au monde à avoir démarré et entièrement validé un rack VR, c'est-à-dire Vera Rubin. Nous l'avons fait l'année dernière pour le GB200 et le GB300. Je prévois que VR commencera à apparaître plus tard cette année.

Je prévois qu'une montée en puissance vraiment massive et très forte se poursuivra tout au long de 2027. Ce rythme est similaire à celui de la GB : la GB a commencé à apparaître en 2025, mais la montée en puissance vraiment massive a en fait eu lieu tout au long de 2026. C'est-à-dire qu'il y avait déjà un bon déploiement fin de l'année dernière, mais cette année est celle du déploiement vraiment massif de la GB.

Je prévois un rythme très similaire pour VR au cours des 12 à 18 prochains mois.

Questions liées

QSelon l'interview, comment la demande en IA évolue-t-elle actuellement selon CoreWeave ?

ASelon les dirigeants de CoreWeave, la demande en IA semble s'« intensifier » chaque jour de nouvelles manières, sans signe de ralentissement.

QQuel est le principal goulot d'étranglement pour l'infrastructure IA aujourd'hui, selon CoreWeave ?

ALe principal goulot d'étranglement n'est plus seulement les GPU, mais les « powered shells » (enveloppes de centres de données alimentées), ainsi que la disponibilité des composants internes comme les CPU, le stockage, les électriciens et la capacité d'exécution de la chaîne d'approvisionnement.

QPourquoi CoreWeave est-il dans une position unique pour observer l'évolution des besoins en IA ?

ACoreWeave est unique car il sert à la fois les principaux clients comme OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, et perçoit directement les changements de demande des laboratoires de recherche, des entreprises et des hyperscalers. Cela lui permet de voir les changements structurels de la charge de travail IA, pas seulement les pénuries de GPU.

QQuelle tendance CoreWeave observe-t-il concernant les besoins en CPU et en stockage dans l'ère de l'IA agentique ?

AAvec l'essor des agents IA et des capacités de raisonnement, la demande relative en CPU et en stockage augmente de manière significative par rapport aux générations précédentes. CoreWeave a d'ailleurs repensé ses conceptions de centres de données pour prévoir plus d'espace pour ces composants.

QComment CoreWeave se protège-t-il et protège-t-il ses clients des fluctuations de prix des composants comme la mémoire HBM ?

ALeur modèle commercial est conçu pour verrouiller le prix facturé aux clients au moment de la commande des GPU/serveurs, ce qui inclut le coût de la mémoire HBM. Ils répercutent les augmentations de coût des composants sur les prix futurs pour les clients, protégeant ainsi leurs marges.

Lectures associées

En dehors du terrain : le jeu spéculatif autour de la Coupe du Monde

Le tournoi de la Coupe du Monde dépasse largement le cadre sportif pour devenir un immense terrain de jeu spéculatif mondial. L'article explore comment l'événement concentre, sur un mois, un écosystème de paris et d'opportunités financières. Il passe en revue plusieurs domaines clés : Le marché des prédictions (Polymarket, Kalshi) connaît une croissance fulgurante, dépassant parfois en popularité les applications de pari traditionnelles, avec des histoires de gains et pertes spectaculaires captant l'attention. Les paris sportifs légaux restent cependant le pilier principal, avec des sommes énormes engagées, surtout si l'équipe nationale locale performe. Les marchés boursiers ne sont pas en reste, avec l'apparition d'« actions concept » liées à la consommation des fans (nourriture, bière, équipement) dont les cours fluctuent au gré des résultats des matchs. Le marché secondaire des billets est lui aussi un champ de spéculation intense, où les prix explosent pour les matches très attendus (ex: ceux de Cristiano Ronaldo) ou s'effondrent pour d'autres, avec même des pratiques proches de la vente à découvert. Les objets de collection, comme les autocollants Panini ou les maillots en édition limitée, voient leur valeur monter en flèche sur les plateformes de revente. L'univers des cryptomonnaies génère une frénésie spéculative à haut risque autour de tokens Meme non officiels, souvent liés à des équipes ou des joueurs, conduisant à des hausses vertigineuses suivies de chutes brutales. Enfin, une couche d'opportunités émerge en fournissant des informations et des outils aux spéculateurs eux-mêmes : sites de suivi des prix des billets, services d'alerte ou groupes payants de conseils de paris. Le véritable gagnant n'est pas nécessairement celui qui prédit le vainqueur, mais celui qui comprend et exploite les flux d'attention et de demande générés par le tournoi. Après le coup de sifflet final, un vaste réseau de transactions, hors du terrain, a déjà réglé ses comptes sur les marchés globaux.

marsbitIl y a 22 mins

En dehors du terrain : le jeu spéculatif autour de la Coupe du Monde

marsbitIl y a 22 mins

Comment Codex utilise-t-il l'ordinateur ? Trois points d'entrée et les limites d'autorisation

L'article présente les trois méthodes utilisées par Codex pour interagir avec un ordinateur : Computer Use, l'extension Chrome et le navigateur intégré à l'application. Chaque méthode correspond à des scénarios, des périmètres d'autorisation et des niveaux de confiance distincts. Computer Use offre la couverture la plus large, permettant de contrôler les applications natives macOS/Windows, les paramètres système et même de gérer des flux de travail multi-applications via l'interface graphique. Il est adapté aux processus sans API, mais est plus lent et a le périmètre de confiance le plus large. L'extension Chrome donne accès à l'état de connexion, aux cookies et aux onglets du navigateur, idéale pour les tâches liées à Gmail, LinkedIn, Salesforce ou pour des recherches nécessitant une authentification. Le navigateur intégré est isolé, sans état de connexion, et convient parfaitement au développement et au débogage web local (serveurs locaux, bugs visuels, maquettes). Le principe fondamental est de choisir l'interface la plus étroite, sécurisée et structurée possible pour une tâche donnée. Il faut privilégier les plugins ou MCP, utiliser le navigateur intégré pour le développement web, recourir à l'extension Chrome lorsque l'identité de l'utilisateur est requise, et ne recourir à Computer Use qu'en dernier recours pour les tâches GUI non couvertes par des outils structurés. Appshots est présenté comme un outil complémentaire permettant de "montrer" le contexte de l'écran à Codex pour l'input, tandis que les trois autres méthodes concernent l'action (output). Cette approche stratifiée illustre la clé de la productisation des agents IA : restreindre les permissions, clarifier les frontières et laisser à l'utilisateur le contrôle des actions critiques.

marsbitIl y a 1 h

Comment Codex utilise-t-il l'ordinateur ? Trois points d'entrée et les limites d'autorisation

marsbitIl y a 1 h

La "loi de fer" de l'équipement de puces est en train d'être brisée

Depuis longtemps, le pouvoir de négociation dans la chaîne d'approvisionnement des semi-conducteurs favorisait les clients. Les fabricants d'équipements subissaient des pressions pour réduire leurs prix, surtout lors des commandes répétées. Cependant, cette "loi" du marché acheteur est en train de s'inverser. Récemment, des fournisseurs d'équipements de SK Hynix ont même demandé une augmentation de prix de 3 à 4 %, un fait rare. Ce changement est dû au déséquilibre entre l'offre et la demande causé par l'essor de l'IA. L'expansion rapide des capacités de production est devenue cruciale pour répondre à la demande de puces AI, transformant l'accès aux équipements en une course prioritaire. Un exemple frappant est l'explosion de la demande pour les équipements de thermocompression (TCB), essentiels à la production de mémoires HBM4. Des sociétés comme Hanmi Semiconductor, Hanwha Semitech et ASMPT reçoivent d'importantes commandes. Bien que le *Hybrid Bonding* (collage hybride) soit considéré comme plus avancé, le TCB reste dominant pour le HBM4 grâce à sa maturité, prolongeant ainsi son cycle de vie. La pénurie s'étend également aux équipements de test, dont la production est freinée par le manque de composants clés comme les FPGA et les CPU, eux-mêmes captés par l'industrie des data centers pour l'IA. Cette dynamique signale le début d'un nouveau cycle majeur de croissance pour l'ensemble du secteur des équipements semi-conducteurs, porté par l'investissement dans l'IA. Les leaders des domaines de la logique avancée, du HBM et de l'emballage avancé (comme le CoWoS) détiennent désormais un pouvoir de négociation renforcé. Ils ne vendent plus simplement des machines, mais la capacité à matérialiser la production à l'ère de l'IA, redéfinissant ainsi les rapports de force dans l'industrie.

marsbitIl y a 2 h

La "loi de fer" de l'équipement de puces est en train d'être brisée

marsbitIl y a 2 h

Trading

Spot
Futures
活动图片