Entretien avec les cofondateurs de CoreWeave, « action liée à Nvidia » : La demande d'IA semble s'intensifier chaque jour

marsbitPublié le 2026-06-19Dernière mise à jour le 2026-06-19

Résumé

Interview des dirigeants de CoreWeave : La demande d'IA semble « s'intensifier » quotidiennement CoreWeave, leader des services cloud de nouvelle génération (neocloud), a récemment partagé ses perspectives sur le marché de l'infrastructure IA. Ses dirigeants, Brannin McBee et Nick Robbins, soulignent que la demande ne faiblit pas ; au contraire, elle s'accentue chaque jour, portée par l'essor des agents IA, du raisonnement et des applications d'inférence en entreprise. Ils observent un changement structurel : le goulot d'étranglement ne se limite plus aux GPU. L'attention se porte désormais sur des défis d'infrastructure plus larges : la disponibilité des centres de données (powered shells), l'approvisionnement en CPU, en mémoire HBM, en stockage, ainsi que les capacités d'exécution de la chaîne logistique. CoreWeave, qui sert des clients majeurs comme OpenAI, Anthropic et Meta, constate une demande croissante pour les CPU (notamment les futurs Vera CPU de NVIDIA) et le stockage, nécessitant une refonte des conceptions de data centers. La différenciation de CoreWeave réside dans son excellence opérationnelle, sa rapidité de déploiement et ses performances validées par des tiers. Son modèle commercial, basé sur des contrats à long terme, lui permet de protéger ses marges en répercutant les coûts des composants comme la mémoire HBM. Le déploiement à grande échelle des nouvelles plates-formes comme Vera Rubin (VR) devrait suivre un calendrier similaire à celui des systèmes G...

Titre original : An Interview with CoreWeave Executives: AI Demand Seems to 'Intensify' Every Day

Auteur original : Tae Kim

Compilation originale : Peggy, BlockBeats

Note de la rédaction : Cet entretien offre une fenêtre sur le cycle de la puissance de calcul en IA : la demande ne s'est pas refroidie après la dernière vague de ruée vers les GPU, mais est au contraire encore stimulée par les agents, l'inférence et les applications d'IA de niveau entreprise.

Cet article a interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds. Le message central des dirigeants de CoreWeave est direct — la demande d'IA semble s'intensifier chaque jour de nouvelles manières, et le véritable goulot d'étranglement passe de la simple « disponibilité des GPU » à des problèmes d'infrastructure plus complexes : l'alimentation des bâtiments de centres de données, les CPU, le stockage, les électriciens, la capacité d'exécution de la chaîne d'approvisionnement, et la volonté des clients de payer pour la nouvelle génération de puissance de calcul.

La particularité de CoreWeave est qu'elle se situe au milieu de la chaîne de l'infrastructure IA : elle sert à la fois des clients leaders comme OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, mais ressent aussi directement les changements de demande des laboratoires de recherche, des clients entreprises et des fournisseurs de cloud hyperscale. Ainsi, elle ne voit pas seulement la « pénurie de GPU », mais aussi les changements structurels dans la nature même des charges de travail d'IA. Avec l'essor de l'IA agentielle et des modèles de raisonnement, la demande en puissance de calcul ne se concentre plus uniquement sur les GPU, l'importance des CPU et du stockage augmente également. La conception des nouveaux centres de données doit donc prévoir de l'espace pour les CPU Vera, les serveurs Vera Rubin et plus de stockage.

Cela explique pourquoi la concurrence dans l'infrastructure IA passe d'un simple approvisionnement en puces à une capacité de livraison d'ingénierie plus complète. Celui qui peut obtenir plus rapidement des centres de données alimentés, déployer des serveurs, fluidifier la chaîne d'approvisionnement et optimiser le coût par token est plus proche du cœur de ce cycle de dépenses en capital pour l'IA. CoreWeave insiste à plusieurs reprises sur le fait d'être « axé sur le client », ce qui cache en réalité un constat plus large : les fournisseurs de cloud IA ne vendent plus seulement de la puissance de calcul, mais restructurent à l'avance l'usine d'IA de la prochaine génération en fonction des feuilles de route de leurs clients les plus avancés.

Pour les investisseurs et les observateurs du secteur, le point le plus important de cet entretien n'est pas un chiffre ponctuel, mais la direction du changement de la demande en infrastructure IA : les GPU restent importants, mais les goulots d'étranglement se diffusent ; Nvidia reste central, mais les CPU, la HBM, le stockage et la capacité d'alimentation des centres de données deviennent de nouvelles variables ; la demande en IA continue de croître, mais les futurs gagnants pourraient être déterminés par la capacité à livrer de manière continue, stable et à grande échelle une infrastructure complexe.

Voici le texte original :

CoreWeave est considéré comme un leader de marché précoce et innovant dans le domaine des néo-clouds (nouveaux services cloud).

C'est le seul fournisseur de services cloud à avoir obtenu la note la plus élevée, la « note platine », de la part de l'institut de recherche en IA SemiAnalysis. Fondé en 2017, CoreWeave fournit une puissance de calcul GPU à grande échelle aux startups comme aux grandes entreprises.

Key Context a récemment interviewé Brannin McBee, cofondateur et directeur du développement de CoreWeave, ainsi que Nick Robbins, vice-président du développement d'entreprise et des relations avec les investisseurs, pour discuter de la demande en IA et de l'état actuel du marché des néo-clouds.

Voici les points édités de cette conversation :

La demande d'IA continue de s'intensifier

Tae : La vague de demande pour l'IA agentielle a-t-elle réellement commencé à exploser et à quel moment ?

Brannin : Nous avons vraiment vu le début au quatrième trimestre de l'année dernière. À l'époque, nous avions des discussions techniques avec les clients sur les produits qu'ils prévoyaient de lancer sur le marché au premier trimestre de cette année.

Cette perspective a toujours été très importante pour la façon dont nous percevons la demande de nos clients. Nous avons une relation technique profondément interconnectée avec nos clients. C'est cette relation qui nous permet de voir les tendances à l'avance, plutôt que de réagir après coup.

Si l'on considère les produits sur le marché de l'IA, je dirais que le premier trimestre a été le moment d'un énorme point d'inflexion pour l'inférence et la consommation d'IA, et cette accélération se poursuit encore aujourd'hui.

Tae : À quel stade en est la demande d'IA ? Y a-t-il un quelconque signe de ralentissement ces dernières semaines par rapport à il y a quelques mois ?

Nick : Elle semble s'intensifier chaque jour de nouvelles manières.

Tae : Parlez-nous de la tendance à la hausse de la demande en CPU par rapport aux GPU dans la vague de l'IA agentielle. Déployez-vous des rangées de racks de CPU Vera à côté de vos serveurs GPU Nvidia ?

Brannin : CoreWeave utilise des CPU depuis 2023. Nous avons toujours eu une gamme complète de produits cloud. Donc la question n'est pas de savoir si nous commençons juste à ajouter des CPU, mais plutôt de savoir ce dont les clients ont réellement besoin ? Cette demande augmente-t-elle de manière relative ? La réponse est oui, très clairement, c'est le cas.

Avec l'essor réel des capacités des agents et de l'inférence dans les modèles, la demande de stockage augmente également par rapport aux générations précédentes. Je pense que cette tendance va se poursuivre.

Nick : La réponse à votre question est oui. Vous verrez absolument un grand nombre de CPU Vera déployés à côté d'un grand nombre de serveurs Vera Rubin. L'année dernière, nous avons en fait fondamentalement repensé notre conception de base des centres de données pour prévoir de l'espace pour plus de stockage et plus de CPU, afin qu'ils puissent être déployés à côté des GPU.

Nous avons fait cela parce que nous occupons une position très unique dans l'écosystème. Nous sommes le seul fournisseur de cloud indépendant à servir tous les utilisateurs de technologie de pointe. Aucun autre fournisseur de cloud IA indépendant ne peut dire qu'Anthropic, OpenAI, Meta, Google, Microsoft, Nvidia, etc. sont ses clients.

Cela crée une boucle de rétroaction positive, ou un effet de levier bénéfique, pour notre activité : nous comprenons où les clients emmènent la technologie, et nous planifions en conséquence.

Le goulot d'étranglement n'est plus seulement les GPU

Tae : Utiliserez-vous principalement les CPU Vera de Nvidia à l'avenir ?

Nick : Cela dépend de la charge de travail spécifique. Nous sommes guidés par la demande des clients. Nous nous attendons effectivement à être un adopteur précoce et important des CPU Vera, ce que nous avons déjà indiqué. Actuellement, notre parc est principalement composé d'AMD, mais cela pourrait changer avec le temps en fonction de la demande des clients. L'intérêt des clients pour les CPU Vera est très fort.

Brannin : C'est aussi un bon rappel de la façon dont fonctionnent nos contrats. Comme vous le savez probablement, plus de 98 % de nos revenus sont générés par des contrats. Nous ne devinons pas l'infrastructure que les clients veulent. Les clients nous indiquent très clairement la configuration dont ils ont besoin. Tout est axé sur le client. Ce sont les clients qui définissent ce que nous construisons.

Tae : Parlez-nous du paysage concurrentiel. Comment entrez-vous sur le marché et concurrencez-vous des néo-clouds comme SpaceX, Nebius, Oracle, ainsi que des fournisseurs de cloud hyperscale comme Azure, AWS, Google ?

Brannin : En termes de différenciation, je préfère voir les choses du point de vue de la validation par des tiers. Hors Chine, neuf des dix principaux laboratoires d'IA au monde utilisent notre plateforme. SemiAnalysis nous classe systématiquement au plus haut niveau en termes de performances. Je ne pense pas que nous obtenions notre allocation de GPU à cause d'une amitié personnelle avec Jensen.

Cela montre que les fournisseurs ont une grande confiance dans notre historique d'exécution et notre capacité technique, croyant que nous pouvons représenter au mieux leurs capacités produit à l'échelle mondiale.

Nick : Nous parvenons à gagner des clients hyperscale parce que nous sommes très doués pour l'exécution. Nous pouvons déployer ces systèmes très rapidement, et ils fonctionnent très bien. Nous gagnons des clients laboratoires de recherche parce que nous fournissons la version technologique la plus performante et la plus efficace par token.

Nous gagnons des clients entreprises parce que l'infrastructure fonctionne vraiment bien, et nous avons construit une couche d'orchestration exceptionnelle, reconnue par la note platine, entre autres.

Mais ce qui devient de plus en plus important, c'est que parmi les fournisseurs de cloud IA, nous avons construit la couche la plus mature de capacités couvrant l'inférence et les outils de développement, aidant réellement les entreprises à mettre l'IA en production.

Cela signifie que nous construisons et livrons des produits qui aident finalement les entreprises avec une maturité technologique relativement plus faible, à transformer les données en modèles, puis en agents pouvant être exécutés en interne, et nous pouvons vendre des services cloud CoreWeave en cross-selling dans ce processus.

Tae : Quel est le goulot d'étranglement actuel ? Les bâtiments de centres de données alimentés (powered shells) ? Les GPU ? Ou les électriciens ?

Brannin : Ce sont les powered shells, c'est-à-dire les bâtiments de centres de données avec l'alimentation. Plus précisément, les composants à l'intérieur de ces bâtiments. Vous avez mentionné les électriciens, c'est tout à fait juste. C'est un domaine complexe.

Mais le point important est que nous avons déjà 49 de ces sites en ligne et opérationnels. Nous ne misons pas tout sur un ou deux sites. Nous l'avons fait 49 fois.

C'est un historique d'exécution très solide.

Cela signifie également que nous avons accumulé une grande quantité de connaissances sur la façon de gérer les problèmes de chaîne d'approvisionnement, sur les fournisseurs avec lesquels il est approprié de travailler dans cette chaîne, et ceux avec lesquels ce n'est pas le cas.

Note de la rédaction : powered shells désigne le bâtiment du centre de données en lui-même, à l'exclusion du matériel serveur de calcul proprement dit.

Tae : Pouvez-vous nous dire quelque chose sur les coûts et les pénuries de mémoire HBM ? Comment gérez-vous cela ? Les clients doivent-ils supporter le coût de l'augmentation des prix ?

Nick : La réponse est oui. Notre modèle économique est conçu pour, au moment de signer les bons de commande GPU et de déterminer le coût que nous allons payer, verrouiller également le prix que nous facturons aux clients pour les GPU. Plus généralement, le prix du serveur, qui inclut évidemment le coût de la HBM.

C'est ainsi que nous isolons notre activité des fluctuations de prix quotidiennes.

Si le coût de nos composants augmente pour la prochaine transaction, nous refléterons ce coût dans le prix que nous pensons pouvoir facturer au client, protégeant ainsi notre marge bénéficiaire. Nous sommes très bien protégés pour répercuter ces coûts aux clients. C'est quelque chose que nous surveillons de très près.

Actuellement, l'obtention des composants n'est pas le plus grand goulot d'étranglement. Le plus grand goulot d'étranglement est le powered shell. Mais à un moment donné à l'avenir, cette réponse pourrait changer.

Tae : Comment prévoyez-vous le déploiement et la montée en puissance de Vera Rubin ? À quoi ressemblera le second semestre de cette année ?

Nick : Nous sommes manifestement la première entreprise au monde à avoir démarré et entièrement validé un rack VR, c'est-à-dire Vera Rubin. Nous l'avons fait l'année dernière pour le GB200 et le GB300. Je prévois que VR commencera à apparaître plus tard cette année.

Je prévois qu'une montée en puissance vraiment massive et très forte se poursuivra tout au long de 2027. Ce rythme est similaire à celui de la GB : la GB a commencé à apparaître en 2025, mais la montée en puissance vraiment massive a en fait eu lieu tout au long de 2026. C'est-à-dire qu'il y avait déjà un bon déploiement fin de l'année dernière, mais cette année est celle du déploiement vraiment massif de la GB.

Je prévois un rythme très similaire pour VR au cours des 12 à 18 prochains mois.

Questions liées

QSelon l'interview, comment la demande en IA évolue-t-elle actuellement selon CoreWeave ?

ASelon les dirigeants de CoreWeave, la demande en IA semble s'« intensifier » chaque jour de nouvelles manières, sans signe de ralentissement.

QQuel est le principal goulot d'étranglement pour l'infrastructure IA aujourd'hui, selon CoreWeave ?

ALe principal goulot d'étranglement n'est plus seulement les GPU, mais les « powered shells » (enveloppes de centres de données alimentées), ainsi que la disponibilité des composants internes comme les CPU, le stockage, les électriciens et la capacité d'exécution de la chaîne d'approvisionnement.

QPourquoi CoreWeave est-il dans une position unique pour observer l'évolution des besoins en IA ?

ACoreWeave est unique car il sert à la fois les principaux clients comme OpenAI, Anthropic, Meta, Google, Microsoft, Nvidia, et perçoit directement les changements de demande des laboratoires de recherche, des entreprises et des hyperscalers. Cela lui permet de voir les changements structurels de la charge de travail IA, pas seulement les pénuries de GPU.

QQuelle tendance CoreWeave observe-t-il concernant les besoins en CPU et en stockage dans l'ère de l'IA agentique ?

AAvec l'essor des agents IA et des capacités de raisonnement, la demande relative en CPU et en stockage augmente de manière significative par rapport aux générations précédentes. CoreWeave a d'ailleurs repensé ses conceptions de centres de données pour prévoir plus d'espace pour ces composants.

QComment CoreWeave se protège-t-il et protège-t-il ses clients des fluctuations de prix des composants comme la mémoire HBM ?

ALeur modèle commercial est conçu pour verrouiller le prix facturé aux clients au moment de la commande des GPU/serveurs, ce qui inclut le coût de la mémoire HBM. Ils répercutent les augmentations de coût des composants sur les prix futurs pour les clients, protégeant ainsi leurs marges.

Lectures associées

La Chute du STRC de Strategy Montre le Risque des Produits de Crédit Liés au Bitcoin

La chute de l'action privilégiée STRC de Strategy (ex-MicroStrategy) met en lumière les risques inhérents aux produits de crédit liés au Bitcoin. L'instrument, conçu pour générer du rendement tout en finançant l'accumulation de BTC par l'entreprise, a fortement décroché en dessous de sa valeur nominale de 100$, atteignant un plus bas à 82,53$. Le PDG de Strive, Matt Cole, a qualifié cet événement de "purge de l'effet de levier", soulignant qu'il s'agissait davantage de ventes forcées sur le marché secondaire que d'un défaut de paiement de l'émetteur. Cet épisode illustre comment la volatilité du Bitcoin, combinée à l'utilisation du levier par les investisseurs, peut provoquer des stress soudains. Bien que Strategy continue ses paiements, la décote importante remet en question la perception de stabilité de ce type de titres et révèle la complexité croissante des stratégies de trésorerie Bitcoin. L'essentiel est que ces instruments sophistiqués comportent des risques distincts de la simple détention de BTC ou des actions ordinaires, notamment en périodes de tensions sur les liquidités.

bitcoinistIl y a 1 h

La Chute du STRC de Strategy Montre le Risque des Produits de Crédit Liés au Bitcoin

bitcoinistIl y a 1 h

La Haute Cour d'Australie offre une victoire majeure à l'ASIC dans l'affaire du produit à rendement crypto de Block Earner

La Haute Cour d’Australie a donné raison à l’autorité des marchés financiers (ASIC) dans une affaire concernant le produit à rendement fixe « Earner » de Block Earner. La cour a jugé à l’unanimité que ce produit crypto, proposé entre mars et novembre 2022, constituait un produit financier et un dérivé, soumis à la réglementation existante. Block Earner aurait donc dû détenir une licence de services financiers australienne. L’affaire est renvoyée devant la Cour fédérale pour déterminer les sanctions. Ce verdict établit un précédent important : il confirme que les produits crypto offrant des rendements structurés ou une exposition de type dérivé peuvent être soumis aux règles de licence, indépendamment de leur étiquette technologique. Bien que le produit en cause ne soit plus commercialisé, la décision renforce la position de l’ASIC pour les futurs cas similaires et s’inscrit dans une tendance mondiale de régulation des produits de rendement crypto. Pour les entreprises, cela signifie que les offres générant des rendements via le déploiement d’actifs par un tiers risquent d’être considérées comme des produits d’investissement. Pour les consommateurs, cela rappelle que ces produits comportent des risques spécifiques et exigent une structure réglementaire appropriée. L’industrie crypto australienne devra désormais composer avec ce cadre réglementaire plus strict.

bitcoinistIl y a 4 h

La Haute Cour d'Australie offre une victoire majeure à l'ASIC dans l'affaire du produit à rendement crypto de Block Earner

bitcoinistIl y a 4 h

Blockchain.com Élargit l'Accès aux Actions Tokenisées Grâce à Ondo Finance

Blockchain.com et Ondo Finance ont étendu l'accès aux actions et ETF américains tokenisés via l'écosystème de portefeuille Blockchain.com. Ce partenariat vise à intégrer des actifs du monde réel réglementés dans une interface crypto native pour les utilisateurs éligibles, en ciblant particulièrement un public international. L'initiative s'inscrit dans une tendance plus large où les portefeuilles et exchanges cherchent à rendre les actifs traditionnels tokenisés aussi simples à utiliser que les cryptomonnaies. Ondo Finance, acteur clé du marché des actifs réels tokenisés (RWA), fournit les produits, tandis que Blockchain.com offre un large canal de distribution. Malgré la croissance concurrentielle du secteur, des défis persistent concernant la garde d'actifs, la conformité et l'expérience utilisateur, que cette intégration vise à surmonter.

bitcoinistIl y a 6 h

Blockchain.com Élargit l'Accès aux Actions Tokenisées Grâce à Ondo Finance

bitcoinistIl y a 6 h

Les CPU retrouvent leur place à la table : le coup d'envoi d'un spectacle « d'accession au pouvoir » de 170 milliards de dollars

La scène des processeurs (CPU) pour serveurs connaît une transformation majeure, catalysée par l'ère de l'IA Agent (agente). Alors que le GPU était au cœur de l'entraînement des grands modèles, le passage à la phase d'inférence et aux tâches d'Agent complexes (appels d'outils, raisonnements multi-étapes) renverse la donne : le CPU assume désormais 70% à plus de 90% de la charge de travail. Ce changement se traduit par un besoin accru de cœurs, de mémoire et de performances de gestion des données intermédiaires (comme le KV Cache), dépassant souvent la capacité mémoire limitée des GPU. Cette nouvelle dynamique modifie radicalement le ratio CPU/GPU dans les serveurs IA, passant d'environ 1:8 pour l'entraînement à 1:4 pour l'inférence, et approchant même 1:1 pour les scénarios Agent. Cette demande explosive, qualifiée de "variable la plus inattendue du cycle actuel de l'IA", entraîne une pression sur l'offre et une hausse des prix de 10% à 15% pour les CPU serveurs, du jamais-vu depuis plus de dix ans. Les acteurs historiques (Intel, AMD) et nouveaux (NVIDIA avec sa puce ARM Vera) se positionnent sur ce marché dont la taille potentielle est réévaluée à la hausse, pouvant atteindre 1700 milliards de dollars d'ici 2030 selon certaines analyses. Cette croissance provient non seulement des CPU d'accompagnement des GPU en cluster, mais aussi d'un nouveau segment : les nœuds CPU indépendants dédiés à l'exécution des Agents. En Chine, cette tendance mondiale coïncide avec les impératifs du "Xin Chuang" (remplacement des imports), offrant une opportunité aux fabricants locaux de CPU (comme Hygon, Huawei Kunpeng) et aux entreprises de la chaîne d'approvisionnement (emballage/test, puces d'interface mémoire). La maturité accélérée des outils logiciels pour les puces domestiques est un signe positif pour l'écosystème. L'enjeu n'est plus la performance brute d'une puce unique, mais la capacité de synergie entre CPU et GPU pour l'IA à grande échelle.

marsbitIl y a 6 h

Les CPU retrouvent leur place à la table : le coup d'envoi d'un spectacle « d'accession au pouvoir » de 170 milliards de dollars

marsbitIl y a 6 h

TechFlow Intelligence : Le Directeur AI d'AMD critique publiquement Claude Code pour être "devenu plus bête et plus paresseux", Trump affirme qu'un cessez-le-feu général aura lieu dans le détroit d'Ormuz mais que 80 mines y restent

Selon un rapport exclusif de Wired, SK Telecom, partenaire stratégique d'Anthropic, fait l'objet d'un examen des contrôles à l'exportation américains concernant le transfert technologique potentiel du modèle Mythos. Par ailleurs, Z.AI a lancé le modèle GLM-5.2, rivalisant avec Claude Opus et n'utilisant aucun puce Nvidia, illustrant une voie chinoise en matière de puissance de calcul. Dans le secteur des semi-conducteurs, Amazon envisage de commercialiser ses puces AI maison, tandis que des allégations américaines sur des équipements ASML avancés en Chine sont contestées par l'entreprise. Du côté de la sécurité, GitHub a vu plus de 10 000 dépôts distribuer des logiciels malveillants, et Apple a corrigé une faille critique d'écoute sur les Beats Studio Buds. Sur les marchés, les actions semi-conducteurs ont bondi, notamment Intel (+10.6%). Sur le plan géopolitique, bien qu'un accord ait été annoncé concernant le détroit d'Hormuz, l'association Intertanko signale qu'environ 80 mines y restent actives, retardant le transit de pétroliers chargés de 80 millions de barils. L'Iran a reporté un déplacement diplomatique en Suisse, et l'ancien président Trump a qualifié l'accord avec l'Iran de "reddition inconditionnelle". En résumé, tandis que les tensions géopolitiques laissent persister des incertitudes opérationnelles, les avancées et restructurations technologiques, notamment dans les puces et l'IA, se poursuivent à un rythme soutenu.

marsbitIl y a 7 h

TechFlow Intelligence : Le Directeur AI d'AMD critique publiquement Claude Code pour être "devenu plus bête et plus paresseux", Trump affirme qu'un cessez-le-feu général aura lieu dans le détroit d'Ormuz mais que 80 mines y restent