Auteurs : Caleb Shack, Alana Levin
Traduction : Jia Huan, ChainCatcher
Chez Variant, nous sommes passionnés par l'exploration de nouveaux marchés. Les nouvelles classes d'actifs, les produits financiers, l'émission d'actifs, l'élargissement de l'accès aux marchés et les nouvelles façons de participer sont profondément ancrés dans notre ADN de fondateurs.
Récemment, nous réfléchissons aux marchés construits autour de la puissance de calcul.
L'accès à la puissance de calcul est un domaine vaste et en pleine croissance, qui, selon nous, est mûr pour une plus grande financiarisation.
Cependant, la dynamique de l'offre et de la demande de puissance de calcul est hautement complexe, opaque et en constante évolution. De nombreuses questions restent sans réponse concernant le timing du marché, sa structure, et même sur ce qui est exactement l'actif échangé.
Dans le feu des débats et discussions sur ces questions, nous souhaitons partager un cadre d'analyse émergent pour envisager le marché de la puissance de calcul.
La naissance d'un nouveau marché à terme nécessite généralement cinq conditions préalables :
- Fragmentation du côté de l'offre
- Volatilité continue des prix
- Une certaine forme d'infrastructure de règlement physique
- Une unité standardisée et négociable
- Absence de substituts pour la découverte des prix ou la couverture
Notre cadre examine le paysage actuel du marché de la puissance de calcul à travers ces cinq dimensions. Nous utilisons des analogies historiques pour expliquer l'importance de chaque dimension et prévoir quand le marché pourrait atteindre un point de basculement.
Points Clés en Bref
Un examen rapide de ce cadre montre que le marché de la puissance de calcul d'aujourd'hui manque encore de la maturité nécessaire pour soutenir un marché à terme robuste.
(Néanmoins, le marché est dynamique, et de nombreuses startups travaillent activement à changer cela ; si vous êtes impliqué, contactez-nous !)
Voici notre notation actuelle du marché à terme de la puissance de calcul sur les cinq dimensions :
- Fragmentation du côté de l'offre: 🔴 L'offre est fortement concentrée chez les hyperscalers du cloud
- Volatilité des prix: 🟢 Les prix des GPU sont extrêmement volatils
- Infrastructure de règlement physique: 🟢 Une infrastructure de règlement physique existe au niveau des courtiers OTC
- Standardisation: 🔴 La puissance de calcul manque d'une unité standardisée et négociable
- Absence de substituts: 🟡 Les fournisseurs verticalement intégrés peuvent se couvrir en interne, les autres participants sont contraints d'être uniquement acheteurs
I. Fragmentation du côté de l'offre (Score Puissance de Calcul : 🔴)
Les marchés à terme sont des mécanismes de découverte des prix.
Sous un monopole de l'offre, la découverte des prix devient superflue, car les prix sont fixés par un petit nombre de grands fournisseurs, éliminant toute incertitude de tarification.
L'histoire est pleine de ces exemples.
Les contrats à terme sur le pétrole n'ont prospéré qu'après l'affaiblissement des cartels du côté de l'offre (comme les "Sept Sœurs", les sept multinationales dominantes du pétrole au milieu du XXe siècle).
Les marchés de l'électricité se sont formés après la dérégulation gouvernementale, qui a brisé la tarification monopolistique et permis aux producteurs indépendants d'entrer sur le marché. La fragmentation de l'offre a fait des marchés à terme un lieu crucial de découverte des prix.
En examinant la dynamique actuelle de la puissance de calcul, l'offre semble relativement concentrée.
Quatre géants du cloud (comme AWS, Azure, GCP, Oracle) contrôlent environ 78% de la capacité électrique informatique critique construite en interne au niveau mondial, et environ 69% de l'offre de H100 (selon les estimations originales, supposant 12,4 millions de H100 au Q4 2025).
Nous en déduisons qu'ils dominent également l'offre mondiale d'heures de calcul. L'offre n'est pas fragmentée.
Néanmoins, nous réfléchissons aux facteurs qui pourraient modifier cette dynamique.
De nouveaux fournisseurs de cloud émergent. De nouvelles architectures de puces créent des opportunités pour que d'autres fournisseurs gagnent des parts de marché.
Certaines capacités sous contrat à long terme des grands laboratoires pourraient finalement être sous-utilisées, ce qui signifie que ces laboratoires pourraient finir par devenir des fournisseurs ou des vendeurs de puissance de calcul sur le marché.
Ainsi, bien que nous ne soyons pas certains du niveau de concentration futur, notre jugement actuel est que le côté de l'offre du marché se dirigera vers une plus grande fragmentation qu'aujourd'hui.
II. Volatilité des Prix (Score Puissance de Calcul : 🟢)
Indice Ornn H100 sur le terminal Bloomberg
Une autre condition préalable pour les marchés à terme est que l'actif sous-jacent présente une forte volatilité.
Sans une incertitude de prix significative, les acteurs cherchant à se couvrir n'ont pas de motivation pour se prémunir contre le risque de volatilité.
La volatilité attire également les spéculateurs, qui peuvent profiter de larges mouvements de prix. Si le marché est calme ou prévisible, les spéculateurs se tourneront vers d'autres marchés.
Nous l'avons vu dans le marché pétrolier des années 1950.
Alors que le pétrole était en excès, l'Union soviétique a affiché des prix inférieurs à ceux affichés par les "Sept Sœurs". Les "Sept Sœurs" ont immédiatement abaissé les prix au Moyen-Orient sans en informer les pays producteurs.
Les chocs en cascade qui ont suivi ont conduit à la nationalisation du pétrole au Moyen-Orient, à la création de l'OPEP et à une augmentation de l'incertitude sur les prix pétroliers mondiaux. La volatilité du pétrole a ensuite provoqué la volatilité sur les marchés de l'électricité dans les années 1970.
La tarification de la puissance de calcul a été et continuera d'être volatile.
La vitesse à laquelle la nouvelle offre arrive sur le marché est incertaine. De nouvelles puces ou architectures de centres de données pourraient améliorer l'efficacité en tokens pour des tâches spécifiques. La demande augmente de façon continue et s'étend de manière imprévisible.
Nous sommes très confiants que cette condition préalable est aujourd'hui remplie.
III. Infrastructure de Règlement Physique (Score Puissance de Calcul : 🟢)
Pour qu'un marché fonctionne efficacement, les acheteurs doivent être certains qu'ils pourront recevoir et consommer l'instrument sous-jacent à la date et à l'heure convenues.
Cela nécessite une infrastructure : des mécanismes pour agréger l'offre, garantir une livraison fiable, compenser les transactions, gérer les garanties et assurer le règlement. Ces tâches sont généralement assumées par des intermédiaires ou des courtiers.
Dans les marchés de l'électricité, ces rôles sont tenus par les gestionnaires de réseaux indépendants, qui agissent en tant que tiers neutres, des entités quasi-gouvernementales.
Le marché actuel de la puissance de calcul n'a pas d'équivalent exact, mais notre hypothèse est que les courtiers en puissance de calcul ou les comptoirs OTC commencent (et sont de plus en plus susceptibles) à assumer nombre de ces fonctions.
Aujourd'hui, les courtiers construisent des indices et des outils d'agrégation de données autour des accords d'achat et de location de puissance de calcul pour ancrer les prix du marché.
Ornn et Silicon Data ont commencé à publier des données de prix pour les GPU au niveau des centres de données.
Le groupe des courtiers converge également vers des accords contractuels consensuels, analogues à la façon dont le protocole SAFE a standardisé les termes de financement en phase de démarrage. Ces outils complètent l'infrastructure sous-jacente de règlement physique – auparavant, une grande partie de cette coordination se faisait dans des groupes de discussion.
Nous attribuons un score vert à l'infrastructure de règlement physique, car elle jette les bases de la découverte des prix.
Mais elle est loin d'être mature par rapport à un marché au comptant développé. Ces achats ont lieu au niveau de l'infrastructure, et tous les participants au marché n'ont pas le droit de revendre publiquement après achat. Nous suivons de près les progrès dans la création de nouveaux marchés à ce niveau.
IV. Standardisation (Score Puissance de Calcul : 🔴)
Un défi majeur pour une nouvelle matière première est souvent à quel point ses unités sont uniques et non fongibles.
Trop de variables peuvent fragmenter la liquidité sur de nombreux marchés, ou entraîner un risque de base trop élevé pour répondre à la plupart des besoins de couverture et de livraison.
Par exemple, le pétrole brut est mesuré par sa densité et sa teneur en soufre, qui varient selon son origine.
Le NYMEX a trouvé un produit adapté au marché avec son indice WTI (pétrole brut léger et doux) car il a verrouillé une norme qui pouvait servir le marché amont mondial, et était même utilisé par le marché aval (comme les compagnies aériennes) pour la couverture.
L'électricité est standardisée par région, prenant en compte les fluctuations de l'offre et de la demande qui diffèrent en raison de la température, de la densité de population, etc.
Le marché de la puissance de calcul manque du niveau de standardisation nécessaire pour répondre aux besoins généraux de couverture.
Le défi est le suivant : une instance H100 n'est pas toujours équivalente à une autre instance H100.
Des facteurs tels que la région (et l'apport électrique local), la configuration de la machine (c'est-à-dire le matériel et les composants réseau) et la durée (c'est-à-dire la durée du contrat) accentuent la différenciation de prix des instances GPU.
Cependant, nous voyons des signes précoces de standardisation, surtout lorsque la demande provient de l'inférence de longue traîne (c'est-à-dire des laboratoires non frontaliers).
Contrairement à l'entraînement, les charges de travail d'inférence nécessitent beaucoup moins de nuances et peuvent être exécutées dans des environnements distribués plutôt que colocalisés.
Si l'offre d'inférence se fragmente entre de nombreux fournisseurs, par exemple en raison d'une augmentation de la part de marché des modèles à poids open source, la standardisation pourrait émerger.
V. Absence de Substituts (Score Puissance de Calcul : 🟡)
C'est un point subtil mais souvent négligé dans la formation d'un marché.
Les marchés à terme sont créés pour servir ceux qui cherchent à se couvrir. S'il existe des substituts avec une liquidité suffisante et un risque de base négligeable, alors aucun autre contrat ne sera utilisé.
Un exemple classique est le manque d'adoption des contrats à terme sur le carburant d'aviation – car l'indice WTI et d'autres indices amont répondaient déjà suffisamment à la demande.
Dans le domaine de l'électricité, les contrats à terme basés sur la température ont échoué, car les acteurs du marché ont constaté qu'il était plus efficace de se couvrir contre le résultat des fluctuations de prix (l'électricité) que contre leur cause (la température).
Aujourd'hui, les fournisseurs de modèles se couvrent contre le risque de puissance de calcul via des accords de location à long terme ou des coentreprises, souvent sous forme de contrats "take-or-pay", échangeant un risque de prix au comptant contre un risque de contrepartie.
Les hyperscalers du cloud possèdent généralement physiquement les GPU qu'ils déploient.
D'un autre côté, les fournisseurs de la longue traîne manquent à la fois du pouvoir contractuel pour obtenir des conditions de location favorables et du capital pour construire leur propre infrastructure verticalisée, et subissent donc de plein fouet la volatilité du marché au comptant.
D'un point de vue de marché, il n'y a pas de substituts ; cependant, les acteurs qui contrôlent l'offre peuvent se couvrir en interne par intégration verticale.
Verdict Général
Sur la base de ce tableau de bord, il est probablement trop tôt pour que la puissance de calcul soutienne un marché à terme robuste.
Le marché présente la volatilité qui attire les spéculateurs et une infrastructure de règlement précoce pour soutenir les transactions, mais il manque la fragmentation de l'offre et la standardisation nécessaires à une véritable découverte des prix à grande échelle.
La plupart des transactions se font en OTC.
Les courtiers construisent des sources de prix, Ornn et Silicon Data publient des indices, les échanges dans les groupes de discussion se formalisent en modèles de contrats.
Ce n'est pas rien, mais ce n'est pas encore un marché formé comme le WTI ou le PJM. Le volume est trop faible, les contrats trop personnalisés et l'offre trop concentrée pour que l'infrastructure existante puisse compenser à grande échelle.
La bonne façon de lire ce cadre est de le considérer comme un outil de diagnostic, et non comme une conclusion définitive. Il nous dit ce qui manque, pas ce qui est impossible.
Questions en Suspens
Le marché va évoluer de manière que nous ne pouvons pas encore déterminer avec certitude.
Nous avons de nombreuses questions sans réponse et quelques hypothèses préliminaires. Ces hypothèses sont provisoires et nécessitent d'être validées ou infirmées. Nous exposons ci-dessous l'argumentaire le plus solide pour chacune.
▍ Dans les 1 à 2 prochaines années, le côté de l'offre du marché deviendra-t-il plus fragmenté ou plus concentré ?
Nous prévoyons une fragmentation modérée.
Les nouveaux fournisseurs de cloud mettent en ligne de nouvelles capacités plus rapidement que toute autre catégorie.
Alors que l'électricité devient la contrainte principale, de nouvelles régions sont activées, ce qui profite aux opérateurs qui peuvent établir des capacités près d'une électricité bon marché (plutôt que près de l'empreinte des hyperscalers existants).
Les entreprises du Fortune 2000 soutiennent même des centres de données à petite échelle. L'expansion dans ce domaine semble inévitable.
Cependant, le modèle commercial standard repose sur des contrats à grande échelle et à long terme avec des contreparties fiables (comme les hyperscalers et les laboratoires frontaliers).
Des fournisseurs de services de courtage en cloud comme Hyperbolic et SF compute font le contraire, proposant des capacités à la demande horaire.
Ces entreprises servent la demande de puissance de calcul de la longue traîne : les startups nativement IA, les entreprises de la couche applicative exécutant de l'inférence sur des poids open source, et les laboratoires de recherche sans budget de pointe.
Nous pensons que l'adoption de poids open source en particulier conduira à une plus grande fragmentation de la capacité de calcul – car l'offre sera « dés-verticalisée » par rapport aux laboratoires frontaliers et aux hyperscalers.
▍ Comment la standardisation va-t-elle se dérouler ?
Les fournisseurs d'indices établissent des standards autour du coût horaire d'une instance GPU.
Ces sources de données représentent des estimations approximatives, non des prix exacts.
Les prix des instances varient en raison de nombreux facteurs, notamment la région, la configuration de la machine et la durée, ce qui rend difficile l'établissement d'un prix standard.
La différenciation de la configuration de la machine est particulièrement importante, résultat des centres de données qui s'adaptent à des charges de travail personnalisées et des hyperscalers qui optimisent pour le verrouillage de l'écosystème plutôt que pour l'uniformité du marché.
Les normes émergent lorsqu'il existe une demande de marché unifiée.
La norme WTI a été adoptée car elle servait une large gamme de produits de raffinage en aval comme l'essence, le diesel et le carburant d'aviation.
Aujourd'hui, la demande de puissance de calcul est tirée par les charges de travail d'entraînement et d'inférence IA.
L'infrastructure d'entraînement est personnalisée, optimisée pour des tâches longues et intensives en calcul dans de grandes installations centralisées, ce qui rend les instances de calcul sous-jacentes presque non interchangeables.
D'un autre côté, l'infrastructure d'inférence nécessite des spécifications matérielles plus simples et moins d'énergie ; elle est optimisée pour la latence, ce qui signifie que l'infrastructure est distribuée géographiquement plutôt que colocalisée.
L'inférence est homogène et devrait représenter plus de 65% de la demande de puissance de calcul IA d'ici 2029. Nous supposons que l'optimisation au niveau de l'infrastructure de calcul pour servir ce marché conduira à une convergence des exigences en matière de puissance de calcul entre les fournisseurs.
Si les différences persistent au niveau des instances de puces, d'autres voies de standardisation pourraient être des tests de référence au niveau matériel.
NVIDIA a créé le benchmark MLPerf pour évaluer les performances d'inférence et d'entraînement sur diverses architectures de modèles.
Dans cette vision, les instances GPU seraient échangées non pas sur la base de leurs spécifications matérielles, mais sur la base de la qualité et de l'efficacité de leur sortie.
▍ Qu'est-ce qui pourrait empêcher l'émergence de standards dans les 1 à 2 prochaines années ?
Nous pensons que les "jardins clos" et les charges de travail personnalisées étoufferont les tentatives de standardisation.
Au cours des 1 à 2 prochaines années, les hyperscalers et les laboratoires frontaliers s'efforceront de maintenir leur domination dans l'infrastructure IA et la fourniture de modèles.
Si les deux ne sont pas découplés, ils maintiendront le matériel selon leurs propres besoins, qui diffèrent d'une entreprise à l'autre. L'adoption de nouvelles architectures de puces fragmentera davantage les spécifications matérielles, rendant difficile l'établissement de normes.
▍ Comment les poids open source obtiendront-ils une adoption significative ?
C'est la voie la plus simple vers la formation d'un marché de la puissance de calcul.
Les deux principaux goulots d'étranglement de ces marchés aujourd'hui sont la concentration de l'offre et le manque de standardisation.
L'adoption généralisée des poids open source démocratise la capacité à exécuter de l'inférence.
Cela crée à son tour une motivation pour la formation d'opérateurs indépendants et favorise l'optimisation de l'infrastructure adaptée à ces modèles spécifiques.
Nous avons vu la même histoire dans le minage de Bitcoin : un logiciel open source a engendré de nombreux mineurs et a conduit à une standardisation autour des configurations matérielles.
Jusqu'à présent, les poids open source ont été à la traîne en termes de performances par rapport aux modèles à poids propriétaires.
Mais si la tendance se poursuit, les poids open source atteindront bientôt le seuil de performance que nous voyons aujourd'hui dans les modèles propriétaires.
Les entreprises ont déjà commencé à intégrer largement des modèles propriétaires dans leurs systèmes et ont constaté des gains de productivité significatifs. Dans trois mois, un modèle capable d'apporter le même gain de productivité pourrait coûter une fraction du prix actuel.
Cependant, la plupart des entreprises continueront probablement de privilégier le modèle offrant les meilleures performances.
Nous pensons qu'un jour, les modèles propriétaires de pointe deviendront trop chers pour les tâches qu'ils accomplissent, et les entreprises optimiseront leur configuration intelligente entre différents modèles.
Il faut se rappeler que les laboratoires frontaliers fournissent actuellement l'inférence à perte, et qu'ils devront finalement augmenter leurs prix pour rester opérationnels. Ce sera le moment pour les poids open source de briller.
▍ Quelle sera l'unité de compte finale négociée ?
La puissance de calcul peut être grossièrement décomposée en trois couches : la puce, l'heure d'instance de puce, le token.
Niveau de la puce – l'offre est fortement concentrée.
ASML monopolise les machines de lithographie utilisées par TSMC, TSMC monopolise les fonderies de puces utilisées par NVIDIA, et NVIDIA monopolise les conceptions de puces frontalières.
De plus, une puce n'est utile que si elle est alimentée et maintient un temps de disponibilité élevé. Cela nous amène à croire qu'une puce individuelle et livrable ne sera pas l'unité de compte finale.
Niveau de l'heure d'instance de puce – fait référence à la période pendant laquelle une puce peut être effectivement utilisée.
C'est peut-être l'état le plus précieux d'une puce, et la couche centrale discutée dans cet article.
À cette couche, tant qu'il existe une demande suffisante autour des ressources de calcul, la puissance de calcul en tant que matière première se comportera de manière similaire à l'électricité.
Nous envisageons que la puissance de calcul sera négociée de manière similaire à l'électricité et aux autres services publics : standardisée dans des contrats régionaux (la puissance de calcul étant fonction de l'électricité), avec des marchés au comptant et à terme superposés pour la couverture. C'est réalisable dans le format de "l'heure d'instance de puce".
Niveau du token – est le produit en aval d'une instance de calcul et pourrait également devenir l'unité de compte finale.
Si les tokens sont le principal moteur des instances de calcul, alors un marché des tokens fournirait un moyen de couvrir les coûts du côté de la demande et permettrait au côté de l'offre de verrouiller ses revenus.
Le côté de l'offre pourrait couvrir ses coûts via des contrats à long terme continus ou une intégration verticale et rester concentré.
Cependant, les tokens ne sont pas uniformes entre les modèles. Chaque modèle a son propre standard de tokenisation de texte et produit des sorties différentes, les rendant non totalement interchangeables entre les cas d'utilisation. Néanmoins, nous surveillons de près l'évolution dans ce domaine.







