Pourquoi les prix des GPU sont-ils devenus incontrôlables ?

marsbitPublié le 2026-04-06Dernière mise à jour le 2026-04-06

Résumé

Le prix de location des GPU, en particulier le contrat d'un an pour le H100, a augmenté de près de 40 % entre octobre 2025 et mars 2026, atteignant 2,35 $ par GPU/heure. Cette hausse est principalement due à une demande explosive et structurellement inélastique provenant de l'IA générative, des systèmes multi-agents, et des outils de codage IA comme Claude Code, dont l'utilisation a connu une croissance exponentielle. L'offre, quant à elle, est extrêmement tendue : les réservations à long terme sont verrouillées jusqu'en 2026, et même les clusters Blackwell (B200, GB300) sont presque entièrement réservés avant même leur déploiement. Le marché a basculé d'un environnement compétitif à un marché de vendeurs, où les fournisseurs de cloud (Neoclouds et hyperscalers) imposent des contrats plus longs, des paiements anticipés et des prix plus élevés. La flambée des coûts des composants (DRAM, NAND) a également contribué à la hausse des prix des serveurs, retardant certains projets et exacerbant la pénurie. Alors que le retour sur investissement de l'IA est estimé entre 5 et 10 fois son coût, la demande reste forte malgré la hausse des prix. Les observateurs s'attendent à une poursuite de la tension sur les prix, portée par la rareté des puces, le rythme des déploiements et la croissance continue de la consommation de tokens.

Note de la rédaction : Alors que l'IA passe d'« outil» à « infrastructure de flux de travail », les prix de location des GPU entrent dans une phase d'accélération à la hausse, l'offre continuant de se resserrer.

De la hausse de près de 40 % du prix annuel du H100, à la capacité de calcul verrouillée jusqu'au second semestre 2026, en passant par les laboratoires d'IA qui verrouillent continuellement l'offre via des contrats à long terme et des mécanismes de renouvellement, la logique de fonctionnement du marché des GPU a clairement changé : le prix n'est plus principalement déterminé par le coût du matériel, mais est façonné conjointement par la consommation de tokens, les capacités des modèles et la productivité.

Les changements du côté de la demande sont particulièrement cruciaux. De nouveaux paradigmes tels que les systèmes multi-agents, la génération de contenu natif et les outils de programmation IA poussent l'utilisation des tokens dans une phase de croissance exponentielle. Le constat central du rapport devient également plus clair : le retour sur investissement des outils d'IA a été vérifié, avec des rendements de 5 à 10 fois, ce qui rend le prix de la capacité de calcul incapable de contraindre efficacement la demande pendant une période assez longue.

La tension qui en résulte est de plus en plus nette : le marché réel de la capacité de calcul montre une pénurie généralisée et un transfert du pouvoir de fixation des prix vers l'amont, tandis que le marché financier reste ancré dans l'attente d'« une surabondance finale et d'une marchandisation ». Ce décalage entre les attentes et la réalité est en train de remodeler la logique d'évaluation du secteur des infrastructures d'IA.

Alors que la capacité de calcul devient une nouvelle matière première, son mécanisme de prix, sa structure d'offre et son rendement capitalistique sont en pleine restructuration profonde.

Voici le texte original :

La demande pour Claude 4.6 Opus et Claude Code d'Anthropic a considérablement augmenté. Son revenu annuel récurrent (ARR) est passé de 9 milliards de dollars à la fin de l'année dernière à plus de 25 milliards de dollars actuels en seulement un trimestre, soit une multiplication par près de trois. Dans le même temps, les modèles open source, représentés par GLM et Kimi K2.5, ont également stimulé l'expansion rapide des scénarios d'application liés aux modèles open source. Le financement continu d'entreprises telles qu'Anthropic, OpenAI et plusieurs Neolabs exacerbe également la demande de ressources GPU.

Ce point d'inflexion signifie que la demande a augmenté de manière drastique en peu de temps, et que les hyperscalers et les nouveaux fournisseurs de services cloud (Neoclouds) ont connu une ruée vers l'achat de GPU.

Cette nouvelle demande fait monter les prix tout au long de la chaîne d'approvisionnement, de la mémoire DRAM et NAND, aux câbles à fibres optiques, à l'hébergement de centres de données, en passant par les turbines à gaz et autres infrastructures ; presque tous les produits et services concernés ont vu leurs prix augmenter.

Le prix de location des GPU est devenu le dernier domaine, parmi les nombreux produits et services liés au calcul, à connaître des tensions d'approvisionnement et une flambée des prix. Le prix du contrat de location de GPU H100 sur un an est passé d'un plancher de 1,70 dollar par GPU par heure en octobre 2025 à 2,35 dollars en mars 2026, soit une hausse de près de 40 %.

La capacité de location de GPU à la demande (on-demand) est presque entièrement épuisée pour tous les modèles – les utilisateurs qui ont verrouillé des instances à la demande ne sont pas disposés à remettre la capacité de calcul sur le marché, même après la hausse des prix. Début 2026, trouver de la capacité de calcul GPU était presque comme essayer d'obtenir un billet d'avion pour « le dernier vol » : prix élevés, presque plus de billets. Pour utiliser une analogie plus appropriée, c'était moins comme chercher un billet d'avion que comme « trouver un canal pour acheter des médicaments ».

Chez SemiAnalysis, nous suivons en profondeur et à long terme les tendances et les sujets clés dans l'écosystème des Neocloud et des hyperscalers, y compris les prix de location des GPU. Cette capacité provient de nos recherches et pratiques continues dans des projets tels que ClusterMAX, InferenceX et le coût total de possession (TCO) du cloud IA.

Dans le même temps, nous consacrons également beaucoup d'efforts à aider divers laboratoires d'IA à se connecter avec des fournisseurs de services Neocloud, à trouver des ressources de location de GPU sur le marché, et à échanger continuellement avec presque toutes les parties prenantes de l'écosystème sur l'évolution des prix de location des GPU.

Depuis 2023, nous avons créé et maintenu pour nos clients un système d'indice de prix de location de GPU, couvrant les principaux modèles de GPU (tels que H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355), et couvrant différentes durées de location, de la location à la demande (on-demand), de la location courte durée d'un mois, jusqu'aux contrats à long terme de 5 ans maximum. Cet indice est construit sur la base de données d'enquêtes auprès de plusieurs fournisseurs de services Neocloud et d'acheteurs de capacité de calcul, et est validé par des données de transactions réelles, ainsi que par les négociations et transactions que nous facilitons.

Aujourd'hui, nous rendons public l'indice de prix de location de GPU H100 sur un an de SemiAnalysis, espérant ainsi fournir plus de données et d'analyses à l'industrie. Cet indice est mis à jour mensuellement, et nous publierons continuellement les dernières tendances et observations du marché via X et LinkedIn. Quant aux données de prix complètes couvrant différentes structures de durée de location et d'autres modèles de GPU principaux, elles ne sont actuellement accessibles qu'aux utilisateurs institutionnels abonnés à notre modèle TCO Cloud IA.

Ce rapport se concentrera sur les dernières tendances du marché de la location de GPU, les observations de première ligne et les données clés, expliquant comment nous comprenons la structure globale du marché, et fournissant une évaluation préliminaire de l'orientation future des prix de location.

Le marché de la location de GPU entre dans une phase de « tarification dynamique »

La seule courbe des prix de location du H100 sur un an ne suffit pas à rendre compte pleinement du degré de tension du marché – notre expérience réelle pour obtenir de la capacité de calcul en première ligne, ainsi que les retours des acteurs du marché, reflètent une situation plus grave.

La demande actuelle provient de multiples scénarios d'utilisation hautement hétérogènes, pour lesquels il n'existe presque pas de « solution universelle ». Par exemple, côté inférence, les modèles Mixture of Experts (MoE) à grande échelle sont plus adaptés pour fonctionner sur des systèmes à grande échelle récents comme le GB300 NVL72 ; tandis que côté entraînement, le H100 conserve un avantage en termes de rapport performance/prix, ce qui maintient la demande à un niveau élevé même pour des GPU relativement « anciens ».

Les clients rivalisent désormais même pour payer le prix de 14 dollars par GPU par heure pour les instances spot AWS p6-b200 ; certains fournisseurs Neocloud de premier plan ne vendent plus de nœuds uniques ; les prix de renouvellement de certains H100 sont identiques à ceux signés il y a deux ou trois ans ; et certains contrats H100 ont été directement renouvelés jusqu'en 2028, soit une durée de location de 4 ans. Il est désormais difficile de trouver ne serait-ce qu'un cluster de 8 nœuds (64 GPU) H100 ou H200 – la moitié des fournisseurs que nous avons contactés étaient complètement en rupture de stock, et la majorité ont répondu qu'aucun GPU d'architecture Hopper ne serait libéré prochainement à l'expiration de contrats.

Nous avons même entendu dire que certains locataires de capacité de calcul ont commencé à sous-louer les clusters qu'ils ont loués, un peu comme on sous-loue un appartement pendant le Grand Prix de Monaco. La question de savoir si des « sous-locataires Neocloud » vont apparaître n'est probablement plus une blague.

L'approvisionnement en Blackwell est extrêmement tendu. Nous comprenons qu'en raison de la forte demande de modèles à poids open source et de l'explosion continue de la demande d'inférence, le cycle de déploiement des nouveaux clusters Blackwell est désormais prolongé jusqu'en juin-juillet. De plus, ces clusters sur le point d'être déployés sont pour la plupart déjà réservés à l'avance. En fait, vu l'ensemble du marché, la nouvelle capacité qui ne sera mise en ligne qu'entre août et septembre 2026 est presque entièrement réservée.

Prix de location des GPU : Le retour

Mais comment le marché en est-il arrivé là ? Il y a seulement 6 mois, la plupart des observateurs du marché étaient sceptiques quant à la « valeur terminale » des GPU et pensaient généralement que les prix de location des GPU continueraient de baisser inévitablement avec le temps. À l'époque, si un Neocloud ou un hyperscaler utilisait un cycle d'amortissement de 6 ans pour les actifs de calcul GPU dans ses modèles financiers, il était même critiqué par les analystes financiers. Avant de discuter des tendances futures, revenons rapidement sur la façon dont les choses en sont arrivées là.

Avant le second semestre 2025, l'attente dominante dans tout l'écosystème était que les prix de location des GPU Hopper (c'est-à-dire H100 et H200) baisseraient significativement avec le déploiement à grande échelle de Blackwell et son coût de calcul unitaire nettement inférieur. Mais la réalité fut tout autre. Au second semestre 2025, la demande de H100 non seulement ne faiblit pas, mais s'est même renforcée dans de nombreux scénarios. L'adoption rapide des modèles à poids open source et l'accélération continue de la demande d'inférence à l'époque furent les premiers signaux de cette vague de demande de calcul presque sans fin.

En janvier 2026, le marché du calcul a atteint un nouveau point d'inflexion : les prix de la mémoire DRAM et NAND, après plusieurs trimestres de hausse rapide, ont commencé à entrer dans une phase de flambée quasi « parabolique ». Selon notre modèle de mémoire, au premier trimestre 2026, les prix contractuels du LPDDR5 et du DDR5 ont augmenté d'environ 4 et 5 fois respectivement en glissement annuel.

Pour faire face au risque de marge posé par la hausse drastique des coûts des composants, les fabricants d'OEM ont commencé à augmenter les prix des serveurs IA, et l'ampleur des hausses était nettement supérieure à celle des composants sous-jacents eux-mêmes. Cela a rendu les décisions d'investissement en capital pour les clusters plus complexes : des coûts d'acquisition de serveurs plus élevés compriment le rendement attendu des projets, forçant certains opérateurs à ralentir leur rythme de déploiement, voire à abandonner purement et simplement des projets. Le résultat fut que une partie de l'offre nouvelle qui aurait pu être mise en ligne a été reportée ou mise en suspens, aggravant encore la situation tendue du marché de la location.

Dans ce chaos d'approvisionnement déclenché par la « perte de contrôle des prix des serveurs IA », la demande de location de GPU a considérablement accéléré sa croissance, et la capacité de calcul restante sur le marché a été presque entièrement absorbée en janvier et février. En mars, il était presque impossible de trouver de la capacité disponible, que ce soit pour le H100, le H200 ou le B200, quelle que soit la durée de location. Le prix de location sur un an avait déjà dépassé les 2 dollars par GPU par heure fin janvier, et a de nouveau augmenté de 15 à 20 % par rapport à fin janvier mi-février, avec une nouvelle hausse de 15 à 20 % attendue d'ici fin mars.

L'un des principaux moteurs de la demande début cette année provenait de la génération de contenu natif (native media generation). Des applications comme Seedance et Nano Banana poussent les utilisateurs à générer et itérer des images et des vidéos à l'échelle, augmentant ainsi significativement le débit de tokens. Mais une source de demande plus cruciale et plus visible fut l'émergence de charges de travail multi-agents (multi-agent) – ces systèmes exécutent des processus à multiples étapes, itèrent continuellement dans des environnements à haute concurrence, entraînant une consommation de tokens et une demande de calcul présentant une croissance « exponentielle ».

Cette tendance est particulièrement visible dans les données relatives à Claude Code, comme nous l'avons mentionné dans plusieurs articles. Prenons SemiAnalysis par exemple, rien que les 7 derniers jours, l'entreprise a consommé des milliards de tokens, pour un coût moyen d'environ 5 dollars par million de tokens. Mais les gains de temps, l'extension des flux de travail et l'amélioration des capacités qui en découlent dépassent de loin le coût lui-même. Aujourd'hui, SemiAnalysis a intégré toute une suite d'outils d'IA dans plusieurs flux de travail, ne se limitant plus à une simple recherche et synthèse, mais s'étendant à des tableaux de bord, de l'extraction automatisée, du traitement de données à grande échelle et de la modélisation financière basée sur des agents.

Nous suivons également cette croissance explosive de la demande via des indicateurs tels que les commits quotidiens de Claude (Claude Commits Daily). Selon la tendance actuelle, nous prévoyons que d'ici fin 2026, Claude Code représentera plus de 20 % de tous les commits de code. On peut dire que, sans que vous ne vous en rendiez compte, l'IA a commencé à « dévorer » l'ensemble du processus de développement logiciel. Les clients institutionnels souhaitant obtenir cet ensemble de données peuvent contacter notre équipe API. Petit indice : ce volume de commits est nettement supérieur à celui de notre publication initiale.

Dans notre cercle, presque tout le monde est un utilisateur intensif de Claude Code. Mais nous savons aussi que ce cercle est lui-même profondément immergé dans le domaine de l'IA et des semi-conducteurs, n'étant essentiellement qu'« une petite poignée de personnes en première ligne ».

Pour de nombreuses entreprises du Fortune 500, et pour le grand public, Claude Code et le « monde des agents » ne sont qu'un sujet marginal légèrement nouveau, apparaissant occasionnellement dans le fil d'actualité Facebook ou sur un podcast NPR. Ils n'ont presque pas encore pris conscience qu'une vague de productivité et un choc structurel pilotés par les agents se rapprochent.

Alors que davantage d'acteurs de l'économie réelle prennent progressivement conscience des rendements sur investissement stupéfiants offerts par l'utilisation des outils d'IA et rejoignent cette « vague de calcul », la consommation de tokens continuera d'augmenter par paliers. Le débat sur le retour sur investissement de l'IA est, de fait, clos – la valeur créée par l'utilisation des outils d'IA dépasse souvent d'un ordre de grandeur son coût. Dans ce contexte, le déplacement continu vers la droite de la courbe de demande de tokens forme une force puissante et (à ce stade) relativement inélastique, poussant les prix de location des GPU à la hausse.

En termes simples, si le retour sur investissement de l'utilisation des outils d'IA peut atteindre 5 à 10 fois, alors les prix de location des GPU ont encore une marge de hausse considérable avant de pouvoir vraiment freiner la demande. Nous n'excluons pas non plus que de nouvelles hausses des prix de location continuent de se répercuter vers l'amont, faisant monter le coût des serveurs et des composants clés.

Publication de l'indice de prix de location H100 sur un an de SemiAnalysis

Aujourd'hui, nous rendons public gratuitement l'indice de prix des contrats de location de GPU H100 sur un an de SemiAnalysis, dans le but d'améliorer la connaissance et la transparence sur les tendances des prix de location des GPU.

Cet indice est construit sur la base de données d'enquêtes mensuelles auprès de plus de 100 acteurs du marché (incluant des fournisseurs de services Neocloud, des acheteurs et des vendeurs de capacité de calcul), afin de déterminer la fourchette représentative des prix de location de GPU (du 25e au 75e percentile). Dans le même temps, nous validons également ces données par des données de transactions réelles, et en facilitant la mise en relation d'acheteurs et de vendeurs dans notre propre réseau, participant directement à certaines transactions pour calibrer davantage les niveaux de prix.

Depuis 2023, nous suivons continuellement les prix contractuels des GPU, y compris H100, H200, B200, B300, GB200, GB300, pour des durées de location allant de 3 mois à 5 ans ; nous incluons également les données pertinentes de la série AMD (MI300, MI325, MI355).

Comparé aux indices de GPU existants sur le marché, l'indice de prix des contrats de location H100 sur un an de SemiAnalysis présente plusieurs différences clés :

Premièrement, de nombreux indices de location de GPU sont basés sur des cotations au spot/à la demande (spot/on-demand) ou des prix affichés publiquement, mais en réalité, la grande majorité des transactions de location de GPU se font via des contrats à long terme, généralement d'une durée de 6 mois ou plus. Ces prix sont souvent formés par des négociations bilatérales et n'apparaissent dans aucune base de données publique. La plupart des grands fournisseurs de services Neocloud préfèrent conclure des baux d'au moins un an, idéalement de 2 à 3 ans, et encore mieux s'ils peuvent conclure un accord important de prise ferme (offtake) de 5 ans. L'indice de location H100 sur un an de SemiAnalysis se concentre précisément sur ce « marché des contrats » – c'est-à-dire la partie où le volume des transactions est le plus concentré. En pointant explicitement vers une durée de location, cet indice est également plus facile pour les utilisateurs de comprendre la partie du marché qu'il couvre et de confronter cela à leurs propres observations.

Deuxièmement, les prix divulgués publiquement ne représentent pas les prix de transaction réels. Les prix annoncés par les hyperscalers et les Neocloud fournissent davantage une référence directionnelle de tendance qu'un niveau de transaction réel. Ces prix sont souvent en retard sur les changements du marché des contrats, n'étant généralement ajustés qu'après que la demande de calcul ait déjà changé. Surtout sur le marché à la demande, les prix sont souvent fixés à un niveau relativement stable, et les changements réels de l'offre et de la demande se manifestent through utilization or occupancy rates, and are only adjusted不定期 (irrégulièrement) si nécessaire. Ce mécanisme de marché sera développé plus loin dans l'article.

Troisièmement, bien qu'il existe de nombreux indices sur le marché capables de traiter de grandes quantités de cotations, de prix et de données de transaction, et ayant des avantages en analyse de tendances, notre approche met plus l'accent sur l'interaction directe avec les acteurs du marché. Chaque cotation, chaque transaction a son propre contexte et sa logique décisionnelle, et nous souhaitons, tout en présentant des données quantitatives, compléter ces informations qualitatives et observations de première ligne, afin de restituer plus complètement la structure réelle du marché de la location de GPU.

Pour les utilisateurs abonnés institutionnels, nous fournissons également des données complètes sur la structure des échéances couvrant presque tout le marché principal de la location de GPU.

En publiant l'indice de prix des contrats H100 sur un an, nous avons également lancé le Tableau de bord Tokenomics de SemiAnalysis pour les utilisateurs abonnés au modèle Tokenomics institutionnel, afin de suivre et comprendre le paysage des modèles d'IA de pointe. Ce tableau de bord permet aux utilisateurs de comparer de manière personnalisée différents modèles et fournisseurs de services sur plusieurs dimensions telles que le code, l'inférence, les mathématiques et l'évaluation des agents, de comparer les prix des API, et de consulter les données clés divulguées par les principaux laboratoires d'IA, y compris l'utilisation de tokens, les revenus, la valorisation et la taille de la clientèle.

Structure actuelle du marché de la location de GPU

Avant le second semestre 2025, l'environnement de prix du marché de la location de GPU était relativement plus concurrentiel. À l'époque, les opérateurs disposaient de stocks de GPU plus importants, et la demande finale commençait tout juste à accélérer. Par conséquent, la concurrence entre les fournisseurs de services Neocloud était féroce, se disputant les clients avec des prix plus attractifs. Leur objectif central était d'augmenter le taux d'utilisation, de « squeezer » autant que possible la valeur des actifs de calcul existants avant l'arrivée du prochain cycle d'itération des GPU.

Mais depuis, la dynamique du marché a fait un demi-tour à 180 degrés. Aujourd'hui, les Neocloud et les hyperscalers ont complètement pris les commandes – ils peuvent exiger des acomptes plus élevés, de meilleurs prix, des durées de contrat plus longues, et peuvent même choisir自主地 (autonomously) les dates de début et de fin des contrats pour correspondre à leur planning de stock et de capacité. Dans le même temps, le temps joue également en faveur du côté de l'offre : ils peuvent avancer leurs déploiements à leur propre rythme et, dans un environnement de prix continuellement à la hausse, filtrer progressivement pour obtenir le portefeuille de clients le plus qualifié.

Structurellement, le marché de la location de GPU peut être大致 divisé (roughly divided) en trois segments, correspondant à différents types de besoins clients :

Location à court terme : à la demande (on-demand), spot et contrats de moins de 3 mois

Contrats à moyen terme : contrats de 3 mois à plus de 3 ans

Prises fermes à long terme (offtake) : contrats de 4 à 5 ans, 5 ans étant les plus courants

Location à court terme : À la demande, spot et contrats de moins de 3 mois

La location à court terme se situe à l'extrémité avant de toute la structure des durées, et dans de nombreux cas, elle correspond à une « capacité excédentaire ». Cependant, certains fournisseurs de services (comme Runpod, Lambda) se spécialisent dans la fourniture de capacité de calcul flexible et à l'échelle, à la demande ou spot.

Il est important de noter que le mécanisme de prix du marché à la demande diffère significativement des autres marchés contractuels. Normalement, les fournisseurs de services fixent un prix relativement stable pour les ressources à la demande, et ne l'ajustent que dans de rares cas. En d'autres termes, le prix du marché à court terme n'est pas entièrement驱动 (driven) en direct par l'offre et la demande en temps réel, mais reflète davantage la tension du marché through changes in resource utilization.

Les fournisseurs de services ajustent généralement le prix en une seule fois en fonction du taux d'utilisation des ressources : lorsque l'utilisation est faible, ils baissent les prix pour stimuler la demande ; et lorsque l'utilisation approche de la pleine capacité, ils augmentent les prix, car la demande peut rester élevée même à des prix plus élevés.

Cela explique pourquoi, sur une série chronologique, les prix à la demande annoncés par les Neocloud ont tendance à rester inchangés pendant de longues périodes, puis à subir une « discontinuité » soudaine à la hausse ou à la baisse. Pour le marché à la demande, ce qui reflète vraiment les changements de demande à haute fréquence, ce n'est pas le prix, mais le taux d'utilisation des ressources.

Contrats à moyen terme (Mid-Term Contracts)

D'un point de vue économique, le plus critique est en fait le « marché des contrats », car la grande majorité de la valeur transactionnelle de la location de GPU se produit dans ce segment. Parmi eux, les contrats d'un an sont particulièrement importants – ils reflètent à la fois la demande marginale des clients non laboratoires d'IA et la demande excédentaire des grands clients, ce qui en fait l'indicateur le plus sensible pour juger du degré de resserrement du marché.

Les entreprises natives de l'IA (AI Natives) et les petits et moyens laboratoires d'IA sont principalement actifs dans la fourchette de 1 à 3 ans. Cependant, une tendance récente et évidente est que ces institutions commencent également à essayer de verrouiller les ressources de calcul via des contrats plus longs – beaucoup s'étendent désormais à plus de 4 ans, et sont même prêtes à payer des acomptes supérieurs à 20 %, ce qui n'était pas courant dans les contrats de plus de 4 ans par le passé.

Prises fermes à long terme (Long-Term Offtakes)

Dans le marché plus long terme de 4 à 5 ans, la force motrice est constituée des grands laboratoires d'IA, qui verrouillent des ressources de calcul à grande échelle très tôt. Ce type de transaction correspond généralement à des clusters de grande taille de 50 MW, 100 MW ou même plus, ce qui équivaut大致 (roughly) à environ 24 000 à 48 000 GPU GB300 NVL72. Dans l'ensemble, ces accords de prise ferme à long terme ont déjà占据 (occupied) une part importante du marché de la location de GPU des Neocloud.

Les laboratoires d'IA privilégient ce type de contrats car ils peuvent verrouiller une capacité de calcul à grande échelle en une fois pour faire face à une demande finale en croissance rapide. Dans le même temps, ces institutions sont généralement profondément impliquées dans la conception du cluster,包括 (including) le stockage, le réseau, la configuration du CPU et autres liens clés. Ce type de transaction est souvent livré sous forme de **bare metal (métal nu)** car les laboratoires d'IA disposent de capacités d'ingénierie suffisantes pour personnaliser la pile technologique à un niveau plus bas, achieving the best TCO (coût total de possession) and performance.

Pour les fournisseurs de services Neocloud, ce type de transaction est également attractif. D'une part, ils peuvent concentrer leurs ressources commerciales sur quelques grosses commandes, sans avoir à gérer un grand nombre de petits clients pour le même revenu ; d'autre part, les contrats à long terme leur permettent également d'obtenir de meilleures conditions de financement par emprunt – en alignant la durée du financement sur la durée du contrat, ils peuvent effectively reduce the risk of maturity mismatch and price volatility, et dans la plupart des cas, verrouiller un taux de rendement interne (TRI) de projet de plusieurs dizaines de points de pourcentage.

De plus, les hyperscalers jouent également souvent un rôle de « filet de sécurité » (backstop) – ils agissent comme acheteurs directs, achetant la capacité de calcul auprès des Neocloud pour la revendre aux laboratoires d'IA. Cette structure est gagnant-gagnant pour toutes les parties : les Neocloud peuvent obtenir de meilleures conditions de financement basées sur un acheteur noté AAA ; et les hyperscalers, sans avoir à étendre leur propre bilan, peuvent obtenir une partie des收益 (returns) du projet en fournissant une garantie de crédit.

Le tableau ci-dessous répertorie quelques-uns des grands accords de prise ferme que nous suivons. Nous analysons en profondeur ces transactions pour en déduire le prix horaire implicite du GPU ($/hr/GPU), ainsi que des indicateurs clés de rentabilité tels que le TRI du projet et la marge EBIT.

Dans l'environnement de marché actuel, la grande majorité des grands clusters d'IA en expansion sont en fait « internalisés » par les laboratoires d'IA. Cependant, ces institutions continueront de pénétrer le marché des contrats de moins de 4 ans pour compléter leur capacité de calcul, tout en empêchant indirectement l'offre de retourner sur ce marché en renouvelant leurs clusters H100 et H200 existants. Alors que les clusters超大规模 (hyperscale) GB200 et GB300 sont progressivement mis en ligne, l'évolution de la relation entre l'offre et la demande sur le marché des contrats de 1 à 3 ans deviendra une variable值得观察的 (worth observing) dans un avenir proche.

« Où va la rondelle » (Where The Puck is Going)

Ce qui attire le plus l'attention actuellement, c'est le décalage évident entre la réalité sous-jacente et la sentiment du marché. Bien que les signaux de resserrement de l'offre et de hausse des prix – qui devraient normalement bénéficier aux Neocloud (expansion des marges, prolongation de la durée de vie utile des actifs) – soient très clairs, le marché public devient de plus en plus pessimiste envers des sociétés comme CoreWeave, Nebius, Iris Energy, etc., dont les cours actions se situent toujours dans le bas de la fourchette des 6 à 12 derniers mois.

Le marché reste dominé by the narrative of « ultimate oversupply, commoditization of compute », et les changements ci-dessus n'ont pas vraiment atténué les inquiétudes des investisseurs regarding the long-term value of GPUs. Mais from a frontline perspective,持续的供给紧张 (continuous supply tightness) and enhanced pricing power mean that almost all computing power is being « absorbed » by demand – even with performance differences, in this current environment of extreme shortage, it is still in short supply.

Trois points d'observation futurs

Pour juger si les prix de location des GPU continueront de se maintenir à un niveau élevé, trois variables méritent une attention particulière :

1. Le rythme d'expansion des clusters GB300 (2026)
La clé est la vitesse relative entre la nouvelle capacité de calcul et la demande de tokens – si l'offre atténue la tension ou si la demande continue de dépasser l'offre. Cela affectera directement la participation continue des laboratoires d'IA au marché des contrats de moins de 4 ans, ainsi que l'évolution des prix dans cette fourchette.

2. Si la pénurie de puces s'aggrave
Tout波动 (fluctuation) dans l'exécution de la fabrication des liens clés, including TSMC's N3 process capacity, HBM, DRAM, NAND, etc., pourrait further tighten supply.

3. La vitesse de croissance des revenus (ARR) et de la consommation de tokens des laboratoires d'IA
L'expansion de la commercialisation de l'IA et de l'échelle d'utilisation déterminera l'intensité de la demande finale, c'est également la variable核心 (core) qui drive la demande de calcul.

Prix à la hausse unilatérale, taux de rendement随之提升 (improving accordingly)

Dans l'ensemble, une conclusion relativement claire est : la probabilité que les prix de location des GPU continuent d'augmenter est plus élevée que celle qu'ils baissent.

Ce processus présente des caractéristiques d'auto-renforcement évidentes : lorsque les Neocloud observent un resserrement de l'offre et une hausse des prix, ils verrouillent à l'avance plus de matériel, comprimant ainsi davantage l'offre du marché et poussant les prix à continuer de monter. Cela ressemble au cycle de pénurie de GPU de 2023-2024 – à l'époque, la tension de l'offre avait permis aux OEM de réaliser une expansion significative de leurs marges, et avait entraîné une forte hausse des prix des serveurs (bien que la maturité plus élevée du marché actuel signifie que ce processus ne se reproduise pas necessarily exactly).

Dans le même temps, la nouvelle hausse des prix de location des GPU améliore également le rendement du capital investi (ROIC) des Neocloud :

D'une part, en augmentant la marge bénéficiaire des actifs déjà déployés

D'autre part, en prolongeant le cycle d'utilisation économique des GPU, permettant au capital de générer des flux de trésorerie plus longtemps

Qui sont les plus grands bénéficiaires actuels ?

Les fournisseurs de calcul qui bénéficient le plus directement actuellement sont ceux qui présentent les caractéristiques suivantes :

· Structure principalement à court terme (peut être reprixée rapidement)

· Disposent d'un important parc d'équipements H100

· Ont une nouvelle capacité de production qui sera mise en ligne prochainement

Les Neocloud avec une structure de location à court terme peuvent libérer plus rapidement les anciens contrats et les resigner à des prix plus élevés, réalisant ainsi une expansion rapide des bénéfices. Dans le même temps, les hyperscalers et Neocloud qui ont verrouillé à l'avance la capacité de calcul de next-generation (contrats pluriannuels) bénéficieront également dans les cycles futurs.

Alors la question se pose : cette fois, est-ce que ça va vraiment être « différent » ?

Questions liées

QPourquoi les prix de location des GPU ont-ils augmenté de près de 40 % pour les contrats d'un an sur le H100 ?

ALa hausse des prix est principalement due à une demande explosive liée à l'expansion de l'IA, notamment la consommation de tokens en croissance exponentielle, la génération de contenu natif, les systèmes multi-agents et les outils de programmation IA. L'offre est incapable de suivre cette demande, et les contrats à long terme verrouillent une grande partie de la capacité disponible.

QQuels sont les principaux facteurs qui poussent la demande de tokens et donc de puissance de calcul GPU ?

ALes principaux facteurs sont l'émergence des systèmes multi-agents qui exécutent des processus en plusieurs étapes, la génération de contenu natif (images, vidéos) à l'échelle, et l'adoption massive d'outils de programmation IA comme Claude Code, dont le retour sur investissement peut atteindre 5 à 10 fois le coût.

QComment le marché de la location de GPU est-il structurellement organisé ?

ALe marché se divise en trois segments principaux : la location à court terme (à la demande, spot, moins de 3 mois), les contrats à moyen terme (de 3 mois à 3 ans), et les contrats de long terme ou 'offtakes' (4 à 5 ans). La majorité de la valeur transactionnelle se trouve dans le marché des contrats, les grands laboratoires d'IA dominant le segment des offres à long terme.

QQui sont les principaux bénéficiaires de la hausse actuelle des prix de location des GPU ?

ALes principaux bénéficiaires sont les fournisseurs de capacité qui ont une structure de contrat à court terme (leur permettant de se reprixer rapidement), ceux qui disposent d'un important parc de GPU H100 existant, et ceux qui ont de nouvelles capacités de calcul devant être livrées prochainement.

QQuelles sont les trois variables clés à surveiller pour l'évolution future des prix des GPU ?

ALes trois variables clés sont : 1) Le rythme de déploiement des clusters GB300 en 2026 et si l'offre peut rattraper la demande. 2) L'aggravation potentielle des pénuries de composants (puces, HBM, DRAM). 3) Le taux de croissance des revenus (ARR) et de la consommation de tokens des laboratoires d'IA.

Lectures associées

Trading

Spot
Futures

Articles tendance

Qu'est ce que G$

Comprendre GoodDollar ($G$) : Un plan pour un revenu de base universel décentralisé Introduction Dans le paysage en constante évolution des cryptomonnaies et de la technologie blockchain, les initiatives qui cherchent à résoudre des problèmes sociaux pressants ont suscité une attention accrue. L'un de ces projets est GoodDollar ($G$), une solution de revenu de base universel (RBU) basée sur le Web3. GoodDollar s'efforce de lutter contre l'inégalité et de réduire l'écart de richesse en créant et distribuant des ressources économiques accessibles aux plus nécessiteux. Grâce à son utilisation innovante de la finance décentralisée (DeFi), GoodDollar présente un modèle unique qui pourrait potentiellement transformer la manière dont l'assistance financière est perçue et délivrée à l'échelle mondiale. Qu'est-ce que GoodDollar ($G$) ? GoodDollar est un protocole de cryptomonnaie qui facilite l'émission et la distribution de jetons numériques, appelés $G$, à ses utilisateurs enregistrés sur une base quotidienne. Ces jetons fonctionnent comme une forme de revenu de base universel, promouvant l'autonomisation financière pour les individus de divers horizons, en particulier ceux traditionnellement exclus du système financier. Fonctionnant sur la blockchain, GoodDollar utilise plusieurs chaînes, notamment Ethereum, Celo et Fuse, garantissant un large accès et une bonne utilisabilité. L'objectif fondamental de GoodDollar est de rendre la cryptomonnaie accessible et bénéfique pour tous, indépendamment de leur point de départ économique. Le créateur de GoodDollar ($G$) Les détails concernant le créateur de GoodDollar demeurent quelque peu obscurs. Cependant, il est notable de souligner que le projet bénéficie d'un solide soutien de la part d'eToro, une plateforme d'investissement largement reconnue qui a fourni le financement initial et le soutien fondamental pour le développement de GoodDollar. La vision derrière le projet n'est pas uniquement motivée par le profit, mais se tourne fortement vers l'entrepreneuriat social, visant un changement systémique dans l'accessibilité économique. Les investisseurs de GoodDollar ($G$) GoodDollar bénéficie du soutien financier et opérationnel d'eToro. Ce partenariat a joué un rôle significatif dans le lancement du protocole et ses développements ultérieurs. Bien qu'eToro ait été instrumental dans l'établissement des bases du projet, GoodDollar envisage de transitionner vers un modèle financé par sa communauté sur le long terme. Ce passage au financement communautaire est en ligne avec l'engagement de GoodDollar envers la décentralisation, permettant à ses utilisateurs d'avoir une part directe dans l'avenir du projet. Comment fonctionne GoodDollar ($G$) ? Le cadre opérationnel de GoodDollar repose fortement sur les principes de DeFi pour générer des intérêts à partir des cryptomonnaies mises en jeu. Ce mécanisme permet au projet de frapper et de distribuer des jetons $G$ comme un revenu de base numérique pour les utilisateurs du monde entier. Plusieurs caractéristiques clés contribuent à l'unicité et à l'innovation de GoodDollar : Revenu de base universel (RBU) : Chaque jour, les utilisateurs enregistrés reçoivent des jetons gratuits, établissant un flux de revenu automatique destiné à alléger les pressions financières. Modèle économique durable : La tokenomics du projet vise à équilibrer l'offre et la demande de jetons $G$, garantissant que la valeur reste stable au fil du temps. Jetons adossés à des réserves : Chaque jeton $G$ est soutenu par une réserve de cryptomonnaies, lui conférant une valeur inhérente et une fiabilité, un aspect crucial pour maintenir la confiance des utilisateurs. Gouvernance décentralisée : GoodDollar adopte une approche démocratique de la prise de décision grâce à une gouvernance décentralisée alimentée par les jetons. Cela permet aux membres de la communauté de participer activement à l'orientation du projet, le rendant véritablement dirigé par la communauté. Accessibilité mondiale : GoodDollar a établi une empreinte communautaire considérable, comptant plus de 640 000 membres dans 181 pays. Un tel rayonnement est essentiel pour faciliter le RBU à l'échelle mondiale. Chronologie de GoodDollar ($G$) L'évolution de GoodDollar est marquée par plusieurs jalons significatifs au cours de son histoire : 2019 : Le lancement du portefeuille GoodDollar a marqué le premier pas vers la mise en œuvre de sa vision de délivrance du RBU par le biais de la cryptomonnaie. 2020 : Après le succès du portefeuille, le protocole GoodDollar a été officiellement lancé. Cela a marqué une phase cruciale dans sa mission de fournir un revenu distribué quotidiennement. 2021 : Le projet a progressé avec l'introduction de son Organisation Autonome Décentralisée (DAO), favorisant un plus grand niveau d'implication et de gouvernance communautaire. 2022 : GoodDollar a dévoilé sa version 2 (V2) axée sur la DeFi, s'efforçant d'améliorer l'engagement des utilisateurs et l'efficacité opérationnelle. La même année a également vu la transition vers une structure de gouvernance décentralisée via GoodDAO. 2022 : Une nouvelle feuille de route a été conceptualisée, axée sur des initiatives telles qu'un programme de subventions conçu pour promouvoir les projets entrepreneuriaux liés à $G$ et un marché GoodDollar amélioré. Caractéristiques clés de GoodDollar ($G$) Le projet GoodDollar introduit de nombreuses caractéristiques critiques visant à redéfinir le paysage du revenu de base : Revenu de base universel : La délivrance quotidienne de jetons gratuits à ses utilisateurs souligne fondamentalement sa mission d'éliminer la précarité économique. Opération multi-chaînes : Le fait de tirer parti de plusieurs réseaux blockchain améliore l'accessibilité et la scalabilité, garantissant une plus large participation. Engagement avec la finance décentralisée : L'utilisation de la DeFi permet un financement durable du modèle RBU, renforçant sa viabilité en tant que solution économique. Engagement communautaire et gouvernance : GoodDollar envisage un modèle où la communauté influence les opérations grâce à une participation démocratique, favorisant la transparence et la responsabilité. Communauté mondiale : Avec une communauté mondiale diversifiée, le projet est en mesure de mettre en œuvre des solutions de RBU adaptées à divers contextes culturels et économiques. Conclusion GoodDollar représente un saut transformationnel vers l'incorporation des principes de revenu de base universel à travers le prisme innovant de la technologie blockchain. En exploitant la finance décentralisée, le projet ne fournit pas seulement une solution à l'inégalité financière, mais engage également activement les utilisateurs dans sa gouvernance et ses opérations. Avec une communauté en croissance et une feuille de route évolutive, GoodDollar se positionne comme un acteur significatif à l'intersection des cryptomonnaies et du bien social, ouvrant la voie à un avenir financier plus équitable. Alors qu'il continue d'évoluer, le parcours de GoodDollar pourrait finalement inspirer d'autres initiatives à envisager des modèles similaires, favorisant ainsi la cause de l'autonomisation économique pour tous.

94 vues totalesPublié le 2024.04.05Mis à jour le 2024.12.03

Qu'est ce que G$

Comment acheter G

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Gravity (G) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Gravity (G).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Gravity (G)Après avoir acheté vos Gravity (G), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Gravity (G)Tradez facilement Gravity (G) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

543 vues totalesPublié le 2024.12.10Mis à jour le 2025.03.21

Comment acheter G

Qu'est ce que @G

Graphite Network, $@G : Relier TradFi et Web3 Introduction à Graphite Network, $@G Dans le monde dynamique des cryptomonnaies et des projets web3, Graphite Network émerge comme un phare d'innovation. Avec son jeton natif, $@G, cette blockchain de couche 1, Proof-of-Authority (PoA), est conçue pour combler le fossé entre la finance traditionnelle (TradFi) et l'écosystème Web3 en pleine évolution. Alors que les monnaies numériques gagnent en traction, Graphite Network s'efforce d'offrir une plateforme blockchain qui privilégie la sécurité, la conformité et la rapidité, se présentant comme un facilitateur de confiance et de responsabilité. Qu'est-ce que Graphite Network, $@G ? Graphite Network n'est pas simplement un autre projet blockchain ; il vise à redéfinir la façon dont la décentralisation, la sécurité et la responsabilité des utilisateurs sont perçues dans le domaine de la finance numérique. Le projet se vante d'une série de caractéristiques distinctives : Blockchain Basée sur la Réputation : Au cœur de Graphite Network se trouve une politique d'un utilisateur, un compte, renforcée par des mécanismes intégrés de vérification et de notation Know Your Customer (KYC). Ce design assure un équilibre entre la confidentialité des utilisateurs et la transparence, un aspect critique des opérations financières dans le monde numérique d'aujourd'hui. Revenus des Nœuds de Point d'Entrée : Le réseau incite les utilisateurs à mettre en place des nœuds de point d'entrée, permettant aux opérateurs de gagner des récompenses provenant des transactions du réseau. Ce modèle de génération de revenus non seulement stimule l'engagement des utilisateurs mais renforce également la santé et la décentralisation du réseau. Compatibilité EVM : Avec une machine virtuelle (VM) compatible avec Ethereum, Graphite Network permet une intégration transparente des applications décentralisées (dApps) et des contrats intelligents Solidity existants, invitant ainsi les développeurs à tirer parti de ses capacités sans modifications étendues. Intégration KYC : À une époque où la conformité est primordiale, le cadre KYC intégré avec plusieurs niveaux de vérification améliore le contrôle des opérations financières sans participation obligatoire, établissant un précédent pour l'autonomie des utilisateurs. Qui est le Créateur de Graphite Network, $@G ? Graphite Network est né des efforts de la Graphite Foundation, une organisation à but non lucratif dédiée au développement, à la maintenance et à l'évolution de Graphite Network. L'engagement de la fondation souligne la vision du projet de créer un environnement blockchain sécurisé et durable axé sur un véritable engagement des utilisateurs et la conformité. Qui sont les Investisseurs de Graphite Network, $@G ? Actuellement, il existe peu d'informations disponibles sur les investisseurs spécifiques soutenant l'initiative Graphite Network. L'organisation fondatrice, la Graphite Foundation, fonctionne de manière indépendante pour favoriser la croissance du projet tout en recherchant des partenariats qui résonnent avec sa vision d'une plateforme blockchain conforme et accessible. Comment Fonctionne Graphite Network, $@G ? Le fonctionnement de Graphite Network repose sur son mécanisme de consensus unique Proof-of-Authority, qui trouve un équilibre impressionnant entre un haut débit et la décentralisation. Examinons les différents composants qui définissent son fonctionnement : Nœuds de Transport : Servant de nœuds de point d'entrée, ceux-ci sont critiques pour l'écosystème. Les opérateurs peuvent générer des revenus à partir des transactions qui traversent le réseau, ce qui non seulement donne du pouvoir aux utilisateurs individuels mais renforce également la décentralisation du réseau. Nœuds Autorisés : Au cœur de Graphite Network se trouvent des validateurs principaux qui subissent des tests de conformité rigoureux, englobant une vérification KYC robuste ainsi que des évaluations techniques. Ce niveau de confiance est essentiel pour garantir que les transactions au sein du réseau maintiennent un haut niveau d'intégrité. Système de Ticker : Graphite Network utilise un système de ticker distinctif pour ses jetons enveloppés, désignés sous le nom de @G. Cette fonctionnalité améliore la clarté dans l'intégration des actifs, rendant les transactions des utilisateurs compréhensibles et simples. L'approche innovante de Graphite Network reflète une avancée significative dans la résolution des problèmes cruciaux de la finance numérique, se positionnant favorablement pour l'avenir alors que de plus en plus d'utilisateurs passent des formes traditionnelles de finance au monde des applications décentralisées. Chronologie de Graphite Network, $@G Pour comprendre la progression et les jalons de Graphite Network, il est utile de passer en revue les événements clés de sa chronologie : 2021 : La création de Graphite Network par la Graphite Foundation marque le début d'un nouveau chapitre dans le développement blockchain, axé sur la conformité et l'autonomisation des utilisateurs. Développements Clés : Suite à son lancement, l'introduction des revenus des nœuds de point d'entrée, l'établissement d'un modèle basé sur la réputation, la vérification KYC intégrée et la fourniture de compatibilité EVM représentent des avancées significatives dans le projet. Activités Récentes : Les efforts continus de développement et de soutien de la Graphite Foundation se sont concentrés sur l'augmentation des fonctionnalités du réseau tout en favorisant la croissance de l'écosystème, démontrant un engagement à long terme envers la durabilité et l'innovation. Points Clés Supplémentaires Au-delà de ses composants fondamentaux, Graphite Network englobe plusieurs outils et fonctionnalités qui renforcent son utilité : Graphite Wallet : Une extension Chrome conviviale qui facilite l'accès à diverses fonctionnalités et applications du réseau sur des chaînes compatibles avec Ethereum, améliorant la commodité pour les utilisateurs. Graphite Bridge : Cet utilitaire permet des transferts transparents des actifs Graphite entre différents réseaux, favorisant un écosystème intégré et interopérable. Graphite Explorer : Servant d'outil essentiel au sein de l'écosystème, cette fonctionnalité permet aux utilisateurs de visualiser et de vérifier le code source des contrats intelligents, de suivre les transactions et d'explorer d'autres informations vitales en temps réel. Graphite Testnet : Le projet fournit un environnement de test robuste pour les développeurs, leur permettant d'assurer la stabilité et l'évolutivité avant le déploiement sur le mainnet. Cette initiative non seulement donne du pouvoir aux développeurs mais améliore également la fiabilité de l'ensemble du réseau. Conclusion Graphite Network, avec son jeton natif $@G, représente un pas significatif vers le rapprochement de la finance traditionnelle et de la technologie blockchain de pointe. En se concentrant sur la sécurité, la conformité et la décentralisation, cette plateforme innovante est prête à mener la transition vers l'ère Web3. À mesure que l'engagement des utilisateurs croît et que de plus en plus de projets tirent parti de ses capacités, Graphite Network est en bonne position pour apporter des contributions durables au paysage numérique en pleine évolution. En conclusion, Graphite Network est un témoignage de ce qui peut être accompli lorsque la pensée innovante rencontre les demandes croissantes de la finance moderne et de la technologie. Alors que le monde explore le potentiel de la finance décentralisée, Graphite Network restera sans aucun doute un acteur notable dans ce domaine.

13 vues totalesPublié le 2025.01.06Mis à jour le 2025.01.06

Qu'est ce que @G

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de G (G) sont présentées ci-dessous.

活动图片