Pourquoi les prix des GPU sont-ils devenus incontrôlables ?

marsbit發佈於 2026-04-06更新於 2026-04-06

文章摘要

Le prix de location des GPU, en particulier le contrat d'un an pour le H100, a augmenté de près de 40 % entre octobre 2025 et mars 2026, atteignant 2,35 $ par GPU/heure. Cette hausse est principalement due à une demande explosive et structurellement inélastique provenant de l'IA générative, des systèmes multi-agents, et des outils de codage IA comme Claude Code, dont l'utilisation a connu une croissance exponentielle. L'offre, quant à elle, est extrêmement tendue : les réservations à long terme sont verrouillées jusqu'en 2026, et même les clusters Blackwell (B200, GB300) sont presque entièrement réservés avant même leur déploiement. Le marché a basculé d'un environnement compétitif à un marché de vendeurs, où les fournisseurs de cloud (Neoclouds et hyperscalers) imposent des contrats plus longs, des paiements anticipés et des prix plus élevés. La flambée des coûts des composants (DRAM, NAND) a également contribué à la hausse des prix des serveurs, retardant certains projets et exacerbant la pénurie. Alors que le retour sur investissement de l'IA est estimé entre 5 et 10 fois son coût, la demande reste forte malgré la hausse des prix. Les observateurs s'attendent à une poursuite de la tension sur les prix, portée par la rareté des puces, le rythme des déploiements et la croissance continue de la consommation de tokens.

Note de la rédaction : Alors que l'IA passe d'« outil» à « infrastructure de flux de travail », les prix de location des GPU entrent dans une phase d'accélération à la hausse, l'offre continuant de se resserrer.

De la hausse de près de 40 % du prix annuel du H100, à la capacité de calcul verrouillée jusqu'au second semestre 2026, en passant par les laboratoires d'IA qui verrouillent continuellement l'offre via des contrats à long terme et des mécanismes de renouvellement, la logique de fonctionnement du marché des GPU a clairement changé : le prix n'est plus principalement déterminé par le coût du matériel, mais est façonné conjointement par la consommation de tokens, les capacités des modèles et la productivité.

Les changements du côté de la demande sont particulièrement cruciaux. De nouveaux paradigmes tels que les systèmes multi-agents, la génération de contenu natif et les outils de programmation IA poussent l'utilisation des tokens dans une phase de croissance exponentielle. Le constat central du rapport devient également plus clair : le retour sur investissement des outils d'IA a été vérifié, avec des rendements de 5 à 10 fois, ce qui rend le prix de la capacité de calcul incapable de contraindre efficacement la demande pendant une période assez longue.

La tension qui en résulte est de plus en plus nette : le marché réel de la capacité de calcul montre une pénurie généralisée et un transfert du pouvoir de fixation des prix vers l'amont, tandis que le marché financier reste ancré dans l'attente d'« une surabondance finale et d'une marchandisation ». Ce décalage entre les attentes et la réalité est en train de remodeler la logique d'évaluation du secteur des infrastructures d'IA.

Alors que la capacité de calcul devient une nouvelle matière première, son mécanisme de prix, sa structure d'offre et son rendement capitalistique sont en pleine restructuration profonde.

Voici le texte original :

La demande pour Claude 4.6 Opus et Claude Code d'Anthropic a considérablement augmenté. Son revenu annuel récurrent (ARR) est passé de 9 milliards de dollars à la fin de l'année dernière à plus de 25 milliards de dollars actuels en seulement un trimestre, soit une multiplication par près de trois. Dans le même temps, les modèles open source, représentés par GLM et Kimi K2.5, ont également stimulé l'expansion rapide des scénarios d'application liés aux modèles open source. Le financement continu d'entreprises telles qu'Anthropic, OpenAI et plusieurs Neolabs exacerbe également la demande de ressources GPU.

Ce point d'inflexion signifie que la demande a augmenté de manière drastique en peu de temps, et que les hyperscalers et les nouveaux fournisseurs de services cloud (Neoclouds) ont connu une ruée vers l'achat de GPU.

Cette nouvelle demande fait monter les prix tout au long de la chaîne d'approvisionnement, de la mémoire DRAM et NAND, aux câbles à fibres optiques, à l'hébergement de centres de données, en passant par les turbines à gaz et autres infrastructures ; presque tous les produits et services concernés ont vu leurs prix augmenter.

Le prix de location des GPU est devenu le dernier domaine, parmi les nombreux produits et services liés au calcul, à connaître des tensions d'approvisionnement et une flambée des prix. Le prix du contrat de location de GPU H100 sur un an est passé d'un plancher de 1,70 dollar par GPU par heure en octobre 2025 à 2,35 dollars en mars 2026, soit une hausse de près de 40 %.

La capacité de location de GPU à la demande (on-demand) est presque entièrement épuisée pour tous les modèles – les utilisateurs qui ont verrouillé des instances à la demande ne sont pas disposés à remettre la capacité de calcul sur le marché, même après la hausse des prix. Début 2026, trouver de la capacité de calcul GPU était presque comme essayer d'obtenir un billet d'avion pour « le dernier vol » : prix élevés, presque plus de billets. Pour utiliser une analogie plus appropriée, c'était moins comme chercher un billet d'avion que comme « trouver un canal pour acheter des médicaments ».

Chez SemiAnalysis, nous suivons en profondeur et à long terme les tendances et les sujets clés dans l'écosystème des Neocloud et des hyperscalers, y compris les prix de location des GPU. Cette capacité provient de nos recherches et pratiques continues dans des projets tels que ClusterMAX, InferenceX et le coût total de possession (TCO) du cloud IA.

Dans le même temps, nous consacrons également beaucoup d'efforts à aider divers laboratoires d'IA à se connecter avec des fournisseurs de services Neocloud, à trouver des ressources de location de GPU sur le marché, et à échanger continuellement avec presque toutes les parties prenantes de l'écosystème sur l'évolution des prix de location des GPU.

Depuis 2023, nous avons créé et maintenu pour nos clients un système d'indice de prix de location de GPU, couvrant les principaux modèles de GPU (tels que H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355), et couvrant différentes durées de location, de la location à la demande (on-demand), de la location courte durée d'un mois, jusqu'aux contrats à long terme de 5 ans maximum. Cet indice est construit sur la base de données d'enquêtes auprès de plusieurs fournisseurs de services Neocloud et d'acheteurs de capacité de calcul, et est validé par des données de transactions réelles, ainsi que par les négociations et transactions que nous facilitons.

Aujourd'hui, nous rendons public l'indice de prix de location de GPU H100 sur un an de SemiAnalysis, espérant ainsi fournir plus de données et d'analyses à l'industrie. Cet indice est mis à jour mensuellement, et nous publierons continuellement les dernières tendances et observations du marché via X et LinkedIn. Quant aux données de prix complètes couvrant différentes structures de durée de location et d'autres modèles de GPU principaux, elles ne sont actuellement accessibles qu'aux utilisateurs institutionnels abonnés à notre modèle TCO Cloud IA.

Ce rapport se concentrera sur les dernières tendances du marché de la location de GPU, les observations de première ligne et les données clés, expliquant comment nous comprenons la structure globale du marché, et fournissant une évaluation préliminaire de l'orientation future des prix de location.

Le marché de la location de GPU entre dans une phase de « tarification dynamique »

La seule courbe des prix de location du H100 sur un an ne suffit pas à rendre compte pleinement du degré de tension du marché – notre expérience réelle pour obtenir de la capacité de calcul en première ligne, ainsi que les retours des acteurs du marché, reflètent une situation plus grave.

La demande actuelle provient de multiples scénarios d'utilisation hautement hétérogènes, pour lesquels il n'existe presque pas de « solution universelle ». Par exemple, côté inférence, les modèles Mixture of Experts (MoE) à grande échelle sont plus adaptés pour fonctionner sur des systèmes à grande échelle récents comme le GB300 NVL72 ; tandis que côté entraînement, le H100 conserve un avantage en termes de rapport performance/prix, ce qui maintient la demande à un niveau élevé même pour des GPU relativement « anciens ».

Les clients rivalisent désormais même pour payer le prix de 14 dollars par GPU par heure pour les instances spot AWS p6-b200 ; certains fournisseurs Neocloud de premier plan ne vendent plus de nœuds uniques ; les prix de renouvellement de certains H100 sont identiques à ceux signés il y a deux ou trois ans ; et certains contrats H100 ont été directement renouvelés jusqu'en 2028, soit une durée de location de 4 ans. Il est désormais difficile de trouver ne serait-ce qu'un cluster de 8 nœuds (64 GPU) H100 ou H200 – la moitié des fournisseurs que nous avons contactés étaient complètement en rupture de stock, et la majorité ont répondu qu'aucun GPU d'architecture Hopper ne serait libéré prochainement à l'expiration de contrats.

Nous avons même entendu dire que certains locataires de capacité de calcul ont commencé à sous-louer les clusters qu'ils ont loués, un peu comme on sous-loue un appartement pendant le Grand Prix de Monaco. La question de savoir si des « sous-locataires Neocloud » vont apparaître n'est probablement plus une blague.

L'approvisionnement en Blackwell est extrêmement tendu. Nous comprenons qu'en raison de la forte demande de modèles à poids open source et de l'explosion continue de la demande d'inférence, le cycle de déploiement des nouveaux clusters Blackwell est désormais prolongé jusqu'en juin-juillet. De plus, ces clusters sur le point d'être déployés sont pour la plupart déjà réservés à l'avance. En fait, vu l'ensemble du marché, la nouvelle capacité qui ne sera mise en ligne qu'entre août et septembre 2026 est presque entièrement réservée.

Prix de location des GPU : Le retour

Mais comment le marché en est-il arrivé là ? Il y a seulement 6 mois, la plupart des observateurs du marché étaient sceptiques quant à la « valeur terminale » des GPU et pensaient généralement que les prix de location des GPU continueraient de baisser inévitablement avec le temps. À l'époque, si un Neocloud ou un hyperscaler utilisait un cycle d'amortissement de 6 ans pour les actifs de calcul GPU dans ses modèles financiers, il était même critiqué par les analystes financiers. Avant de discuter des tendances futures, revenons rapidement sur la façon dont les choses en sont arrivées là.

Avant le second semestre 2025, l'attente dominante dans tout l'écosystème était que les prix de location des GPU Hopper (c'est-à-dire H100 et H200) baisseraient significativement avec le déploiement à grande échelle de Blackwell et son coût de calcul unitaire nettement inférieur. Mais la réalité fut tout autre. Au second semestre 2025, la demande de H100 non seulement ne faiblit pas, mais s'est même renforcée dans de nombreux scénarios. L'adoption rapide des modèles à poids open source et l'accélération continue de la demande d'inférence à l'époque furent les premiers signaux de cette vague de demande de calcul presque sans fin.

En janvier 2026, le marché du calcul a atteint un nouveau point d'inflexion : les prix de la mémoire DRAM et NAND, après plusieurs trimestres de hausse rapide, ont commencé à entrer dans une phase de flambée quasi « parabolique ». Selon notre modèle de mémoire, au premier trimestre 2026, les prix contractuels du LPDDR5 et du DDR5 ont augmenté d'environ 4 et 5 fois respectivement en glissement annuel.

Pour faire face au risque de marge posé par la hausse drastique des coûts des composants, les fabricants d'OEM ont commencé à augmenter les prix des serveurs IA, et l'ampleur des hausses était nettement supérieure à celle des composants sous-jacents eux-mêmes. Cela a rendu les décisions d'investissement en capital pour les clusters plus complexes : des coûts d'acquisition de serveurs plus élevés compriment le rendement attendu des projets, forçant certains opérateurs à ralentir leur rythme de déploiement, voire à abandonner purement et simplement des projets. Le résultat fut que une partie de l'offre nouvelle qui aurait pu être mise en ligne a été reportée ou mise en suspens, aggravant encore la situation tendue du marché de la location.

Dans ce chaos d'approvisionnement déclenché par la « perte de contrôle des prix des serveurs IA », la demande de location de GPU a considérablement accéléré sa croissance, et la capacité de calcul restante sur le marché a été presque entièrement absorbée en janvier et février. En mars, il était presque impossible de trouver de la capacité disponible, que ce soit pour le H100, le H200 ou le B200, quelle que soit la durée de location. Le prix de location sur un an avait déjà dépassé les 2 dollars par GPU par heure fin janvier, et a de nouveau augmenté de 15 à 20 % par rapport à fin janvier mi-février, avec une nouvelle hausse de 15 à 20 % attendue d'ici fin mars.

L'un des principaux moteurs de la demande début cette année provenait de la génération de contenu natif (native media generation). Des applications comme Seedance et Nano Banana poussent les utilisateurs à générer et itérer des images et des vidéos à l'échelle, augmentant ainsi significativement le débit de tokens. Mais une source de demande plus cruciale et plus visible fut l'émergence de charges de travail multi-agents (multi-agent) – ces systèmes exécutent des processus à multiples étapes, itèrent continuellement dans des environnements à haute concurrence, entraînant une consommation de tokens et une demande de calcul présentant une croissance « exponentielle ».

Cette tendance est particulièrement visible dans les données relatives à Claude Code, comme nous l'avons mentionné dans plusieurs articles. Prenons SemiAnalysis par exemple, rien que les 7 derniers jours, l'entreprise a consommé des milliards de tokens, pour un coût moyen d'environ 5 dollars par million de tokens. Mais les gains de temps, l'extension des flux de travail et l'amélioration des capacités qui en découlent dépassent de loin le coût lui-même. Aujourd'hui, SemiAnalysis a intégré toute une suite d'outils d'IA dans plusieurs flux de travail, ne se limitant plus à une simple recherche et synthèse, mais s'étendant à des tableaux de bord, de l'extraction automatisée, du traitement de données à grande échelle et de la modélisation financière basée sur des agents.

Nous suivons également cette croissance explosive de la demande via des indicateurs tels que les commits quotidiens de Claude (Claude Commits Daily). Selon la tendance actuelle, nous prévoyons que d'ici fin 2026, Claude Code représentera plus de 20 % de tous les commits de code. On peut dire que, sans que vous ne vous en rendiez compte, l'IA a commencé à « dévorer » l'ensemble du processus de développement logiciel. Les clients institutionnels souhaitant obtenir cet ensemble de données peuvent contacter notre équipe API. Petit indice : ce volume de commits est nettement supérieur à celui de notre publication initiale.

Dans notre cercle, presque tout le monde est un utilisateur intensif de Claude Code. Mais nous savons aussi que ce cercle est lui-même profondément immergé dans le domaine de l'IA et des semi-conducteurs, n'étant essentiellement qu'« une petite poignée de personnes en première ligne ».

Pour de nombreuses entreprises du Fortune 500, et pour le grand public, Claude Code et le « monde des agents » ne sont qu'un sujet marginal légèrement nouveau, apparaissant occasionnellement dans le fil d'actualité Facebook ou sur un podcast NPR. Ils n'ont presque pas encore pris conscience qu'une vague de productivité et un choc structurel pilotés par les agents se rapprochent.

Alors que davantage d'acteurs de l'économie réelle prennent progressivement conscience des rendements sur investissement stupéfiants offerts par l'utilisation des outils d'IA et rejoignent cette « vague de calcul », la consommation de tokens continuera d'augmenter par paliers. Le débat sur le retour sur investissement de l'IA est, de fait, clos – la valeur créée par l'utilisation des outils d'IA dépasse souvent d'un ordre de grandeur son coût. Dans ce contexte, le déplacement continu vers la droite de la courbe de demande de tokens forme une force puissante et (à ce stade) relativement inélastique, poussant les prix de location des GPU à la hausse.

En termes simples, si le retour sur investissement de l'utilisation des outils d'IA peut atteindre 5 à 10 fois, alors les prix de location des GPU ont encore une marge de hausse considérable avant de pouvoir vraiment freiner la demande. Nous n'excluons pas non plus que de nouvelles hausses des prix de location continuent de se répercuter vers l'amont, faisant monter le coût des serveurs et des composants clés.

Publication de l'indice de prix de location H100 sur un an de SemiAnalysis

Aujourd'hui, nous rendons public gratuitement l'indice de prix des contrats de location de GPU H100 sur un an de SemiAnalysis, dans le but d'améliorer la connaissance et la transparence sur les tendances des prix de location des GPU.

Cet indice est construit sur la base de données d'enquêtes mensuelles auprès de plus de 100 acteurs du marché (incluant des fournisseurs de services Neocloud, des acheteurs et des vendeurs de capacité de calcul), afin de déterminer la fourchette représentative des prix de location de GPU (du 25e au 75e percentile). Dans le même temps, nous validons également ces données par des données de transactions réelles, et en facilitant la mise en relation d'acheteurs et de vendeurs dans notre propre réseau, participant directement à certaines transactions pour calibrer davantage les niveaux de prix.

Depuis 2023, nous suivons continuellement les prix contractuels des GPU, y compris H100, H200, B200, B300, GB200, GB300, pour des durées de location allant de 3 mois à 5 ans ; nous incluons également les données pertinentes de la série AMD (MI300, MI325, MI355).

Comparé aux indices de GPU existants sur le marché, l'indice de prix des contrats de location H100 sur un an de SemiAnalysis présente plusieurs différences clés :

Premièrement, de nombreux indices de location de GPU sont basés sur des cotations au spot/à la demande (spot/on-demand) ou des prix affichés publiquement, mais en réalité, la grande majorité des transactions de location de GPU se font via des contrats à long terme, généralement d'une durée de 6 mois ou plus. Ces prix sont souvent formés par des négociations bilatérales et n'apparaissent dans aucune base de données publique. La plupart des grands fournisseurs de services Neocloud préfèrent conclure des baux d'au moins un an, idéalement de 2 à 3 ans, et encore mieux s'ils peuvent conclure un accord important de prise ferme (offtake) de 5 ans. L'indice de location H100 sur un an de SemiAnalysis se concentre précisément sur ce « marché des contrats » – c'est-à-dire la partie où le volume des transactions est le plus concentré. En pointant explicitement vers une durée de location, cet indice est également plus facile pour les utilisateurs de comprendre la partie du marché qu'il couvre et de confronter cela à leurs propres observations.

Deuxièmement, les prix divulgués publiquement ne représentent pas les prix de transaction réels. Les prix annoncés par les hyperscalers et les Neocloud fournissent davantage une référence directionnelle de tendance qu'un niveau de transaction réel. Ces prix sont souvent en retard sur les changements du marché des contrats, n'étant généralement ajustés qu'après que la demande de calcul ait déjà changé. Surtout sur le marché à la demande, les prix sont souvent fixés à un niveau relativement stable, et les changements réels de l'offre et de la demande se manifestent through utilization or occupancy rates, and are only adjusted不定期 (irrégulièrement) si nécessaire. Ce mécanisme de marché sera développé plus loin dans l'article.

Troisièmement, bien qu'il existe de nombreux indices sur le marché capables de traiter de grandes quantités de cotations, de prix et de données de transaction, et ayant des avantages en analyse de tendances, notre approche met plus l'accent sur l'interaction directe avec les acteurs du marché. Chaque cotation, chaque transaction a son propre contexte et sa logique décisionnelle, et nous souhaitons, tout en présentant des données quantitatives, compléter ces informations qualitatives et observations de première ligne, afin de restituer plus complètement la structure réelle du marché de la location de GPU.

Pour les utilisateurs abonnés institutionnels, nous fournissons également des données complètes sur la structure des échéances couvrant presque tout le marché principal de la location de GPU.

En publiant l'indice de prix des contrats H100 sur un an, nous avons également lancé le Tableau de bord Tokenomics de SemiAnalysis pour les utilisateurs abonnés au modèle Tokenomics institutionnel, afin de suivre et comprendre le paysage des modèles d'IA de pointe. Ce tableau de bord permet aux utilisateurs de comparer de manière personnalisée différents modèles et fournisseurs de services sur plusieurs dimensions telles que le code, l'inférence, les mathématiques et l'évaluation des agents, de comparer les prix des API, et de consulter les données clés divulguées par les principaux laboratoires d'IA, y compris l'utilisation de tokens, les revenus, la valorisation et la taille de la clientèle.

Structure actuelle du marché de la location de GPU

Avant le second semestre 2025, l'environnement de prix du marché de la location de GPU était relativement plus concurrentiel. À l'époque, les opérateurs disposaient de stocks de GPU plus importants, et la demande finale commençait tout juste à accélérer. Par conséquent, la concurrence entre les fournisseurs de services Neocloud était féroce, se disputant les clients avec des prix plus attractifs. Leur objectif central était d'augmenter le taux d'utilisation, de « squeezer » autant que possible la valeur des actifs de calcul existants avant l'arrivée du prochain cycle d'itération des GPU.

Mais depuis, la dynamique du marché a fait un demi-tour à 180 degrés. Aujourd'hui, les Neocloud et les hyperscalers ont complètement pris les commandes – ils peuvent exiger des acomptes plus élevés, de meilleurs prix, des durées de contrat plus longues, et peuvent même choisir自主地 (autonomously) les dates de début et de fin des contrats pour correspondre à leur planning de stock et de capacité. Dans le même temps, le temps joue également en faveur du côté de l'offre : ils peuvent avancer leurs déploiements à leur propre rythme et, dans un environnement de prix continuellement à la hausse, filtrer progressivement pour obtenir le portefeuille de clients le plus qualifié.

Structurellement, le marché de la location de GPU peut être大致 divisé (roughly divided) en trois segments, correspondant à différents types de besoins clients :

Location à court terme : à la demande (on-demand), spot et contrats de moins de 3 mois

Contrats à moyen terme : contrats de 3 mois à plus de 3 ans

Prises fermes à long terme (offtake) : contrats de 4 à 5 ans, 5 ans étant les plus courants

Location à court terme : À la demande, spot et contrats de moins de 3 mois

La location à court terme se situe à l'extrémité avant de toute la structure des durées, et dans de nombreux cas, elle correspond à une « capacité excédentaire ». Cependant, certains fournisseurs de services (comme Runpod, Lambda) se spécialisent dans la fourniture de capacité de calcul flexible et à l'échelle, à la demande ou spot.

Il est important de noter que le mécanisme de prix du marché à la demande diffère significativement des autres marchés contractuels. Normalement, les fournisseurs de services fixent un prix relativement stable pour les ressources à la demande, et ne l'ajustent que dans de rares cas. En d'autres termes, le prix du marché à court terme n'est pas entièrement驱动 (driven) en direct par l'offre et la demande en temps réel, mais reflète davantage la tension du marché through changes in resource utilization.

Les fournisseurs de services ajustent généralement le prix en une seule fois en fonction du taux d'utilisation des ressources : lorsque l'utilisation est faible, ils baissent les prix pour stimuler la demande ; et lorsque l'utilisation approche de la pleine capacité, ils augmentent les prix, car la demande peut rester élevée même à des prix plus élevés.

Cela explique pourquoi, sur une série chronologique, les prix à la demande annoncés par les Neocloud ont tendance à rester inchangés pendant de longues périodes, puis à subir une « discontinuité » soudaine à la hausse ou à la baisse. Pour le marché à la demande, ce qui reflète vraiment les changements de demande à haute fréquence, ce n'est pas le prix, mais le taux d'utilisation des ressources.

Contrats à moyen terme (Mid-Term Contracts)

D'un point de vue économique, le plus critique est en fait le « marché des contrats », car la grande majorité de la valeur transactionnelle de la location de GPU se produit dans ce segment. Parmi eux, les contrats d'un an sont particulièrement importants – ils reflètent à la fois la demande marginale des clients non laboratoires d'IA et la demande excédentaire des grands clients, ce qui en fait l'indicateur le plus sensible pour juger du degré de resserrement du marché.

Les entreprises natives de l'IA (AI Natives) et les petits et moyens laboratoires d'IA sont principalement actifs dans la fourchette de 1 à 3 ans. Cependant, une tendance récente et évidente est que ces institutions commencent également à essayer de verrouiller les ressources de calcul via des contrats plus longs – beaucoup s'étendent désormais à plus de 4 ans, et sont même prêtes à payer des acomptes supérieurs à 20 %, ce qui n'était pas courant dans les contrats de plus de 4 ans par le passé.

Prises fermes à long terme (Long-Term Offtakes)

Dans le marché plus long terme de 4 à 5 ans, la force motrice est constituée des grands laboratoires d'IA, qui verrouillent des ressources de calcul à grande échelle très tôt. Ce type de transaction correspond généralement à des clusters de grande taille de 50 MW, 100 MW ou même plus, ce qui équivaut大致 (roughly) à environ 24 000 à 48 000 GPU GB300 NVL72. Dans l'ensemble, ces accords de prise ferme à long terme ont déjà占据 (occupied) une part importante du marché de la location de GPU des Neocloud.

Les laboratoires d'IA privilégient ce type de contrats car ils peuvent verrouiller une capacité de calcul à grande échelle en une fois pour faire face à une demande finale en croissance rapide. Dans le même temps, ces institutions sont généralement profondément impliquées dans la conception du cluster,包括 (including) le stockage, le réseau, la configuration du CPU et autres liens clés. Ce type de transaction est souvent livré sous forme de **bare metal (métal nu)** car les laboratoires d'IA disposent de capacités d'ingénierie suffisantes pour personnaliser la pile technologique à un niveau plus bas, achieving the best TCO (coût total de possession) and performance.

Pour les fournisseurs de services Neocloud, ce type de transaction est également attractif. D'une part, ils peuvent concentrer leurs ressources commerciales sur quelques grosses commandes, sans avoir à gérer un grand nombre de petits clients pour le même revenu ; d'autre part, les contrats à long terme leur permettent également d'obtenir de meilleures conditions de financement par emprunt – en alignant la durée du financement sur la durée du contrat, ils peuvent effectively reduce the risk of maturity mismatch and price volatility, et dans la plupart des cas, verrouiller un taux de rendement interne (TRI) de projet de plusieurs dizaines de points de pourcentage.

De plus, les hyperscalers jouent également souvent un rôle de « filet de sécurité » (backstop) – ils agissent comme acheteurs directs, achetant la capacité de calcul auprès des Neocloud pour la revendre aux laboratoires d'IA. Cette structure est gagnant-gagnant pour toutes les parties : les Neocloud peuvent obtenir de meilleures conditions de financement basées sur un acheteur noté AAA ; et les hyperscalers, sans avoir à étendre leur propre bilan, peuvent obtenir une partie des收益 (returns) du projet en fournissant une garantie de crédit.

Le tableau ci-dessous répertorie quelques-uns des grands accords de prise ferme que nous suivons. Nous analysons en profondeur ces transactions pour en déduire le prix horaire implicite du GPU ($/hr/GPU), ainsi que des indicateurs clés de rentabilité tels que le TRI du projet et la marge EBIT.

Dans l'environnement de marché actuel, la grande majorité des grands clusters d'IA en expansion sont en fait « internalisés » par les laboratoires d'IA. Cependant, ces institutions continueront de pénétrer le marché des contrats de moins de 4 ans pour compléter leur capacité de calcul, tout en empêchant indirectement l'offre de retourner sur ce marché en renouvelant leurs clusters H100 et H200 existants. Alors que les clusters超大规模 (hyperscale) GB200 et GB300 sont progressivement mis en ligne, l'évolution de la relation entre l'offre et la demande sur le marché des contrats de 1 à 3 ans deviendra une variable值得观察的 (worth observing) dans un avenir proche.

« Où va la rondelle » (Where The Puck is Going)

Ce qui attire le plus l'attention actuellement, c'est le décalage évident entre la réalité sous-jacente et la sentiment du marché. Bien que les signaux de resserrement de l'offre et de hausse des prix – qui devraient normalement bénéficier aux Neocloud (expansion des marges, prolongation de la durée de vie utile des actifs) – soient très clairs, le marché public devient de plus en plus pessimiste envers des sociétés comme CoreWeave, Nebius, Iris Energy, etc., dont les cours actions se situent toujours dans le bas de la fourchette des 6 à 12 derniers mois.

Le marché reste dominé by the narrative of « ultimate oversupply, commoditization of compute », et les changements ci-dessus n'ont pas vraiment atténué les inquiétudes des investisseurs regarding the long-term value of GPUs. Mais from a frontline perspective,持续的供给紧张 (continuous supply tightness) and enhanced pricing power mean that almost all computing power is being « absorbed » by demand – even with performance differences, in this current environment of extreme shortage, it is still in short supply.

Trois points d'observation futurs

Pour juger si les prix de location des GPU continueront de se maintenir à un niveau élevé, trois variables méritent une attention particulière :

1. Le rythme d'expansion des clusters GB300 (2026)
La clé est la vitesse relative entre la nouvelle capacité de calcul et la demande de tokens – si l'offre atténue la tension ou si la demande continue de dépasser l'offre. Cela affectera directement la participation continue des laboratoires d'IA au marché des contrats de moins de 4 ans, ainsi que l'évolution des prix dans cette fourchette.

2. Si la pénurie de puces s'aggrave
Tout波动 (fluctuation) dans l'exécution de la fabrication des liens clés, including TSMC's N3 process capacity, HBM, DRAM, NAND, etc., pourrait further tighten supply.

3. La vitesse de croissance des revenus (ARR) et de la consommation de tokens des laboratoires d'IA
L'expansion de la commercialisation de l'IA et de l'échelle d'utilisation déterminera l'intensité de la demande finale, c'est également la variable核心 (core) qui drive la demande de calcul.

Prix à la hausse unilatérale, taux de rendement随之提升 (improving accordingly)

Dans l'ensemble, une conclusion relativement claire est : la probabilité que les prix de location des GPU continuent d'augmenter est plus élevée que celle qu'ils baissent.

Ce processus présente des caractéristiques d'auto-renforcement évidentes : lorsque les Neocloud observent un resserrement de l'offre et une hausse des prix, ils verrouillent à l'avance plus de matériel, comprimant ainsi davantage l'offre du marché et poussant les prix à continuer de monter. Cela ressemble au cycle de pénurie de GPU de 2023-2024 – à l'époque, la tension de l'offre avait permis aux OEM de réaliser une expansion significative de leurs marges, et avait entraîné une forte hausse des prix des serveurs (bien que la maturité plus élevée du marché actuel signifie que ce processus ne se reproduise pas necessarily exactly).

Dans le même temps, la nouvelle hausse des prix de location des GPU améliore également le rendement du capital investi (ROIC) des Neocloud :

D'une part, en augmentant la marge bénéficiaire des actifs déjà déployés

D'autre part, en prolongeant le cycle d'utilisation économique des GPU, permettant au capital de générer des flux de trésorerie plus longtemps

Qui sont les plus grands bénéficiaires actuels ?

Les fournisseurs de calcul qui bénéficient le plus directement actuellement sont ceux qui présentent les caractéristiques suivantes :

· Structure principalement à court terme (peut être reprixée rapidement)

· Disposent d'un important parc d'équipements H100

· Ont une nouvelle capacité de production qui sera mise en ligne prochainement

Les Neocloud avec une structure de location à court terme peuvent libérer plus rapidement les anciens contrats et les resigner à des prix plus élevés, réalisant ainsi une expansion rapide des bénéfices. Dans le même temps, les hyperscalers et Neocloud qui ont verrouillé à l'avance la capacité de calcul de next-generation (contrats pluriannuels) bénéficieront également dans les cycles futurs.

Alors la question se pose : cette fois, est-ce que ça va vraiment être « différent » ?

相關問答

QPourquoi les prix de location des GPU ont-ils augmenté de près de 40 % pour les contrats d'un an sur le H100 ?

ALa hausse des prix est principalement due à une demande explosive liée à l'expansion de l'IA, notamment la consommation de tokens en croissance exponentielle, la génération de contenu natif, les systèmes multi-agents et les outils de programmation IA. L'offre est incapable de suivre cette demande, et les contrats à long terme verrouillent une grande partie de la capacité disponible.

QQuels sont les principaux facteurs qui poussent la demande de tokens et donc de puissance de calcul GPU ?

ALes principaux facteurs sont l'émergence des systèmes multi-agents qui exécutent des processus en plusieurs étapes, la génération de contenu natif (images, vidéos) à l'échelle, et l'adoption massive d'outils de programmation IA comme Claude Code, dont le retour sur investissement peut atteindre 5 à 10 fois le coût.

QComment le marché de la location de GPU est-il structurellement organisé ?

ALe marché se divise en trois segments principaux : la location à court terme (à la demande, spot, moins de 3 mois), les contrats à moyen terme (de 3 mois à 3 ans), et les contrats de long terme ou 'offtakes' (4 à 5 ans). La majorité de la valeur transactionnelle se trouve dans le marché des contrats, les grands laboratoires d'IA dominant le segment des offres à long terme.

QQui sont les principaux bénéficiaires de la hausse actuelle des prix de location des GPU ?

ALes principaux bénéficiaires sont les fournisseurs de capacité qui ont une structure de contrat à court terme (leur permettant de se reprixer rapidement), ceux qui disposent d'un important parc de GPU H100 existant, et ceux qui ont de nouvelles capacités de calcul devant être livrées prochainement.

QQuelles sont les trois variables clés à surveiller pour l'évolution future des prix des GPU ?

ALes trois variables clés sont : 1) Le rythme de déploiement des clusters GB300 en 2026 et si l'offre peut rattraper la demande. 2) L'aggravation potentielle des pénuries de composants (puces, HBM, DRAM). 3) Le taux de croissance des revenus (ARR) et de la consommation de tokens des laboratoires d'IA.

你可能也喜歡

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本,这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”,以更好地反映整个项目生态。 与此前侧重于前端功能的版本不同,3.2.0版本优先进行了后端升级和效率提升,旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施,预计可节省高达40%的服务器内存使用。 此次升级引入了名为“fixCleanup3_2_0”的修改,为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查,以确保已删除账户不会在账本上留下不一致的数据,从而加强整个网络的完整性和可靠性。 对于开发者而言,新版本增加了一项重要功能:应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息,这将极大便利钱包、区块链浏览器和API等的开发工作。 在可扩展性和稳定性方面,更新包括可配置的区块大小、通过nuDB实现的高效数据库存储,以及将gRPC服务器的TLS/双向TLS支持改为可选,以提升企业用户的性能和连接性。此外,默认对等端口从51235更改为2459,并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑,3.2.0版本暂时禁用了交易不变性检查,但开发团队表示这不会构成安全威胁。

TheNewsCrypto5 小時前

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

TheNewsCrypto5 小時前

交易

現貨
合約

熱門文章

什麼是 G$

了解 GoodDollar ($G$):去中心化的普世基本收入藍圖 介紹 在不斷演變的加密貨幣和區塊鏈技術領域,旨在解決迫切社會問題的倡議越來越受到關注。其中一個項目是 GoodDollar ($G$),這是一個基於 Web3 的普世基本收入 (UBI) 解決方案。GoodDollar 致力於通過創造和分配可及的經濟資源來解決不平等問題,縮小財富差距,特別是向最需要幫助的人提供支持。通過創新的去中心化金融 (DeFi) 使用,GoodDollar 提出了一個獨特的模式,可能改變全球對金融援助的看法和提供方式。 什麼是 GoodDollar ($G$)? GoodDollar 是一種加密貨幣協議,能夠每天向註冊用戶發放數字代幣,稱為 $G$。這些代幣作為一種普世基本收入的形式,促進來自不同背景的個人,特別是那些傳統上被排除在金融系統之外的人的財務賦權。 GoodDollar 運行在區塊鏈上,利用包括以太坊、Celo 和 Fuse 在內的多條鏈,確保廣泛的接入和可用性。GoodDollar 的基本目標是使加密貨幣對每個人都可接近和有益,無論他們的經濟起點如何。 GoodDollar ($G$) 的創建者 好Dollar的創建者的詳細信息仍然有些模糊。然而,值得注意的是,該項目受到了廣為人知的投資平台 eToro 的強力支持,該平台為 GoodDollar 的開發提供了初始資金和基礎支持。該項目的願景不僅僅是以盈利為目標,而是強烈傾向於社會企業家精神,旨在促進經濟可接近性的系統性變革。 GoodDollar ($G$) 的投資者 GoodDollar 在 eToro 的財務支持和運營支持下蓬勃發展。這一夥伴關係在協議的啟動及其後續發展中發揮了重要作用。雖然 eToro 在建立項目的基礎方面發揮了重要作用,但 GoodDollar 計劃在長期內向社區資助的模式轉變。這一社區資助的轉變符合 GoodDollar 對去中心化的承諾,使其用戶能夠直接參與項目的未來。 GoodDollar ($G$) 如何運作? GoodDollar 的運營框架主要依賴 DeFi 原則,從質押的加密貨幣中產生利息。這一機制使項目能夠鑄造和分發 $G$ 代幣,作為全球用戶的數字基本收入。幾個關鍵特徵使 GoodDollar 的獨特性和創新性得以體現: 普世基本收入 (UBI):每天,註冊用戶會獲得免費代幣,建立自動收入流,以減輕經濟壓力。 可持續經濟模型:該項目的代幣經濟旨在平衡 $G$ 代幣的供需,確保其價值隨時間穩定。 儲備支持的代幣:每個 $G$ 代幣都由一籃加密貨幣儲備支持,為其提供內在價值和可靠性,這對保持用戶信任至關重要。 去中心化治理:GoodDollar 通過代幣驅動的去中心化治理,採取民主的決策方式。這使社區成員能夠積極參與項目軌跡的塑造,使其真正以社區為驅動。 全球可及性:GoodDollar 已經建立了相當大的社區基礎,擁有來自 181 個國家的超過 640,000 名成員。如此廣泛的影響力對於促進全球範圍內的 UBI 實施至關重要。 GoodDollar ($G$) 的時間線 GoodDollar 的發展歷程中標誌著幾個重要的里程碑: 2019:GoodDollar 錢包的推出標誌著將其通過加密貨幣提供 UBI 願景的第一步。 2020:在成功推出錢包後,GoodDollar 協議正式公開。這標誌著其提供每日分發收入的使命的重要階段。 2021:該項目通過推出去中心化自治組織 (DAO) 進一步推進,促進了更高水平的社區參與和治理。 2022:GoodDollar 推出了其 DeFi 友好版本 2 (V2),旨在提升用戶參與度和運營效率。同年,還實現了通過 GoodDAO 轉變為去中心化治理結構。 2022:制定了新路線圖,重點關注旨在促進 $G$ 相關創業計畫的贈款計畫及升級的 GoodDollar 市場。 GoodDollar ($G$) 的主要特徵 GoodDollar 項目引入了多個關鍵特徵,旨在重新定義基本收入的格局: 普世基本收入:每天向用戶提供免費代幣,根本強調了消除經濟危險的使命。 多鏈運作:利用多條區塊鏈網絡增強可及性和可擴展性,確保更廣泛的參與。 與去中心化金融的互動:使用 DeFi 支持基本收入模型的可持續資金,增強其作為經濟解決方案的可行性。 社區參與和治理:GoodDollar 計劃一個社區影響運作的模式,通過民主參與來促進透明度和問責制。 全球社區:擁有多元的全球社區,讓該項目能夠實施適合不同文化和經濟背景的基本收入解決方案。 結論 GoodDollar 代表了通過區塊鏈技術的創新視角來整合普世基本收入原則的變革性飛躍。通過利用去中心化金融,該項目不僅提供了解決財務不平等的方案,還積極讓用戶參與其治理和運營。隨著社區的增長和路線圖的演變,GoodDollar 在加密貨幣與社會公益的交匯處,成為了一個重要的角色,為更公平的金融未來鋪平道路。隨著其不斷發展,GoodDollar 的旅程最終可能會激勵其他倡議考慮類似模式,進一步推進對所有人經濟賦權的事業。

133 人學過發佈於 2024.04.05更新於 2024.12.03

什麼是 G$

如何購買G

歡迎來到HTX.com!在這裡,購買Gravity (G)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Gravity (G)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Gravity (G)購買Gravity (G)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Gravity (G)在HTX的現貨市場輕鬆交易Gravity (G)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

702 人學過發佈於 2024.12.13更新於 2026.06.02

如何購買G

什麼是 @G

Graphite Network, $@G: 橋接傳統金融與Web3 Graphite Network, $@G 介紹 在充滿活力的加密貨幣和Web3項目世界中,Graphite Network作為創新的燈塔而崛起。憑藉其原生代幣$@G,這個Layer-1、權威證明(PoA)區塊鏈旨在橋接傳統金融(TradFi)與快速發展的Web3生態系統之間的鴻溝。隨著數字貨幣的普及,Graphite Network努力提供一個優先考慮安全性、合規性和速度的區塊鏈平台,展現其作為信任與問責的促進者。 Graphite Network, $@G 是什麼? Graphite Network不僅僅是另一個區塊鏈項目;它旨在重新定義去中心化、安全性和用戶問責在數字金融領域的認知。該項目擁有一系列獨特的特徵: 基於聲譽的區塊鏈:Graphite Network的核心實施了一個用戶一賬戶的政策,並配備了集成的了解你的客戶(KYC)驗證和評分機制。這一設計確保了用戶隱私與透明度之間的平衡——這是當今數字世界金融運作中的關鍵方面。 入門節點收入:該網絡激勵用戶設置入門節點,允許運營商從網絡交易中獲得獎勵。這一收入生成模式不僅提升了用戶參與度,還加強了網絡健康和去中心化。 EVM兼容性:Graphite Network配備以太坊兼容的虛擬機(VM),使現有的Solidity去中心化應用(dApps)和智能合約的無縫集成成為可能,從而邀請開發者在不需大量修改的情況下利用其能力。 KYC集成:在合規性至關重要的時代,集成的KYC框架與多層驗證增強了對金融操作的控制,而不強制參與,為用戶自主權樹立了先例。 誰是Graphite Network, $@G的創建者? Graphite Network源自Graphite Foundation的努力,這是一個專注於Graphite Network的開發、維護和演進的非營利組織。該基金會的承諾強調了項目創建一個安全和可持續的區塊鏈環境的願景,專注於真實的用戶參與和合規性。 誰是Graphite Network, $@G的投資者? 目前,關於支持Graphite Network倡議的具體投資者的信息有限。創始組織Graphite Foundation獨立運作,促進項目的增長,同時尋求與其合規和可訪問的區塊鏈平台願景相契合的夥伴關係。 Graphite Network, $@G如何運作? Graphite Network的運作基於其獨特的權威證明共識機制,這在高吞吐量和去中心化之間取得了令人印象深刻的平衡。讓我們深入了解定義其運作的各個組件: 傳輸節點:作為入門節點,這些對生態系統至關重要。運營商可以從穿越網絡的交易中獲得收入,這不僅賦予個別用戶權力,還增強了網絡的去中心化。 授權節點:Graphite Network的核心是經過嚴格合規測試的核心驗證者,這包括強大的KYC驗證以及技術評估。這一信任層對於確保網絡內交易保持高水平的完整性至關重要。 代碼系統:Graphite Network為其包裝代幣採用獨特的代碼系統,標記為@G。這一特徵增強了資產整合的清晰度,使得用戶交易易於理解和簡單明瞭。 Graphite Network的創新方法反映了在解決數字金融關鍵問題方面的重要一步,為未來的發展奠定了良好的基礎,隨著越來越多的用戶從傳統金融形式轉向去中心化應用的世界。 Graphite Network, $@G的時間線 要了解Graphite Network的進展和里程碑,回顧其時間線上的關鍵事件是有益的: 2021年:Graphite Foundation創立Graphite Network,標誌著區塊鏈開發新篇章的開始,專注於合規性和用戶賦權。 關鍵發展:在啟動後,入門節點收入的引入、基於聲譽的模型的建立、集成的KYC驗證以及EVM兼容性的提供代表了該項目的重大進展。 近期活動:Graphite Foundation的持續開發和培育工作專注於增強網絡功能,同時促進生態系統的增長,展現了對可持續性和創新的長期承諾。 其他關鍵點 除了其基礎組件外,Graphite Network還包含幾個工具和功能,以增強其可用性: Graphite Wallet:一個用戶友好的Chrome擴展,方便用戶訪問各種網絡功能和應用,提升用戶便利性。 Graphite Bridge:此工具允許在不同網絡之間無縫轉移Graphite資產,促進一個集成和互操作的生態系統。 Graphite Explorer:作為生態系統中的一個重要工具,該功能使用戶能夠查看和驗證智能合約源代碼、跟踪交易並實時探索其他重要信息。 Graphite Testnet:該項目為開發者提供了一個強大的測試環境,使其能在主網部署之前確保穩定性和可擴展性。這一舉措不僅賦予開發者權力,還增強了整個網絡的可靠性。 結論 Graphite Network及其原生代幣$@G代表了在橋接傳統金融與尖端區塊鏈技術方面的重要進展。通過專注於安全性、合規性和去中心化,這一創新平台將引領進入Web3時代的過渡。隨著用戶參與度的增長和更多項目利用其能力,Graphite Network有望對快速發展的數字環境作出持久貢獻。 總之,Graphite Network是創新思維與現代金融和技術日益增長的需求相結合所能實現的成就的見證。隨著世界探索去中心化金融的潛力,Graphite Network無疑將在這一領域中保持重要的地位。

12 人學過發佈於 2025.01.06更新於 2025.01.06

什麼是 @G

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 G (G)幣價的意見。

活动图片