¿Por qué los precios de las GPU se disparan sin control?

marsbit發佈於 2026-04-06更新於 2026-04-06

文章摘要

El precio del alquiler de GPU, especialmente para modelos como H100, ha experimentado un aumento cercano al 40% en contratos de un año, pasando de 1,70 a 2,35 dólares por GPU/hora entre octubre de 2025 y marzo de 2026. Este incremento se debe a la creciente demanda de capacidad de cálculo impulsada por la IA, incluidos modelos de código abierto, generación de contenido nativo y sistemas multiagente, que han elevado el consumo de tokens de forma exponencial. La escasez de suministro se ha agravado por la subida de precios de componentes como DRAM, NAND y servidores, lo que ha ralentizado el despliegue de nueva capacidad. Los proveedores de nube (Neoclouds e hyperscalers) ahora dominan el mercado, imponiendo contratos más largos y precios más altos. Se espera que los precios sigan subiendo debido a la alta rentabilidad de las herramientas de IA (5-10 veces el coste), lo que hace que la demanda sea inelástica a corto plazo. La tensión entre la escasez real y las expectativas de sobreoferta futura está redefiniendo la valoración de la infraestructura de IA.

Nota del editor: A medida que la IA pasa de ser una "herramienta" a una "infraestructura de flujo de trabajo", los precios de alquiler de GPU entran en una fase de aceleración alcista, con una oferta que continúa ajustándose.

Desde el aumento de casi el 40% en el precio del H100 a un año, hasta la capacidad de computación bloqueada hasta la segunda mitad de 2026, pasando por los laboratorios de IA que bloquean continuamente la oferta mediante contratos a largo plazo y mecanismos de renovación, la lógica operativa del mercado de GPU ha cambiado significativamente: el precio ya no está determinado principalmente por el coste del hardware, sino que lo conforman conjuntamente el consumo de tokens, la capacidad del modelo y la eficiencia productiva.

Los cambios en el lado de la demanda son especialmente cruciales. Nuevos paradigmas, como los sistemas multiagente, la generación nativa de contenido y las herramientas de programación con IA, están impulsando el uso de tokens hacia un crecimiento exponencial. La conclusión central del informe se va clarificando: la relación coste-beneficio de las herramientas de IA ya ha sido validada, con retornos de 5 a 10 veces, lo que hace que el precio de la capacidad de computación, durante un buen tiempo, no logre restringir efectivamente la demanda.

La tensión resultante es cada vez más clara: el mercado real de capacidad de computación muestra una escasez generalizada y un desplazamiento del poder de fijación de precios hacia arriba, mientras que el mercado de capitales se mantiene en la expectativa de que "eventualmente habrá exceso de oferta y commoditización". Esta desconexión entre expectativas y realidad está remodelando la lógica de valoración del ecosistema de infraestructura de IA.

Cuando la capacidad de computación se convierte en un nuevo medio de producción, su mecanismo de precios, estructura de oferta y retorno de capital se encuentran en medio de una profunda reconfiguración.

A continuación, el texto original:

La demanda de Claude 4.6 Opus y Claude Code de Anthropic se ha disparado enormemente. Sus ingresos anuales recurrentes (ARR) saltaron de 9 mil millones de dólares a finales del año pasado a más de 25 mil millones de dólares actuales en apenas un trimestre, casi triplicándose. Al mismo tiempo, modelos de código abierto como GLM y Kimi K2.5 también han impulsado una rápida expansión de los escenarios de aplicación relacionados con modelos de código abierto. La financiación continua de empresas como Anthropic, OpenAI y varias Neolabs también está intensificando la demanda de recursos de GPU.

Este punto de inflexión significa que la demanda ha aumentado drásticamente en un corto período de tiempo, y los hiperescaladores (hyperscalers) y los nuevos proveedores de servicios en la nube (Neoclouds) ya están experimentando una oleada de compras de GPU.

Esta nueva demanda está impulsando los precios al alza a lo largo de toda la cadena de suministro, desde el almacenamiento DRAM y NAND, hasta cables de fibra óptica, alojamiento en centros de datos y turbinas de gas, entre otros infraestructura; casi todos los productos y servicios relacionados han experimentado subidas.

El precio de alquiler de GPU se ha convertido en el último ámbito, entre los muchos productos y servicios relacionados con la capacidad de computación, en experimentar tensión en la oferta y un salto en los precios. El precio del contrato de alquiler de GPU H100 a un año pasó de un mínimo de 1,70 dólares por GPU por hora en octubre de 2025 a 2,35 dólares en marzo de 2026, un aumento cercano al 40%.

La capacidad de alquiler de GPU bajo demanda (on-demand) para casi todos los modelos está prácticamente agotada: aquellos usuarios que han asegurado instancias bajo demanda, incluso después del aumento de precios, no están dispuestos a liberar la capacidad de computación de vuelta al mercado. A principios de 2026, encontrar capacidad de computación de GPU era casi como intentar conseguir un billete para "el último vuelo disponible": precios altísimos y casi sin disponibilidad. Una metáfora más precisa sería, en lugar de buscar un billete de avión,更像是 "buscar un canal para comprar medicamentos".

En SemiAnalysis, realizamos un seguimiento profundo y a largo plazo de diversas tendencias y temas clave dentro del ecosistema de los Neocloud y los hiperescaladores, incluido el precio del alquiler de GPU. Esta capacidad proviene de nuestra investigación y práctica continuas en proyectos como ClusterMAX, InferenceX y el Costo Total de Propiedad (TCO) de la nube de IA.

Al mismo tiempo, dedicamos un esfuerzo considerable a ayudar a diversos laboratorios de IA a conectarse con proveedores de servicios Neocloud, a buscar recursos de alquiler de GPU en el mercado y a mantener una comunicación continua con casi todos los participantes del ecosistema sobre las tendencias de cambio en los precios de alquiler de GPU.

Desde 2023, hemos creado y mantenido para nuestros clientes un sistema de índices de precios de alquiler de GPU, que cubre los modelos principales de GPU (como H100, H200, B200, B300, GB200, GB300, MI300, MI325, MI355) y abarca diferentes plazos de alquiler, desde bajo demanda (on-demand) y alquileres cortos de 1 mes, hasta contratos a largo plazo de hasta 5 años. Este índice se construye a partir de datos de encuestas a múltiples proveedores de Neocloud y compradores de capacidad de computación, y se valida cruzadamente con datos de transacciones reales y con las negociaciones y operaciones en las que participamos como intermediarios.

Hoy, hacemos público nuestro índice de precios de alquiler de GPU H100 a un año de SemiAnalysis, con la esperanza de proporcionar más datos e insights a la industria. Este índice se actualiza mensualmente, y también publicaremos continuamente las últimas tendencias y observaciones del mercado a través de X y LinkedIn. En cuanto a los datos completos de precios que cubren diferentes estructuras de plazo de alquiler y otros modelos principales de GPU, actualmente solo están disponibles para usuarios institucionales suscritos a nuestro modelo TCO de nube de IA.

Este informe se centrará en las últimas tendencias del mercado de alquiler de GPU, las observaciones de primera línea y los datos clave, analizando cómo entendemos la estructura general del mercado y ofreciendo un juicio preliminar sobre la dirección futura de los precios de alquiler.

El mercado de alquiler de GPU entra en una fase de "fijación dinámica de precios"

Con solo observar la curva de precios de alquiler del H100 a un año, no es suficiente para presentar completamente el grado de tensión del mercado: nuestra experiencia real obteniendo capacidad de computación en primera línea, y los comentarios de los participantes del mercado, reflejan una situación aún más grave.

La demanda actual proviene de múltiples escenarios de uso altamente heterogéneos, y casi no existe una "solución universal". Por ejemplo, en el lado de la inferencia, los modelos de expertos mixtos (MoE) a gran escala son más adecuados para ejecutarse en los últimos sistemas a gran escala como el GB300 NVL72; mientras que en el lado del entrenamiento, el H100 aún mantiene una ventaja en relación precio-rendimiento, lo que hace que incluso GPUs relativamente "de la generación anterior" mantengan una alta demanda.

Los clientes ahora incluso compiten por pagar precios de instancias de interrupción (spot) de AWS p6-b200 de 14 dólares por GPU por hora; algunos proveedores de Neocloud líderes ya no venden nodos individuales; los precios de renovación de algunos H100 son exactamente iguales a cuando se firmaron hace dos o tres años; y algunos contratos de H100 se han renovado directamente hasta 2028, con un plazo de alquiler de hasta 4 años. Ahora, encontrar incluso un clúster de 8 nodos (64 GPUs) de H100 o H200 no es fácil: de los proveedores que consultamos, la mitad están completamente agotados, y la respuesta de la mayoría es: simplemente no hay ninguna GPU de arquitectura Hopper que vaya a quedar libre por vencimiento de contrato en el corto plazo.

Incluso hemos oído que algunos arrendatarios de capacidad de computación han comenzado a subdividir y subarrendar los clústeres que alquilaron,简直像在摩纳哥大奖赛期间把公寓拆开短租一样. A continuación,会不会出现所谓的 "Neocloud 二房东",恐怕也不再只是玩笑.

El suministro de Blackwell también es extremadamente ajustado. Entendemos que, debido a la fuerte demanda de modelos de pesos abiertos y a la continua explosión de la demanda de inferencia, el ciclo de despliegue y entrega de los nuevos clústeres Blackwell ahora se ha extendido hasta junio o julio. Además, la mayoría de estos clústeres próximos a implementarse también han sido bloqueados con antelación. De hecho, desde la perspectiva de todo el mercado, la capacidad adicional que estará disponible recién entre agosto y septiembre de 2026 ya está casi completamente reservada.

Precios de alquiler de GPU: Un regreso con fuerza

Pero, ¿cómo se llegó a esto? Hace apenas 6 meses, la mayoría de los observadores del mercado aún se mostraban escépticos sobre el "valor final" de las GPU y普遍认为认为 el precio de alquiler de las GPU caería inevitablemente con el tiempo. En ese entonces, si un Neocloud o un hiperescalador utilizaba un ciclo de depreciación de 6 años para los activos de capacidad de computación de GPU en sus modelos financieros, incluso recibía críticas de los analistas financieros. Antes de discutir las tendencias futuras, repasemos rápidamente cómo evolucionó la situación.

Antes de la segunda mitad de 2025, la expectativa predominante en todo el ecosistema era: con el despliegue a gran escala de Blackwell y su costo significativamente menor por unidad de capacidad de computación, los precios de alquiler de Hopper (es decir, H100 y H200) caerían notablemente. Pero sucedió todo lo contrario. Para la segunda mitad de 2025, la demanda de H100 no solo no se debilitó, sino que se fortaleció aún más en muchos escenarios. La rápida popularización de los modelos de pesos abiertos y la continua aceleración de la demanda de inferencia en ese entonces, fueron las primeras señales de esta ola de demanda de capacidad de computación casi interminable.

Para enero de 2026, el mercado de capacidad de computación alcanzó el siguiente punto de inflexión: los precios de contratación de DRAM y NAND, después de varios trimestres de rápido aumento, comenzaron una fase de subida casi "parabólica". Según nuestro modelo de almacenamiento, en el primer trimestre de 2026, los precios de contratación de LPDDR5 y DDR5 registraron aumentos interanuales cercanos al 400% y 500%, respectivamente.

Para hacer frente al riesgo para los márgenes de beneficio provocado por el fuerte aumento de los costes de los componentes, los fabricantes de equipos originales (OEM) comenzaron a subir los precios de los servidores de IA, con incrementos significativamente superiores a los de los propios componentes subyacentes. Esto complicó aún más las decisiones de inversión de capital en clústeres: unos mayores costes de adquisición de servidores comprimieron el retorno esperado de los proyectos, obligando a algunos operadores a ralentizar el ritmo de despliegue o incluso a abandonar directamente los proyectos. El resultado fue que parte de la nueva oferta que podría haber estado disponible se retrasó o suspendió, agravando aún más la situación de tensión en el mercado de alquiler.

En medio de este caos de compras desencadenado por la "pérdida de control en los precios de los servidores de IA", la demanda de alquiler de GPU creció significativamente más rápido, y la capacidad de computación restante en el mercado fue casi completamente absorbida en enero y febrero. Para marzo, era prácticamente imposible encontrar capacidad disponible para cualquier plazo de alquiler, ya fuera H100, H200 o B200. El precio de alquiler a un año ya había superado los 2 dólares por GPU por hora a finales de enero, y a mediados y finales de febrero volvió a subir entre un 15% y un 20% respecto a finales de enero, y se espera que a finales de marzo suba otro 15%-20% respecto al mes anterior.

Uno de los importantes impulsores de la demanda a principios de este año provino de la generación nativa de contenido (native media generation). Aplicaciones como Seedance y Nano Banana están impulsando a los usuarios generen y iteren imágenes y videos de manera escalable, aumentando significativamente el rendimiento de tokens. Pero la fuente de demanda más crítica y visible fue el auge de las cargas de trabajo multiagente (multi-agent): estos sistemas ejecutan procesos de múltiples pasos, iterando continuamente en entornos de alta concurrencia, impulsando que el consumo de tokens y la demanda de capacidad de computación muestren un crecimiento "exponencial".

Esta tendencia se refleja particularmente en los datos relacionados con Claude Code, como hemos mencionado en varios artículos anteriores. Tomando SemiAnalysis como ejemplo, solo en los últimos 7 días, el consumo interno de la empresa fue de miles de millones de tokens, con un coste promedio de aproximadamente 5 dólares por millón de tokens. Pero el ahorro de tiempo, la expansión de los flujos de trabajo y la mejora de capacidades que conlleva, superan con creces el coste en sí. Hoy, SemiAnalysis ha integrado un conjunto completo de herramientas de IA en múltiples flujos de trabajo, que ya no se limitan a la búsqueda y resumen simples, sino que se extienden a paneles de datos, scraping automatizado, procesamiento de datos a gran escala y modelado financiero basado en agentes, entre otros escenarios.

También utilizamos métricas como las confirmaciones diarias de Claude (Claude Commits Daily) para rastrear este crecimiento explosivo de la demanda. Según la tendencia actual, prevemos que para finales de 2026, Claude Code representará más del 20% de todas las confirmaciones de código. Podría decirse que, en el tiempo que ni siquiera te has dado cuenta, la IA ya ha comenzado a "devorar" todo el proceso de desarrollo de software. Para los clientes institucionales que deseen acceder a este conjunto de datos, pueden contactar a nuestro equipo de API. Un adelanto: este volumen de confirmaciones ya es significativamente mayor que cuando lo publicamos inicialmente.

En nuestro círculo, casi todos son usuarios intensivos de Claude Code. Pero también somos conscientes de que este círculo en sí está profundamente inmerso en el campo de la IA y los semiconductores, siendo esencialmente solo "un pequeño grupo en la primera línea".

Para muchas empresas Fortune 500, y para el público en general, Claude Code y el "mundo de los agentes" son poco más que un tema marginal ligeramente novedoso, que ocasionalmente aparece en el feed de Facebook o en podcasts de NPR. Apenas son conscientes de que se acerca una ola de productividad impulsada por agentes y un impacto estructural.

A medida que más participantes de la economía real se den cuenta gradualmente del asombroso retorno de la inversión que aporta el uso de herramientas de IA y se unan a esta "ola de capacidad de computación", el consumo de tokens continuará experimentando aumentos escalonados. El debate sobre la relación coste-beneficio de la IA, de hecho, ya se ha zanjado: el valor creado por el uso de herramientas de IA a menudo puede ser un orden de magnitud mayor que su coste. En este contexto, el continuo desplazamiento hacia la derecha de la curva de demanda de tokens está formando una fuerza poderosa y (en la etapa actual) relativamente inelástica, que impulsa al alza los precios de alquiler de GPU.

En pocas palabras, si el retorno de la inversión por usar herramientas de IA puede alcanzar de 5 a 10 veces, entonces el precio de alquiler de GPU aún tiene un margen de subida considerable antes de que pueda realmente inhibir la demanda. Tampoco descartamos que una mayor subida de los precios de alquiler continúe trasladándose hacia arriba, impulsando los costes de los servidores y los componentes centrales.

Lanzamiento del Índice de Precios de Alquiler de H100 a un año de SemiAnalysis

Hoy, hacemos público gratuitamente el índice de precios de contratos de alquiler de GPU H100 a un año de SemiAnalysis, con el objetivo de mejorar la comprensión y transparencia del mercado sobre las tendencias de precios de alquiler de GPU.

Este índice se construye a partir de datos mensuales de encuestas a más de 100 participantes del mercado (incluidos proveedores de Neocloud, compradores y vendedores de capacidad de computación), utilizados para determinar el rango representativo de precios de alquiler de GPU (percentil 25 al 75). Simultáneamente, validamos cruzadamente con datos de transacciones reales, y actuamos como intermediarios entre compradores y vendedores en nuestra propia red, participando directamente en algunas transacciones para calibrar aún más los niveles de precios.

Desde 2023, hemos estado rastreando continuamente los precios de contratación de GPUs que incluyen H100, H200, B200, B300, GB200, GB300, en diferentes plazos de alquiler de 3 meses a 5 años; también incorporamos datos relevantes de la serie AMD (MI300, MI325, MI355).

En comparación con los índices de GPU existentes en el mercado, el índice de precios de contratos a un año de H100 de SemiAnalysis tiene varias diferencias clave:

En primer lugar, muchos índices de alquiler de GPU se basan en cotizaciones de mercado spot/bajo demanda (spot/on-demand) o precios listados públicamente, pero en realidad, la gran mayoría de las transacciones de alquiler de GPU se realizan mediante contratos a largo plazo,通常期限在通常 plazos de通常 6 meses o más. Este tipo de precios suelen formarse mediante negociaciones bilaterales y no aparecen en ninguna base de datos pública. La mayoría de los grandes proveedores de Neocloud prefieren firmar contratos de alquiler de al menos 1 año, siendo ideales de 2 a 3 años, y aún mejor si se pueden lograr acuerdos de compra garantizada (包销) a 5 años por grandes volúmenes. El índice de alquiler de H100 a un año de SemiAnalysis se centra precisamente en este "mercado de contratos", que es donde se concentra el mayor volumen de transacciones reales. Al apuntar explícitamente a un plazo de alquiler específico, este índice también facilita que los usuarios comprendan el segmento de mercado que cubre y contrasten con sus propias observaciones.

En segundo lugar, los precios divulgados públicamente no representan los precios reales de transacción. Los precios publicados por los hiperescaladores y Neoclouds ofrecen más una referencia direccional de la tendencia que el nivel real de transacción. Estos precios suelen ir con retraso respecto a los cambios en el mercado de contratos,通常是在通常 ajustándose通常 solo después de que la demanda de capacidad de computación ya ha cambiado. Especialmente en el mercado bajo demanda, los precios suelen establecerse en niveles relativamente fijos, y los cambios reales en la oferta y la demanda se reflejan en la utilización o la tasa de ocupación de recursos, ajustándose solo de manera irregular cuando es necesario. Sobre este mecanismo de mercado, el artículo se extenderá más adelante.

En tercer lugar, aunque también hay muchos índices en el mercado que pueden procesar grandes volúmenes de cotizaciones, precios y datos de transacciones, y tienen ventajas en el análisis de tendencias, nuestro método hace más hincapié en la interacción directa con los participantes del mercado. Detrás de cada cotización, cada transacción, hay un contexto específico y una lógica de decisión;我们希望希望在提供量化数据的同时,也补充这些定性信息与一线观察,从而更全面地还原 GPU 租赁市场的真实结构.

Para los usuarios suscriptores institucionales, también proporcionamos datos completos de la estructura de plazos que cubren casi todo el mercado principal de alquiler de GPU.

Junto con el lanzamiento del índice de precios de contratos a un año de H100, también lanzamos para los usuarios suscriptores institucionales del modelo Tokenomics el Panel de Control de Tokenomics de SemiAnalysis, para rastrear y comprender el panorama de los modelos de IA de vanguardia. Este panel permite a los usuarios realizar comparaciones personalizadas en múltiples dimensiones como código, inferencia, matemáticas y evaluación de agentes, comparar los precios de API de diferentes modelos y proveedores de servicios, y ver datos clave divulgados por los principales laboratorios de IA, incluido el volumen de uso de tokens, ingresos, valoración y tamaño de la cartera de clientes, etc.

La estructura actual del mercado de alquiler de GPU

Antes de la segunda mitad de 2025, el entorno de fijación de precios en el mercado de alquiler de GPU era relativamente más competitivo. En ese entonces, los operadores tenían inventarios de GPU más abundantes, y la demanda final recién comenzaba a acelerarse. Por lo tanto, la competencia entre los diversos proveedores de Neocloud era feroz,普遍通过通常 compitiendo普遍 mediante precios más atractivos para atraer clientes. Su objetivo central era提高利用率通常 aumentar la utilización,尽可能尽可能 "exprimir"通常 el valor de los activos de capacidad de computación existentes antes de que llegara el próximo ciclo de iteración de GPU.

Pero desde entonces, el panorama del mercado ha dado un giro de 180 grados. Hoy, los Neocloud y los hiperescaladores tienen completamente la iniciativa: pueden exigir pagos anticipados más altos, precios más favorables, plazos de contrato más largos,甚至可以甚至可以 elegir autónomamente las fechas de inicio y fin del contrato, para que coincidan con sus arreglos de inventario y capacidad. Al mismo tiempo, el tiempo también está del lado de la oferta: pueden avanzar en los despliegues a su propio ritmo, y en un entorno de precios continuamente alcistas, ir seleccionando gradualmente la cartera de clientes de mayor calidad.

Estructuralmente, el mercado de alquiler de GPU se puede dividir大致 en大致 tres grandes segmentos, que对应着对应着 diferentes tipos de demanda de clientes:

Alquiler a corto plazo: Bajo demanda (on-demand), de interrupción (spot) y contratos de hasta 3 meses.

Contratos a medio plazo: Contratos de 3 meses a más de 3 años.

Compra garantizada a largo plazo (offtake): Contratos de 4 a 5 años, siendo 5 años los más comunes.

Alquiler a corto plazo: Bajo demanda, de interrupción y contratos de hasta 3 meses

El alquiler a corto plazo se encuentra en la parte más frontal de toda la estructura de plazos, y en muchos casos对应着对应着 "capacidad excedente". Sin embargo,也有一些也有一些 proveedores (como Runpod, Lambda) se especializan en ofrecer capacidad de computación bajo demanda o de interrupción, flexible y de escala considerable.

Es importante señalar que el mecanismo de fijación de precios del mercado bajo demanda difiere significativamente del de otros mercados de contratos. Normalmente, los proveedores de servicios establecen un nivel de precio relativamente fijo para los recursos bajo demanda, y solo lo ajustan en muy contadas ocasiones. En otras palabras, el precio del mercado a corto plazo no está完全驱动完全 impulsado完全 por la oferta y la demanda en tiempo real, sino que los cambios en la tensión del mercado se reflejan más a través de cambios en la utilización de recursos.

Los proveedores de servicios suelen ajustar el precio de una sola vez según la utilización de recursos: cuando la utilización es baja, reducen los precios para estimular la demanda; y cuando la utilización se acerca a la plena capacidad, aumentan los precios, porque incluso a niveles de precios más altos, la demanda aún puede mantenerse alta.

Esto también explica por qué, en una serie temporal, los precios bajo demanda publicados por los Neoclouds suelen permanecer不变不变 durante un período prolongado, para luego experimentar un "salto" repentino al alza o a la baja. Para el mercado bajo demanda, lo que realmente puede reflejar los cambios de demanda de alta frecuencia no es el precio, sino la utilización de recursos.

Contratos a medio plazo (Mid-Term Contracts)

Desde un punto de vista económico, lo que realmente es más crucial es el "mercado de contratos", porque la gran mayoría del valor transaccional del alquiler de GPU ocurre en este segmento.其中其中, los contratos a un año son especialmente importantes: reflejan tanto la demanda marginal de clientes que no son laboratorios de IA, como la demanda de desbordamiento de los grandes clientes, por lo que son el indicador más sensible para juzgar el grado de ajuste del mercado.

Las empresas nativas de IA (AI Natives) y los laboratorios de IA pequeños y medianos,主要活跃在主要活跃在 el intervalo de 1 a 3 años. Sin embargo, una tendencia clara reciente es que estas instituciones también están comenzando a intentar bloquear recursos de capacidad de computación mediante contratos a más largo plazo: muchas ya se extienden a más de 4 años, incluso están dispuestas a pagar anticipos superiores al 20%, algo que no era común en los contratos de más de 4 años en el pasado.

Compra garantizada a largo plazo (Long-Term Offtakes)

En el mercado a más largo plazo de 4 a 5 años, la fuerza dominante son los grandes laboratorios de IA, que bloquean recursos de capacidad de computación a gran escala en una etapa temprana. Este tipo de transacciones通常对应着通常对应着 clústeres de gran escala de 50MW, 100MW o incluso más,大致相当于大致相当于 aproximadamente entre 24,000 y 48,000 GPUs GB300 NVL72. En general, este tipo de acuerdos de compra garantizada a largo plazo ya ocupan una parte considerable del mercado de alquiler de GPU de los Neoclouds.

Los laboratorios de IA favorecen este tipo de contratos porque pueden bloquear capacidad de computación a gran escala de una vez, para hacer frente a la rápida crecimiento de la demanda final. Al mismo tiempo, estas instituciones通常参与通常 participan通常 profundamente en el diseño del clúster,包括包括 enlaces clave como almacenamiento, red, configuración de CPU, etc. Este tipo de transacciones suelen entregarse en forma de **metal desnudo (bare metal)**, porque los laboratorios de IA tienen suficiente capacidad de ingeniería para personalizar la pila tecnológica en un nivel más bajo, logrando así el mejor TCO (Costo Total de Propiedad) y rendimiento.

Para los proveedores de servicios Neocloud, este tipo de transacciones también son atractivas. Por un lado, pueden concentrar sus recursos de ventas en unas pocas órdenes grandes, en lugar de lidiar con una multitud de clientes pequeños para obtener los mismos ingresos; por otro lado, los contratos a largo plazo también les facilitan obtener financiamiento de deuda en condiciones más favorables: al hacer coincidir el plazo del financiamiento con el plazo del contrato, pueden reducir efectivamente el riesgo de descalce de plazos y volatilidad de precios, y en la mayoría de los casos bloquear una tasa interna de retorno (TIR) del proyecto de十几个百分点通常十几个百分点.

Además, los hiperescaladores (Hyperscalers) también suelen desempeñar el papel de "garantes" (backstop): actúan como承购方通常承购方 directas, comprando capacidad de computación a los Neoclouds para luego revenderla a los laboratorios de IA. Esta estructura es beneficiosa para todas las partes: los Neoclouds pueden obtener condiciones de financiamiento más favorables basadas en un承购方通常承购方 con calificación AAA; mientras que los hiperescaladores pueden participar en una parte de los ingresos del proyecto al proporcionar avales crediticios, sin necesidad de expandir sus propios balances.

La siguiente tabla enumera algunos de los grandes acuerdos de compra garantizada que estamos siguiendo. Analizamos en profundidad estas transacciones para deducir su precio implícito por hora de GPU ($/hr/GPU), así como indicadores clave de rentabilidad como la TIR del proyecto y el margen EBIT.

En el entorno actual del mercado, la gran mayoría de los grandes clústeres de IA en expansión están siendo "digeridos internamente" por los laboratorios de IA. Sin embargo, estas instituciones aún ingresan al mercado de contratos de hasta 4 años para complementar la capacidad de computación, al mismo tiempo que, al renovar los clústeres existentes de H100 y H200, indirectamente impiden que la oferta regrese a este mercado. A medida que los clústeres a超大规模通常超大规模 de GB200 y GB300 se implementen gradualmente, cómo evoluciona la relación entre oferta y demanda en el mercado de contratos de 1 a 3 años se convertirá en una variable值得重点观察值得重点观察 en el próximo período.

"Hacia dónde se dirige el disco" (Where The Puck is Going)

Lo que más llama la atención actualmente es la clara divergencia entre la realidad subyacente y el sentimiento del mercado. Aunque las señales de ajuste de la oferta y subida de precios, que deberían ser favorables para los Neoclouds (expansión de márgenes, prolongación de la vida útil de los activos), son muy claras, el mercado público却对却对 empresas como CoreWeave, Nebius, Iris Energy, etc., es cada vez más pesimista, y sus precios de acciones aún se encuentran en los niveles bajos del rango de los últimos 6 a 12 meses.

El mercado aún está dominado por la narrativa de que "finalmente habrá exceso de oferta y commoditización de la capacidad de computación", y los cambios anteriores no han aliviado realmente la preocupación de los inversores sobre el valor a largo plazo de las GPU. Pero, desde la situación de primera línea, la continua tensión en la oferta y el fortalecimiento del poder de fijación de precios significan que casi toda la capacidad de computación está siendo "absorbida" por la demanda: incluso si existen diferencias de rendimiento, en el entorno actual de escasez extrema, sigue habiendo más demanda que oferta.

Tres puntos clave de observación para el futuro

Para juzgar si los precios de alquiler de GPU continuarán manteniéndose altos, se pueden enfocar tres variables:

1. Ritmo de expansión de los clústeres GB300 (2026)
La clave es la velocidad relativa entre la nueva capacidad de computación ofertada y la demanda de tokens: si la oferta alivia la tensión o la demanda continúa superando a la oferta. Esto afectará directamente si los laboratorios de IA continúan participando en el mercado de hasta 4 años y la tendencia de precios en ese intervalo.

2. Si la escasez de chips empeora aún más
Incluyendo la capacidad del proceso N3 de TSMC, HBM, DRAM, NAND y otros eslabones clave,任何任何 fluctuación en la ejecución de la fabricación任何可能任何可能 apretar aún más la oferta.

3. Velocidad de crecimiento de los ingresos (ARR) y el consumo de tokens de los laboratorios de IA
La expansión de la comercialización de la IA y la escala de uso determinarán la intensidad de la demanda final, que es la variable central que impulsa la demanda de capacidad de computación.

Precios con tendencia alcista, retornos en aumento

En general, una conclusión relativamente clara es: la probabilidad de que los precios de alquiler de GPU continúen subiendo es mayor que la de que caigan.

Este proceso tiene características evidentes de autorrefuerzo: cuando los Neoclouds observan que la oferta se ajusta y los precios suben, bloquean más hardware con antelación, comprimiendo así aún más la oferta del mercado e impulsando que los precios continúen subiendo. Esto es similar al ciclo de escasez de GPU de 2023-2024: en ese entonces, la tensión en la oferta impulsó a los OEM a lograr una expansión significativa de los beneficios e impulsó un fuerte aumento en los precios de los servidores (aunque, dado que este mercado es más maduro, este proceso未必完全重演未必完全重演).

Al mismo tiempo, el repunte de los precios de alquiler de GPU también está mejorando el retorno sobre el capital invertido (ROIC) de los Neoclouds:

Por un lado,提高了已部署资产的利润率通常提高了 los márgenes de beneficio de los activos ya desplegados.

Por otro lado,延长了 GPU 的经济使用周期通常延长了 el ciclo económico de uso de las GPU, permitiendo que el capital genere flujo de caja durante más tiempo.

¿Quién se beneficia más actualmente?

Los proveedores de capacidad de computación que más se benefician directamente en la actualidad son aquellos con las siguientes características:

· Estructura de contratos de corto plazo为主为主 (pueden repreciarse rápidamente)

· Poseen una gran cantidad de equipos H100 existentes

· Tienen nueva capacidad programada para entrar en línea en el corto plazo

Los Neoclouds con estructura de alquiler a corto plazo pueden liberar más rápido los contratos antiguos y volver a contratar a precios más altos, realizando así una rápida expansión de beneficios. Al mismo tiempo, también se beneficiarán en el ciclo futuro aquellos hiperescaladores y Neoclouds que hayan bloqueado con antelación capacidad de computación de la próxima generación (contratos multiyear).

Entonces surge la pregunta: ¿será que esta vez真的 "不一样"?

相關問答

Q¿Por qué los precios de alquiler de GPU están experimentando una subida descontrolada?

ALos precios de alquiler de GPU están subiendo debido a la convergencia de varios factores: la transición de la IA de herramienta a infraestructura de flujo de trabajo, lo que impulsa la demanda de alquiler; un aumento exponencial en el consumo de tokens impulsado por nuevos paradigmas como sistemas multiagente, generación de contenido nativo y herramientas de programación con IA; una oferta limitada con capacidad reservada hasta bien entrado 2026; y el aumento de los costes de componentes como DRAM, NAND y servidores, que se trasladan a los precios finales. La relación coste-beneficio de la IA (5-10 veces) hace que la demanda sea relativamente inelástica al precio en este momento.

Q¿Qué papel juegan los 'Neoclouds' y los 'Hyperscalers' en el mercado actual de GPU?

ALos Neoclouds (nuevos proveedores de nube especializados) y los Hyperscalers (grandes proveedores de nube a escala) tienen ahora un poder de fijación de precios significativo. Controlan la oferta, exigen precios más altos, pagos anticipados, contratos más largos y pueden elegir el timing de sus despliegues. Los Hyperscalers también actúan a veces como 'backstop' o garantes, comprando capacidad a los Neoclouds y revendiéndola a los laboratorios de IA, compartiendo los beneficios sin expandir sus propios.

Q¿Cómo ha evolucionado el índice de precios de alquiler de H100 a un año según SemiAnalysis?

AEl índice de precios de alquiler de H100 a un año de SemiAnalysis muestra un aumento de casi un 40%, pasando de aproximadamente 1.70 dólares por GPU por hora en octubre de 2025 a 2.35 dólares en marzo de 2026. Este índice se basa en datos de más de 100 participantes del mercado y transacciones reales, centrándose en el mercado de contratos a largo plazo donde se realiza la mayor parte del volumen de negocio.

Q¿Qué está impulsando la demanda de tokens y, por tanto, de potencia de cálculo (GPUs)?

ALa demanda de tokens, y por extensión de GPUs, está siendo impulsada principalmente por el auge de las cargas de trabajo multiagente que ejecutan procesos de múltiples pasos, la generación de contenido nativo a escala (imágenes, vídeo) y las herramientas de programación con IA como Claude Code. Estas aplicaciones conducen a un consumo de tokens de crecimiento exponencial. La alta rentabilidad de la inversión en herramientas de IA (5-10 veces el coste) significa que la demanda es fuerte y actualmente tiene poca elasticidad respecto al precio.

Q¿Cuáles son las tres áreas clave para observar la futura evolución del precio del alquiler de GPU?

ALas tres áreas clave para observar son: 1) El ritmo de expansión de los clústeres GB300 en 2026 y si la nueva oferta puede satisfacer la demanda de tokens. 2) Si la escasez de chips (en fabricación en N3 de TSMC, HBM, DRAM, NAND) empeora, restringiendo aún más la oferta. 3) La velocidad de crecimiento de los ingresos (ARR) y el consumo de tokens de los laboratorios de IA, que es el motor fundamental de la demanda final de capacidad de cálculo.

你可能也喜歡

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

XRP Ledger发布了3.2.0版本,这是对其底层区块链基础设施的一次重要升级。本次更新的核心是将运行网络的软件名称从“rippled”更名为“xrpld”,以更好地反映整个项目生态。 与此前侧重于前端功能的版本不同,3.2.0版本优先进行了后端升级和效率提升,旨在增强网络性能并为未来的扩展做准备。关键改进包括内存优化措施,预计可节省高达40%的服务器内存使用。 此次升级引入了名为“fixCleanup3_2_0”的修改,为单资产金库、借贷协议、权限系统、去中心化交易所、多用途代币和权限域等多个模块带来了安全性增强。开发团队还新增了不变性检查,以确保已删除账户不会在账本上留下不一致的数据,从而加强整个网络的完整性和可靠性。 对于开发者而言,新版本增加了一项重要功能:应用程序无需连接服务器即可检索XRP Ledger协议和服务器定义信息,这将极大便利钱包、区块链浏览器和API等的开发工作。 在可扩展性和稳定性方面,更新包括可配置的区块大小、通过nuDB实现的高效数据库存储,以及将gRPC服务器的TLS/双向TLS支持改为可选,以提升企业用户的性能和连接性。此外,默认对等端口从51235更改为2459,并修复了涉及自动做市商、支付、代币托管、多用途代币、订单簿和RPC等多个方面的问题。出于性能考虑,3.2.0版本暂时禁用了交易不变性检查,但开发团队表示这不会构成安全威胁。

TheNewsCrypto6 小時前

XRP Ledger 发布 3.2.0 版本升级并启用 XRPLd 新品牌名

TheNewsCrypto6 小時前

交易

現貨
合約

熱門文章

什麼是 G$

了解 GoodDollar ($G$):去中心化的普世基本收入藍圖 介紹 在不斷演變的加密貨幣和區塊鏈技術領域,旨在解決迫切社會問題的倡議越來越受到關注。其中一個項目是 GoodDollar ($G$),這是一個基於 Web3 的普世基本收入 (UBI) 解決方案。GoodDollar 致力於通過創造和分配可及的經濟資源來解決不平等問題,縮小財富差距,特別是向最需要幫助的人提供支持。通過創新的去中心化金融 (DeFi) 使用,GoodDollar 提出了一個獨特的模式,可能改變全球對金融援助的看法和提供方式。 什麼是 GoodDollar ($G$)? GoodDollar 是一種加密貨幣協議,能夠每天向註冊用戶發放數字代幣,稱為 $G$。這些代幣作為一種普世基本收入的形式,促進來自不同背景的個人,特別是那些傳統上被排除在金融系統之外的人的財務賦權。 GoodDollar 運行在區塊鏈上,利用包括以太坊、Celo 和 Fuse 在內的多條鏈,確保廣泛的接入和可用性。GoodDollar 的基本目標是使加密貨幣對每個人都可接近和有益,無論他們的經濟起點如何。 GoodDollar ($G$) 的創建者 好Dollar的創建者的詳細信息仍然有些模糊。然而,值得注意的是,該項目受到了廣為人知的投資平台 eToro 的強力支持,該平台為 GoodDollar 的開發提供了初始資金和基礎支持。該項目的願景不僅僅是以盈利為目標,而是強烈傾向於社會企業家精神,旨在促進經濟可接近性的系統性變革。 GoodDollar ($G$) 的投資者 GoodDollar 在 eToro 的財務支持和運營支持下蓬勃發展。這一夥伴關係在協議的啟動及其後續發展中發揮了重要作用。雖然 eToro 在建立項目的基礎方面發揮了重要作用,但 GoodDollar 計劃在長期內向社區資助的模式轉變。這一社區資助的轉變符合 GoodDollar 對去中心化的承諾,使其用戶能夠直接參與項目的未來。 GoodDollar ($G$) 如何運作? GoodDollar 的運營框架主要依賴 DeFi 原則,從質押的加密貨幣中產生利息。這一機制使項目能夠鑄造和分發 $G$ 代幣,作為全球用戶的數字基本收入。幾個關鍵特徵使 GoodDollar 的獨特性和創新性得以體現: 普世基本收入 (UBI):每天,註冊用戶會獲得免費代幣,建立自動收入流,以減輕經濟壓力。 可持續經濟模型:該項目的代幣經濟旨在平衡 $G$ 代幣的供需,確保其價值隨時間穩定。 儲備支持的代幣:每個 $G$ 代幣都由一籃加密貨幣儲備支持,為其提供內在價值和可靠性,這對保持用戶信任至關重要。 去中心化治理:GoodDollar 通過代幣驅動的去中心化治理,採取民主的決策方式。這使社區成員能夠積極參與項目軌跡的塑造,使其真正以社區為驅動。 全球可及性:GoodDollar 已經建立了相當大的社區基礎,擁有來自 181 個國家的超過 640,000 名成員。如此廣泛的影響力對於促進全球範圍內的 UBI 實施至關重要。 GoodDollar ($G$) 的時間線 GoodDollar 的發展歷程中標誌著幾個重要的里程碑: 2019:GoodDollar 錢包的推出標誌著將其通過加密貨幣提供 UBI 願景的第一步。 2020:在成功推出錢包後,GoodDollar 協議正式公開。這標誌著其提供每日分發收入的使命的重要階段。 2021:該項目通過推出去中心化自治組織 (DAO) 進一步推進,促進了更高水平的社區參與和治理。 2022:GoodDollar 推出了其 DeFi 友好版本 2 (V2),旨在提升用戶參與度和運營效率。同年,還實現了通過 GoodDAO 轉變為去中心化治理結構。 2022:制定了新路線圖,重點關注旨在促進 $G$ 相關創業計畫的贈款計畫及升級的 GoodDollar 市場。 GoodDollar ($G$) 的主要特徵 GoodDollar 項目引入了多個關鍵特徵,旨在重新定義基本收入的格局: 普世基本收入:每天向用戶提供免費代幣,根本強調了消除經濟危險的使命。 多鏈運作:利用多條區塊鏈網絡增強可及性和可擴展性,確保更廣泛的參與。 與去中心化金融的互動:使用 DeFi 支持基本收入模型的可持續資金,增強其作為經濟解決方案的可行性。 社區參與和治理:GoodDollar 計劃一個社區影響運作的模式,通過民主參與來促進透明度和問責制。 全球社區:擁有多元的全球社區,讓該項目能夠實施適合不同文化和經濟背景的基本收入解決方案。 結論 GoodDollar 代表了通過區塊鏈技術的創新視角來整合普世基本收入原則的變革性飛躍。通過利用去中心化金融,該項目不僅提供了解決財務不平等的方案,還積極讓用戶參與其治理和運營。隨著社區的增長和路線圖的演變,GoodDollar 在加密貨幣與社會公益的交匯處,成為了一個重要的角色,為更公平的金融未來鋪平道路。隨著其不斷發展,GoodDollar 的旅程最終可能會激勵其他倡議考慮類似模式,進一步推進對所有人經濟賦權的事業。

134 人學過發佈於 2024.04.05更新於 2024.12.03

什麼是 G$

如何購買G

歡迎來到HTX.com!在這裡,購買Gravity (G)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Gravity (G)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Gravity (G)購買Gravity (G)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Gravity (G)在HTX的現貨市場輕鬆交易Gravity (G)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

702 人學過發佈於 2024.12.13更新於 2026.06.02

如何購買G

什麼是 @G

Graphite Network, $@G: 橋接傳統金融與Web3 Graphite Network, $@G 介紹 在充滿活力的加密貨幣和Web3項目世界中,Graphite Network作為創新的燈塔而崛起。憑藉其原生代幣$@G,這個Layer-1、權威證明(PoA)區塊鏈旨在橋接傳統金融(TradFi)與快速發展的Web3生態系統之間的鴻溝。隨著數字貨幣的普及,Graphite Network努力提供一個優先考慮安全性、合規性和速度的區塊鏈平台,展現其作為信任與問責的促進者。 Graphite Network, $@G 是什麼? Graphite Network不僅僅是另一個區塊鏈項目;它旨在重新定義去中心化、安全性和用戶問責在數字金融領域的認知。該項目擁有一系列獨特的特徵: 基於聲譽的區塊鏈:Graphite Network的核心實施了一個用戶一賬戶的政策,並配備了集成的了解你的客戶(KYC)驗證和評分機制。這一設計確保了用戶隱私與透明度之間的平衡——這是當今數字世界金融運作中的關鍵方面。 入門節點收入:該網絡激勵用戶設置入門節點,允許運營商從網絡交易中獲得獎勵。這一收入生成模式不僅提升了用戶參與度,還加強了網絡健康和去中心化。 EVM兼容性:Graphite Network配備以太坊兼容的虛擬機(VM),使現有的Solidity去中心化應用(dApps)和智能合約的無縫集成成為可能,從而邀請開發者在不需大量修改的情況下利用其能力。 KYC集成:在合規性至關重要的時代,集成的KYC框架與多層驗證增強了對金融操作的控制,而不強制參與,為用戶自主權樹立了先例。 誰是Graphite Network, $@G的創建者? Graphite Network源自Graphite Foundation的努力,這是一個專注於Graphite Network的開發、維護和演進的非營利組織。該基金會的承諾強調了項目創建一個安全和可持續的區塊鏈環境的願景,專注於真實的用戶參與和合規性。 誰是Graphite Network, $@G的投資者? 目前,關於支持Graphite Network倡議的具體投資者的信息有限。創始組織Graphite Foundation獨立運作,促進項目的增長,同時尋求與其合規和可訪問的區塊鏈平台願景相契合的夥伴關係。 Graphite Network, $@G如何運作? Graphite Network的運作基於其獨特的權威證明共識機制,這在高吞吐量和去中心化之間取得了令人印象深刻的平衡。讓我們深入了解定義其運作的各個組件: 傳輸節點:作為入門節點,這些對生態系統至關重要。運營商可以從穿越網絡的交易中獲得收入,這不僅賦予個別用戶權力,還增強了網絡的去中心化。 授權節點:Graphite Network的核心是經過嚴格合規測試的核心驗證者,這包括強大的KYC驗證以及技術評估。這一信任層對於確保網絡內交易保持高水平的完整性至關重要。 代碼系統:Graphite Network為其包裝代幣採用獨特的代碼系統,標記為@G。這一特徵增強了資產整合的清晰度,使得用戶交易易於理解和簡單明瞭。 Graphite Network的創新方法反映了在解決數字金融關鍵問題方面的重要一步,為未來的發展奠定了良好的基礎,隨著越來越多的用戶從傳統金融形式轉向去中心化應用的世界。 Graphite Network, $@G的時間線 要了解Graphite Network的進展和里程碑,回顧其時間線上的關鍵事件是有益的: 2021年:Graphite Foundation創立Graphite Network,標誌著區塊鏈開發新篇章的開始,專注於合規性和用戶賦權。 關鍵發展:在啟動後,入門節點收入的引入、基於聲譽的模型的建立、集成的KYC驗證以及EVM兼容性的提供代表了該項目的重大進展。 近期活動:Graphite Foundation的持續開發和培育工作專注於增強網絡功能,同時促進生態系統的增長,展現了對可持續性和創新的長期承諾。 其他關鍵點 除了其基礎組件外,Graphite Network還包含幾個工具和功能,以增強其可用性: Graphite Wallet:一個用戶友好的Chrome擴展,方便用戶訪問各種網絡功能和應用,提升用戶便利性。 Graphite Bridge:此工具允許在不同網絡之間無縫轉移Graphite資產,促進一個集成和互操作的生態系統。 Graphite Explorer:作為生態系統中的一個重要工具,該功能使用戶能夠查看和驗證智能合約源代碼、跟踪交易並實時探索其他重要信息。 Graphite Testnet:該項目為開發者提供了一個強大的測試環境,使其能在主網部署之前確保穩定性和可擴展性。這一舉措不僅賦予開發者權力,還增強了整個網絡的可靠性。 結論 Graphite Network及其原生代幣$@G代表了在橋接傳統金融與尖端區塊鏈技術方面的重要進展。通過專注於安全性、合規性和去中心化,這一創新平台將引領進入Web3時代的過渡。隨著用戶參與度的增長和更多項目利用其能力,Graphite Network有望對快速發展的數字環境作出持久貢獻。 總之,Graphite Network是創新思維與現代金融和技術日益增長的需求相結合所能實現的成就的見證。隨著世界探索去中心化金融的潛力,Graphite Network無疑將在這一領域中保持重要的地位。

12 人學過發佈於 2025.01.06更新於 2025.01.06

什麼是 @G

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 G (G)幣價的意見。

活动图片