La GPU no tiene 'precio': cuatro índices se contradicen, el mercado de potencia de cálculo es más caótico de lo que crees

marsbitPublicado a 2026-04-08Actualizado a 2026-04-08

Resumen

Resumen: El mercado de alquiler de GPU está sumido en el caos, sin un precio único claro. Cuatro índices principales (Silicon Data, Ornn AI, Compute Desk, SemiAnalysis) ofrecen cotizaciones divergentes para las H100, con diferencias de más de $2 y tendencias contradictorias. La escasez real de suministro ha provocado acaparamiento y un mercado secundario informal donde se subarriendan clusters. El problema es estructural: no hay un benchmark consensuado, contratos estandarizados, datos de transacciones reales, garantías de calidad de entrega, liquidez contractual ni una curva a plazo. El mercado de la principal materia prima del siglo XXI carece de la infraestructura física y financiera necesaria para su correcto funcionamiento y descubrimiento de precios.

Autor: David Lopez Mateos

Compilación: Deep Tide TechFlow

Guía de Deep Tide: A los medios les encanta usar un solo número para resumir las subidas y bajadas de los precios de la potencia de cálculo de GPU, pero la realidad es que: las cotizaciones de cuatro proveedores de índices en el terminal Bloomberg se desvían entre sí en más de 2 dólares, y la dirección y el ritmo tampoco coinciden. El autor de este artículo es David Lopez Mateos, fundador de la plataforma de transacciones de potencia de cálculo Compute Desk, quien utiliza datos de transacciones de primera mano para desglosar la estructura de precios real de H100 y B200, revelando un mercado primitivo sin consenso de referencia, sin contratos estándar y sin curva a plazo: la potencia de cálculo está siendo acaparada y subarrendada como apartamentos de alquiler a corto plazo.

Los titulares de los medios te harán pensar que el precio de la potencia de cálculo de GPU está disparándose. Esta narrativa es cómoda, se encaja perfectamente en el marco macro de "escasez de oferta + demanda de IA sin fondo", y además sugiere algo tranquilizador: tenemos un mercado que funciona bien, con señales de precios claras y legibles.

Pero no es así. Esta narrativa se basa casi por completo en un único índice, e implica algo que no debería implicarse: que el mercado de alquiler de GPU ya es tan eficiente que se puede representar su estado global con un solo número.

La escasez de oferta es real, pero la escasez que sienten diferentes personas es completamente distinta, dependiendo de quién eres, dónde estás, qué contrato negocias y qué activo de cálculo. Frente a esta opacidad, la reacción natural del mercado no es un descubrimiento de precios ordenado, sino el acaparamiento: bloquear tiempo de GPU que quizás aún no necesitas, porque no estás seguro de si el próximo mes podrás conseguirlo a cualquier precio. Donde hay acaparamiento y no hay referencias transparentes, surgen mercados secundarios fragmentados. En Compute Desk, ya hemos facilitado que los inquilinos subarrienden sus clusters como si fueran apartamentos durante grandes eventos. Esto no es una hipótesis, está sucediendo.

Los índices no convergen

En los mercados de materias primas maduros, los índices construidos con diferentes metodologías tienden a converger. El petróleo Brent y el WTI tienen una diferencia de unos pocos dólares debido a la ubicación geográfica y la calidad del crudo, pero se mueven en la misma dirección (Figura 1). Esta convergencia es una señal de un mercado eficiente.

Leyenda de la figura: Comparación de la evolución del precio del petróleo Brent y WTI, altamente consistentes en dirección

Actualmente hay tres proveedores de índices de precios de GPU en el terminal Bloomberg: Silicon Data, Ornn AI y Compute Desk. SemiAnalysis acaba de hacer público un cuarto: un índice mensual de precios de contratos a un año para H100, construido a partir de datos de encuestas a más de 100 participantes del mercado. Silicon Data y Ornn publican índices diarios de alquiler de H100, Compute Desk agrega datos a nivel de arquitectura Hopper, y SemiAnalysis captura el precio del contrato después de la negociación, no el precio listado o rastreado. Diferentes metodologías, diferentes frecuencias, diferentes ángulos de observación del mismo mercado. Al superponerlos, las divergencias son evidentes (Figura 2).

Leyenda de la figura: Superposición de cuatro índices de GPU, con divergencias evidentes en el nivel de precios y la tendencia

¿Dónde está ocurriendo realmente la subida de precios?

Utilizando los datos de Compute Desk, podemos desglosar la variación de precio del H100 por tipo de proveedor y estructura de contrato, y superponer el índice SDH100RT de Silicon Data (Figura 3). Todos los indicadores muestran que los precios están subiendo, pero el punto de partida y la magnitud varían enormemente según el índice y el tipo de contrato.

Leyenda de la figura: Evolución del precio del H100 desglosado por tipo de contrato, superpuesto con el índice SDH100RT

Los datos de H100 de "neocloud" de Compute Desk cuentan una historia más específica que el índice agregado. Los precios bajo demanda (on-demand) se mantuvieron relativamente estables durante todo el invierno, alrededor de 3.00 dólares/hora, y luego se dispararon bruscamente en marzo a 3.50 dólares. Los precios spot son más ruidosos y más bajos, mostrando solo una ligera tendencia alcista hasta marzo. El SDH100RT de Silicon Data muestra una subida más suave y constante, pasando de 2.00 dólares a 2.64 dólares en el mismo período. Los dos índices se mantienen persistentemente en diferentes niveles de precios y describen diferentes ritmos temporales: Compute Desk habla de un salto en marzo, Silicon Data de un ascenso lento.

Los precios de reserva a un año se mantuvieron básicamente planos hasta febrero, y luego a finales de marzo pasaron de 1.90 dólares a 2.64 dólares de forma abrupta: no fue una convergencia gradual, sino un repreciado repentino. Esto se parece más a un ajuste concentrado de las tarifas contractuales por parte de los proveedores después de que el mercado bajo demanda se tensara, más que a un impulso de demanda estructural continuo.

La historia de marzo del B200 es más intensa (Figura 4). El índice bajo demanda de Compute Desk explotó en unas semanas, pasando de 5.70 dólares a más de 8.00 dólares. El SDB200RT de Silicon Data se disparó de 4.40 dólares a 6.11 dólares antes de retroceder a 5.47 dólares. Ambos índices registraron este movimiento, pero el punto de partida difirió en más de 2 dólares, y la forma de la subida y la caída también fue diferente. El B200 tiene menos de cinco meses de datos, menos proveedores y márgenes de precios más amplios; los dos índices están observando el mismo evento con lentes muy diferentes.

Leyenda de la figura: Evolución de los precios bajo demanda y de reserva del B200, superposición de datos de Compute Desk y Silicon Data

Problemas de infraestructura, no solo diferencias regionales

Los mercados de materias primas tienen diferenciales de base (basis differential). El gas natural de los Apalaches es un caso de libro de texto: vastas reservas sentadas sobre una capacidad de transporte por gasoducto estructuralmente limitada, la utilización en el corredor Pensilvania-Ohio a menudo supera el 100%, y nuevos proyectos como el Borealis Pipeline no estarán operativos hasta finales de la década de 2020.

El mercado de GPU tiene una situación similar: una H100 en Virginia y una H100 en Frankfurt no son el mismo producto económico. Pero las diferencias regionales por sí solas no pueden explicar por qué los índices que miden el mismo mercado divergen tanto. El desajuste en el mercado de GPU es más profundo que el del gas natural de los Apalaches. El problema del gas natural es un único eslabón perdido: la capacidad de transporte por gasoducto que conecta la oferta y la demanda. El déficit de infraestructura del mercado de potencia de cálculo existe en ambos lados, oferta y demanda. La infraestructura física: la red consistente necesaria para distribuir la potencia de cálculo de forma fiable, la configuración predecible, la disponibilidad predecible, aún no está madura, y a veces simplemente no funciona. La infraestructura financiera: contratos estandarizados que puedan comprimir los diferenciales de precios a pesar de las diferencias físicas, referencias transparentes, mecanismos de arbitraje, tampoco existe todavía.

Los datos cuentan una historia. La experiencia real de intentar adquirir potencia de cálculo a principios de 2026 cuenta una historia más punzante. Toda la capacidad bajo demanda para todos los tipos de GPU está prácticamente agotada. Encontrar 64 H100 es difícil: Compute Desk muestra que el 90% de los proveedores tienen disponibilidad cero en clusters bajo demanda, y el mercado de reserva no está mucho mejor. En un mercado que funcionara bien, este nivel de escasez ya habría llevado los precios a un nuevo punto de equilibrio. Pero en realidad no lo ha hecho. Esto sugiere que los propios proveedores carecen de inteligencia de precios en tiempo real para ajustar. Los precios están subiendo, pero demasiado lentamente como para despejar el mercado. La brecha entre el precio listado y la disposición real a pagar está siendo llenada por el acaparamiento, el subarriendo y las transacciones informales del mercado secundario.

Qué necesita cambiar

El mercado actual de potencia de cálculo de GPU tiene siete problemas centrales:

No hay una referencia consensuada. Coexisten múltiples índices, con metodologías diversas y conclusiones contradictorias.

La narrativa agregada oculta la estructura. Un número de "precio del H100" oculta las enormes diferencias entre los distintos tipos de proveedores y plazos de contrato.

Falta de datos a nivel de transacción. En un mercado bilateral, la desviación entre el precio listado y el precio real de la transacción es muy grande.

No hay estandarización de contratos. La mayoría de los alquileres de GPU son negociados bilateralmente, con cláusulas variadas. Plazos de contrato más cortos y estandarizados mejorarían la liquidez y el descubrimiento de precios.

No hay garantía de calidad de entrega. La topología de interconexión, el emparejamiento de CPU, la pila de red y el tiempo de funcionamiento varían enormemente. Los compradores necesitan saber qué calidad de potencia de cálculo están comprando antes de comprometerse.

Los contratos no tienen liquidez. Si la demanda cambia durante el período de reserva, las opciones son limitadas: o asumir el coste o subarrendar de forma informal. El mercado necesita una infraestructura para transferir o revender la potencia de cálculo ya comprometida, permitiendo que la capacidad fluya hacia quienes más la necesitan.

No hay curva a plazo. Sin poder fijar el precio a futuro, no se puede cubrir el riesgo (hedge). Por eso los prestamistas aplican descuentos del 40%-50% a las GPU como garantía, y los costes de financiación son altos.

Construir un mercado que funcione para la materia prima más importante del siglo no puede avanzar en una sola línea. Medición, estandarización, estructura contractual, calidad de entrega, liquidez: todo esto debe avanzar de manera sincronizada. Hasta entonces, nadie podrá decir realmente cuánto vale una hora de GPU.

Preguntas relacionadas

Q¿Por qué los índices de precios de GPU en el mercado de computación no convergen, a diferencia de los mercados de materias primas maduros como el petróleo?

ALos índices de precios de GPU no convergen debido a la falta de un mercado eficiente y estandarizado. Factores como metodologías diferentes entre proveedores de índices (Silicon Data, Ornn AI, Compute Desk), ausencia de contratos estandarizados, variaciones en la calidad de la entrega, y la inmadurez de la infraestructura física y financiera impiden la convergencia, a diferencia del petróleo donde los índices como Brent y WTI se mueven de manera sincronizada.

Q¿Cómo difieren las tendencias de precios entre los contratos bajo demanda y los contratos reservados a un año para las GPU H100 según los datos de Compute Desk?

ASegún Compute Desk, los precios bajo demanda de H100 se mantuvieron estables alrededor de 3.00 dólares por hora durante el invierno, luego aumentaron abruptamente a 3.50 dólares en marzo. Los precios de contratos reservados a un año se mantuvieron planos hasta febrero, y luego experimentaron un aumento repentino de 1.90 a 2.64 dólares a fines de marzo, indicando un reajuste concentrado en lugar de una demanda estructural continua.

Q¿Qué problemas específicos de infraestructura afectan al mercado de computación de GPU, más allá de las diferencias geográficas?

AMás allá de las diferencias geográficas, el mercado de GPU sufre de infraestructura física inmadura (redes inconsistentes, configuración impredecible, disponibilidad no garantizada) e infraestructura financiera ausente (falta de contratos estandarizados, mecanismos de arbitraje y benchmarks transparentes). Esto crea una desconexión más profunda que en mercados como el gas natural, donde el problema suele ser un único eslabón perdido, como la capacidad de transporte.

Q¿Qué fenómeno de mercado está ocurriendo actualmente con el alquiler de clusters de GPU, similar al mercado inmobiliario?

AEstá ocurriendo un fenómeno de acaparamiento y re-alquiler de capacidad de GPU. Los inquilinos están bloqueando tiempo de GPU que pueden no necesitar inmediatamente debido a la incertidumbre de suministro, y luego lo re-alquilan de manera informal, similar a cómo se subarriendan apartamentos durante grandes eventos deportivos. Esto crea un mercado secundario fragmentado en lugar de un ajuste de precios eficiente.

Q¿Cuáles son los siete problemas centrales que el autor identifica en el actual mercado de computación de GPU?

ALos siete problemas son: 1) Ausencia de un benchmark consensuado, 2) La narrativa agregada oculta la estructura del mercado, 3) Falta de datos a nivel transaccional, 4) Falta de estandarización de contratos, 5) Calidad de entrega no garantizada, 6) Contratos sin liquidez, y 7) Ausencia de una curva forward para la fijación de precios a futuro y cobertura de riesgos.

Lecturas Relacionadas

Cuenta regresiva para GPT-5.6: Abandona la fantasía de la API única, incluso la iteración más rápida del poder de cómputo no puede competir con una sola regulación

A mediados de junio, tres eventos aparentemente inconexos —las restricciones regulatorias a Claude Fable 5, el lanzamiento en código abierto de GLM-5.2 y la filtración del lanzamiento inminente de GPT-5.6— marcan un punto de inflexión para la industria global de IA. Estos cambios reflejan una reconfiguración fundamental: la "disponibilidad" supera en importancia a la "vanguardia técnica", dando paso a un sistema dual de modelos cerrados controlados y de código abierto local. La retirada de Fable 72 horas después de su lanzamiento, por restricciones de exportación estadounidenses dirigidas a ciudadanos no estadounidenses, evidencia que el avance técnico ahora conlleva un riesgo regulatorio equivalente. Esto crea una vulnerabilidad para las empresas que dependen de APIs cerradas. Como contrapeso, el modelo de código abierto GLM-5.2 de Zhipu AI, compatible con plataformas de semiconductores locales y con un rendimiento cercano a los modelos cerrados líderes, ofrece una alternativa estable y de menor costo. Su despliegue local se convierte en una estrategia de redundancia crítica para la continuidad del negocio ante riesgos geopolíticos. Mientras tanto, OpenAI se prepara para lanzar GPT-5.6, desplazando su foco de la inteligencia lingüística a la "inteligencia espacial" o modelos mundiales, un campo que requiere una inmensa potencia de cálculo. Este movimiento busca establecer una nueva ventaja competitiva en simulaciones industriales, robótica y diseño 3D. En conclusión, la lógica de la cadena de suministro de modelos grandes ha cambiado. La evaluación crítica para las empresas ya no es solo el rendimiento, sino una combinación de capacidad técnica, cumplimiento normativo y estabilidad de acceso. Para los desarrolladores, depender exclusivamente de una API cerrada supone un riesgo inaceptable. Diseñar arquitecturas "agnósticas al modelo" que permitan cambiar rápidamente a alternativas locales y de código abierto se ha convertido en un requisito básico para garantizar la continuidad del negocio.

marsbitHace 58 min(s)

Cuenta regresiva para GPT-5.6: Abandona la fantasía de la API única, incluso la iteración más rápida del poder de cómputo no puede competir con una sola regulación

marsbitHace 58 min(s)

Fuera del campo: el juego lucrativo que rodea la Copa del Mundo

Fuera del campo: El juego especulativo alrededor del Mundial La Copa del Mundo no es solo un festival para los aficionados, sino también una rara ventana global de especulación. Concentra atención, emoción e identidad en poco más de un mes, generando un ecosistema de apuestas que va más allá del fútbol. Los mercados de predicción, como Polymarket y Kalshi, han irrumpido con fuerza, atrayendo volúmenes de trading de miles de millones con contratos sobre el campeón o resultados. Aunque las casas de apuestas tradicionales siguen siendo el pilar principal, estimándose que las apuestas legales en EE.UU. superarán los 28.000 millones de dólares. En bolsa, aparecen "acciones temáticas". En Corea, empresas de pollo frito subieron antes de los partidos de su selección, mostrando cómo el mercado descuenta el consumo impulsado por los aficionados. El reventa de entradas se ha convertido en un mercado especulativo complejo. Los precios fluctúan salvajemente según los equipos y estrellas, y hay incluso ventas en corto en plataformas secundarias antes de poseer los tickets. Los artículos de colección, como las pegatinas Panini o camisetas limitadas, también ven sus precios dispararse por su escasez y valor emocional. El mundo de las criptomonedas no se queda atrás, con miles de memecoins no oficiales relacionados con el Mundial que experimentan bombas y desplomes extremos, a menudo siendo esquemas de "pump and dump". Por último, hay quien especula con la propia demanda de información, creando herramientas para rastrear entradas o vendiendo suscripciones con consejos de apuestas. El verdadero ganador no siempre es quien acierta el resultado, sino quien entiende cómo fluye la atención y la especulación alrededor del evento. Cuando termina el torneo, otro vasto red de transacciones ya ha hecho su propio结算.

marsbitHace 1 hora(s)

Fuera del campo: el juego lucrativo que rodea la Copa del Mundo

marsbitHace 1 hora(s)

¿Cómo usa Codex el ordenador? Tres puntos de entrada y límites de permisos

Este artículo explica las tres formas en que Codex interactúa con el entorno externo: Uso del Ordenador, la extensión de Chrome y el Navegador integrado en la aplicación. Cada una aborda la tarea de "usar el ordenador", pero se adapta a diferentes escenarios, niveles de permisos y confianza. * **Uso del Ordenador (@Computer)**: Es el de mayor alcance, permitiendo operar aplicaciones nativas de macOS/Windows, configuraciones del sistema, el simulador de iOS, e incluso flujos de trabajo entre múltiples apps. Es ideal para procesos GUI sin API o herramientas estructuradas, pero es más lento y tiene los permisos más amplios. Se debe usar como último recurso cuando las herramientas estructuradas no cubren la tarea. * **Extensión de Chrome (@Chrome)**: Permite acceder al estado ya iniciado de sesión en Chrome, incluyendo cookies, perfiles y pestañas abiertas. Es óptimo para tareas que dependen de identidad, como trabajar en Gmail, LinkedIn, Salesforce, paneles internos o investigación que requiera autenticación en múltiples sitios. Ofrece control multi-pestaña y un contexto nativo del navegador, pero acciones como enviar o publicar requieren supervisión. * **Navegador integrado (@Browser)**: Es un navegador aislado dentro del hilo de Codex, sin el estado de inicio de sesión o cookies del navegador principal. Es ideal para desarrollo y depuración web, como trabajar con servidores locales, reproducir bugs visuales, verificar diseños responsivos o dar retroalimentación de diseño directa en la página. Su aislamiento lo hace seguro para tareas de desarrollo, pero no es apto para sitios que requieran identificación. **Appshots** no es un método de control, sino una herramienta para proporcionar contexto visual (capturando la ventana frontal en macOS) y señalar a Codex qué elementos observar, sin otorgar permisos de control. El principio central es elegir la interfaz de operación **más estricta, segura y estructurada** posible para cada tarea: priorizar plugins o MCP sobre control visual; usar el Navegador integrado para desarrollo web; cambiar a Chrome cuando se necesite identidad del navegador; y recurrir al Uso del Ordenador solo como "último kilómetro" para flujos GUI inevitables.

marsbitHace 3 hora(s)

¿Cómo usa Codex el ordenador? Tres puntos de entrada y límites de permisos

marsbitHace 3 hora(s)

Trading

Spot
Futuros
活动图片