Autor: Caleb Shack、Alana Levin
Compilación: Jiahuan, ChainCatcherer
En Variant, nos apasiona explorar mercados emergentes. Las nuevas clases de activos, productos financieros, emisiones de activos, la ampliación del acceso al mercado y las formas novedosas de participación están profundamente arraigadas en nuestros genes fundacionales.
Recientemente, hemos estado reflexionando sobre los mercados construidos en torno a la potencia de cálculo.
El acceso a la potencia de cálculo es un ámbito vasto y en constante crecimiento, y se podría decir que ya está listo para una mayor financiarización.
Sin embargo, las dinámicas de oferta y demanda de potencia de cálculo son altamente complejas, opacas y en constante evolución. Siguen existiendo muchas incógnitas sobre el momento del mercado, su estructura e incluso sobre qué activo específico se está comerciando.
En medio del debate y la discusión sobre estas cuestiones, queremos compartir un marco analítico emergente, como una ventana para pensar sobre los mercados de potencia de cálculo.
El nacimiento de un nuevo mercado de futuros suele requerir cinco condiciones previas:
- Fragmentación en el lado de la oferta
- Volatilidad de precios sostenida
- Alguna forma de infraestructura de liquidación física
- Una unidad estandarizada y negociable
- Falta de alternativas para el descubrimiento de precios o la cobertura
Nuestro marco examina el panorama actual del mercado de potencia de cálculo a lo largo de estas cinco dimensiones. Utilizamos analogías históricas para explicar la importancia de cada dimensión y predecir cuándo el mercado podría alcanzar un punto de inflexión.
Resumen de los puntos clave
Una revisión rápida de este marco revela que el mercado actual de potencia de cálculo aún carece de la madurez necesaria para sostener un mercado de futuros robusto.
(No obstante, el mercado es dinámico y muchas startups están trabajando activamente para cambiar esto; si estás trabajando en ello, ¡ponte en contacto con nosotros!)
A continuación, nuestra puntuación actual para el mercado de futuros de potencia de cálculo en las cinco dimensiones:
- Fragmentación de la oferta:🔴 La oferta está altamente concentrada en los hiperescaladores de la nube
- Volatilidad de precios:🟢 Los precios de las GPU son extremadamente volátiles
- Infraestructura de liquidación física:🟢 Existe infraestructura de liquidación física a nivel de corredores OTC
- Estandarización:🔴 La potencia de cálculo carece de una unidad estandarizada y negociable
- Falta de alternativas:🟡 Los proveedores integrados verticalmente pueden cubrirse internamente; otros participantes están obligados a estar en largo
1. Fragmentación en el lado de la oferta (Puntuación de la potencia de cálculo: 🔴)
Los mercados de futuros son mecanismos para el descubrimiento de precios.
Bajo una oferta monopolística, el descubrimiento de precios pierde su razón de ser, ya que el precio lo fijan unos pocos grandes proveedores, eliminando cualquier incertidumbre en la fijación de precios.
A lo largo de la historia, esto ha sido frecuente.
Los futuros del petróleo solo prosperaron después de que el cartel de la oferta (las "Siete Hermanas", las siete grandes empresas transnacionales que dominaban el petróleo global a mediados del siglo XX) se debilitó.
Los mercados eléctricos se formaron después de que la desregulación gubernamental rompiera la fijación de precios monopolística y permitiera la entrada de productores independientes. La fragmentación del lado de la oferta impulsó los mercados de futuros como un lugar importante para el descubrimiento de precios.
Examinando la dinámica actual de la potencia de cálculo, el lado de la oferta parece relativamente concentrado.
Los cuatro grandes de la nube (por ejemplo, AWS, Azure, GCP, Oracle) controlan aproximadamente el 78% de la capacidad global de energía TI clave auto-construida y aproximadamente el 69% del suministro de H100 (según cálculos del artículo, asumiendo 12.4 millones de H100 en Q4 2025).
Por lo tanto, inferimos que también dominan la oferta global de horas de potencia de cálculo. La oferta no está fragmentada.
Aun así, estamos reflexionando sobre los factores que podrían cambiar esta dinámica.
Están surgiendo nuevos proveedores de nube. Las nuevas arquitecturas de chips crean oportunidades para que otros proveedores ganen cuota de mercado.
Alguna capacidad comprometida a largo plazo en los principales laboratorios puede terminar subutilizada, lo que significa que estos laboratorios podrían eventualmente convertirse en proveedores o vendedores de potencia de cálculo en el mercado.
Por lo tanto, aunque no estamos seguros del nivel futuro de concentración, nuestro juicio actual es: la dirección del desarrollo del lado de la oferta del mercado será más fragmentada de lo que es ahora.
2. Volatilidad de precios (Puntuación de la potencia de cálculo: 🟢)
Índice Ornn H100 en Bloomberg Terminal
Otra condición previa para un mercado de futuros es que el activo subyacente sea altamente volátil.
Sin una incertidumbre de precios significativa, los operadores de cobertura no tienen motivos para protegerse del riesgo de volatilidad.
La volatilidad también atrae a especuladores, que pueden beneficiarse de grandes oscilaciones de precios. Si el mercado es plano o predecible, los especuladores mirarán hacia otros mercados.
Vimos esto en el mercado del petróleo en la década de 1950.
Cuando la oferta de petróleo superó a la demanda, la Unión Soviética fijó precios por debajo de los listados por las "Siete Hermanas". Las "Siete Hermanas" respondieron reduciendo los precios en esa región sin informar a los países productores de Oriente Medio.
El shock resultante condujo a la nacionalización del petróleo en Oriente Medio, la formación de la OPEP y un aumento de la incertidumbre en los precios globales del petróleo. Posteriormente, la volatilidad del petróleo también desencadenó la volatilidad en el mercado eléctrico en la década de 1970.
La fijación de precios de la potencia de cálculo ha sido, y seguirá siendo, volátil.
El ritmo al que se introduce nueva oferta al mercado es incierto. Nuevos chips o arquitecturas de centros de datos podrían mejorar la eficiencia de Tokens para tareas específicas. La demanda continúa aumentando y se expande de formas impredecibles.
Estamos muy seguros de que esta condición previa ya se cumple hoy.
3. Infraestructura de liquidación física (Puntuación de la potencia de cálculo: 🟢)
Para que un mercado funcione de manera eficiente, los compradores deben confiar en que podrán recibir y consumir el instrumento subyacente en la fecha y hora acordadas.
Esto requiere infraestructura: mecanismos para agregar la oferta, garantizar la entrega confiable, liquidar transacciones, manejar garantías y gestionar la liquidación. Este trabajo suele ser realizado por intermediarios o corredores.
En los mercados eléctricos, estas tareas las realizan los Operadores Independientes del Sistema, que actúan como terceros neutrales, entidades cuasi-gubernamentales.
El mercado actual de potencia de cálculo aún no tiene un equivalente exacto, pero nuestra hipótesis es: los corredores de potencia de cálculo o las mesas OTC están empezando (y cada vez más) a asumir muchas de estas funciones.
Hoy, los corredores están construyendo índices y herramientas de agregación de datos en torno a acuerdos de compra y arrendamiento de potencia de cálculo, para anclar los precios de mercado.
Ornn y Silicon Data ya han comenzado a publicar datos de precios para GPU a nivel de centro de datos.
La comunidad de corredores también está llegando a un consenso sobre los acuerdos contractuales, similar a cómo los acuerdos SAFE estandarizaron los términos de financiación inicial. Estas herramientas completan la infraestructura de liquidación física subyacente, que anteriormente se coordinaba en gran medida a través de chats grupales.
Puntuamos en verde la infraestructura de liquidación física porque sienta las bases para el descubrimiento de precios.
Pero está lejos de ser perfecta en comparación con un mercado spot maduro. Estas compras ocurren a nivel de infraestructura, y no todos los participantes del mercado tienen el derecho de revender públicamente después de la compra. Estamos siguiendo de cerca los avances en la creación de nuevos mercados en este nivel.
4. Estandarización (Puntuación de la potencia de cálculo: 🔴)
Un desafío principal para una nueva materia prima suele ser cuán única e infungible es su unidad.
Demasiadas variables pueden dispersar la liquidez entre múltiples mercados o generar un riesgo de base demasiado alto para satisfacer la mayoría de las necesidades de cobertura y entrega.
Por ejemplo, el petróleo crudo se mide por densidad y contenido de azufre, que varía según la fuente.
NYMEX encontró el ajuste de producto-mercado con su índice WTI (petróleo ligero dulce), porque se centró en un estándar que podía servir al mercado ascendente global, e incluso fue utilizado por el mercado descendente (por ejemplo, aerolíneas) para cobertura.
La electricidad se estandariza por región, considerando las fluctuaciones de oferta y demanda que difieren según factores como la temperatura y la densidad de población.
El mercado de potencia de cálculo carece del nivel de estandarización necesario para satisfacer las necesidades generales de cobertura.
El desafío: una instancia H100 no siempre equivale a otra instancia H100.
Factores como la región (y la entrada de energía local), la configuración del sistema (es decir, hardware y componentes de red) y la duración (es decir, duración del contrato) exacerban la variación en los precios de las instancias de GPU.
Sin embargo, vemos signos tempranos de estandarización, especialmente cuando la demanda proviene de la inferencia de larga cola (es decir, laboratorios no de vanguardia).
A diferencia del entrenamiento, las cargas de trabajo de inferencia requieren menos matices y pueden ejecutarse en entornos distribuidos en lugar de implementados en el mismo sitio.
Si la oferta de inferencia se dispersa entre muchos proveedores, por ejemplo, si los modelos de pesos de código abierto ganan cuota de mercado, la estandarización puede surgir.
5. Falta de alternativas (Puntuación de la potencia de cálculo: 🟡)
Este es un punto sutil pero a menudo pasado por alto en la formación del mercado.
Los mercados de futuros se establecen para servir a los operadores de cobertura. Si existen alternativas con suficiente liquidez y riesgo de base insignificante, un contrato de futuros alternativo no tendría uso.
Un ejemplo de libro de texto es la falta de adopción de los futuros de combustible para aviones, porque el WTI y otros índices ascendentes ya satisfacían adecuadamente la demanda.
En el ámbito de la electricidad, los futuros basados en temperatura fracasaron porque los participantes del mercado encontraron que cubrir el resultado de la volatilidad de precios (electricidad) era más eficiente que cubrir su causa (temperatura).
Hoy, los proveedores de modelos cubren el riesgo de la potencia de cálculo mediante acuerdos de arrendamiento a largo plazo o empresas conjuntas, a menudo estructurados como acuerdos "take-or-pay" (toma o paga), intercambiando exposición al riesgo de precio spot por riesgo de contraparte.
Los hiperescaladores de la nube a menudo poseen físicamente las GPU que despliegan.
Por otro lado, los proveedores de larga cola carecen tanto del poder de negociación contractual para obtener términos de arrendamiento favorables como del capital para construir su propia infraestructura verticalizada, por lo que soportan directamente el impacto de la volatilidad del mercado spot.
Desde una perspectiva de mercado, no existen alternativas; sin embargo, los participantes que controlan la oferta pueden cubrirse internamente mediante integración vertical.
Juicio integrado
Considerando el cuadro de mando integral, puede que sea demasiado pronto para que la potencia de cálculo sostenga un mercado de futuros robusto.
Este mercado tiene la volatilidad para atraer especuladores y la infraestructura de liquidación temprana para apoyar transacciones, pero carece de la fragmentación de la oferta y la estandarización necesarias para un verdadero descubrimiento de precios a gran escala.
La mayoría de las transacciones ocurren en el mercado OTC.
Los corredores están construyendo fuentes de precios, Ornn y Silicon Data están publicando índices, las transacciones en chats grupales se están formalizando en plantillas de contratos.
Esto no es insignificante, pero aún no es un mercado consolidado como el WTI o PJM. El volumen es demasiado pequeño, los contratos demasiado personalizados y la oferta demasiado concentrada para que la infraestructura existente pueda liquidar a gran escala.
La forma correcta de interpretar este marco es como una herramienta de diagnóstico, no una conclusión final. Nos dice lo que falta, no lo que es imposible.
Misterios por resolver
El mercado se desarrollará de formas que aún no podemos determinar.
Tenemos muchos misterios sin resolver y algunas hipótesis iniciales. Estas hipótesis son tentativas y requieren mayor validación o refutación. A continuación, exponemos los argumentos más sólidos a favor de estas hipótesis.
▍¿El lado de la oferta del mercado se fragmentará o concentrará más en los próximos 1-2 años?
Esperamos una fragmentación moderada.
Los nuevos proveedores de nube están activando nueva capacidad más rápido que cualquier otra categoría.
A medida que la energía se convierte en la principal restricción, se están habilitando nuevas regiones, lo que beneficia a los operadores que pueden establecer capacidad cerca de energía barata (en lugar de cerca de la huella existente de los hiperescaladores).
Incluso las empresas Fortune 2000 están soportando centros de datos a pequeña escala. La expansión en este ámbito parece inevitable.
Sin embargo, el modelo de negocio estándar depende de contratos a gran escala y largo plazo con contrapartes confiables (como hiperescaladores y laboratorios de vanguardia).
Los proveedores de servicios de intermediación en la nube como Hyperbolic y SF compute van en contra de esta corriente, ofreciendo capacidad por hora.
Estas empresas atienden las necesidades de potencia de cálculo de larga cola de startups nativas de IA, empresas de capa de aplicación que ejecutan inferencia en pesos de código abierto y laboratorios de investigación sin presupuesto de vanguardia.
Creemos que la adopción de pesos de código abierto, en particular, conducirá a una mayor fragmentación de la capacidad de cálculo, ya que la oferta se "desverticalizará" de los laboratorios de vanguardia y los hiperescaladores.
▍¿Cómo se desarrollará la estandarización?
Los proveedores de índices están estableciendo estándares en torno al costo por hora de instancias de GPU.
Estas fuentes de datos representan estimaciones aproximadas, no precios exactos.
Los precios de las instancias varían según muchos factores, incluidos la región, la configuración del sistema y la duración, lo que dificulta la estandarización del precio.
La diferenciación en la configuración del sistema es particularmente notable, resultado de que los centros de datos se adaptan a cargas de trabajo personalizadas y los hiperescaladores optimizan para el bloqueo del ecosistema, no para la unificación del mercado.
Los estándares surgen cuando existe una demanda de mercado unificada.
El estándar WTI fue adoptado porque servía a una amplia gama de productos refinados descendentes como gasolina, diésel y combustible para aviones.
Hoy, la demanda de potencia de cálculo está impulsada por cargas de trabajo de entrenamiento e inferencia de IA.
La infraestructura de entrenamiento es personalizada, optimizada para tareas largas y de uso intensivo de computación en instalaciones grandes y centralizadas, lo que hace que las instancias de potencia de cálculo subyacentes sean casi infungibles.
Por otro lado, la infraestructura de inferencia requiere especificaciones de hardware más simples y menos consumo de energía; está optimizada para la latencia, lo que significa que la infraestructura se distribuye entre regiones en lugar de estar desplegada en el mismo sitio.
La inferencia es homogénea y se espera que represente más del 65% de la demanda de potencia de cálculo de IA para 2029. Suponemos que la optimización a nivel de infraestructura de potencia de cálculo para servir a este mercado conducirá a una convergencia en los requisitos de potencia de cálculo entre proveedores.
Si persisten las diferencias a nivel de instancias de chips, otras vías de estandarización podrían ser las pruebas comparativas a nivel de hardware.
NVIDIA creó el benchmark MLPerf para calificar el rendimiento de inferencia y entrenamiento en varias arquitecturas de modelos.
Bajo esta concepción, las instancias de GPU se negocian no por sus especificaciones de hardware, sino por la calidad y eficiencia de su salida.
▍¿Qué podría impedir la aparición de un estándar en los próximos 1-2 años?
Creemos que los "jardines amurallados" y las cargas de trabajo personalizadas sofocarán los intentos de estandarización.
En los próximos 1-2 años, los hiperescaladores y los laboratorios de vanguardia trabajarán para mantener su dominio en infraestructura de IA y provisión de modelos.
Si los dos no se desacoplan, mantendrán hardware según sus propias necesidades, que difieren entre empresas. La adopción de nuevas arquitecturas de chips fragmentará aún más las especificaciones de hardware, dificultando la creación de estándares.
▍¿Cómo obtendrán los pesos de código abierto una adopción significativa?
Esta es la ruta más fácil para la formación del mercado de potencia de cálculo.
Los dos principales cuellos de botella que enfrentan estos mercados hoy son la concentración de la oferta y la falta de estandarización.
La adopción generalizada de pesos de código abierto democratiza la capacidad de ejecutar inferencia.
Esto, a su vez, crea incentivos para la formación de operadores independientes y fomenta la optimización de infraestructura adaptada a estos modelos específicos.
Vimos la misma historia en la minería de Bitcoin: el software de código abierto dio lugar a numerosos mineros e impulsó la estandarización en torno a la configuración del hardware.
Hasta ahora, los pesos de código abierto se han quedado atrás en rendimiento frente a los modelos de pesos cerrados.
Pero si esta tendencia continúa, los pesos de código abierto pronto alcanzarán los umbrales de rendimiento que vemos hoy en los modelos cerrados.
Las empresas ya han comenzado a integrar ampliamente modelos cerrados en sus sistemas y han visto grandes aumentos en la productividad. En tres meses, un modelo igualmente capaz de aumentar la productividad podría costar una fracción del precio actual.
Sin embargo, la mayoría de las empresas probablemente seguirán prefiriendo el modelo con el mejor rendimiento.
Creemos que llegará un día en que los modelos cerrados de vanguardia serán demasiado costosos para las tareas que realizan, y las empresas optimizarán su asignación de inteligencia entre diferentes modelos.
Es importante recordar que los laboratorios de vanguardia actualmente ofrecen inferencia con pérdidas y eventualmente tendrán que subir los precios para mantenerse. Entonces, los pesos de código abierto tendrán su momento.
▍¿Cuál será la unidad de cotización final que se negocie?
La potencia de cálculo se puede desglosar aproximadamente en tres capas: chips, hora de instancia de chip, Token.
Capa de chips – La oferta está altamente concentrada.
ASML monopoliza las máquinas de fotolitografía que usa TSMC, TSMC monopoliza las fundiciones de chips que usa NVIDIA, y NVIDIA monopoliza el diseño de chips de vanguardia.
Además, los chips solo son útiles si están conectados a una fuente de energía y mantienen un alto tiempo de actividad. Esto nos lleva a creer que un chip individual y entregable no será la unidad de cotización final.
Capa de hora de instancia de chip – Se refiere al período de tiempo en el que un chip puede ser utilizado realmente.
Este es quizás el estado más valioso de un chip y la capa central discutida en este artículo.
En esta capa, la potencia de cálculo se comportaría como una mercancía similar a la electricidad, siempre que exista suficiente demanda en torno a los recursos de cálculo.
Imaginamos que la potencia de cálculo se negociará de manera similar a la electricidad y otros servicios públicos: estandarizada en contratos regionales (la potencia de cálculo es función de la electricidad), con mercados spot y de futuros superpuestos para cobertura. En el formato "hora de instancia de chip", esto es factible.
Capa de Token – Es el producto derivado de la instancia de potencia de cálculo y también podría convertirse en la unidad de cotización final.
Si los Tokens son el principal impulsor de las instancias de potencia de cálculo, entonces los mercados de Tokens proporcionarían una forma para que la demanda cubra sus costos y permitirían que la oferta bloquee ingresos.
El lado de la oferta podría cubrir sus costos a través de contratos continuos a largo plazo o integración vertical, manteniendo la concentración.
Sin embargo, los Tokens no son uniformes entre modelos. Cada modelo tiene su propio estándar de tokenización de texto y produce resultados diferentes, lo que los hace no completamente intercambiables entre casos de uso. Aun así, estamos siguiendo de cerca los desarrollos en este ámbito.







