¿Cuánto de tu suscripción a Claude se destina realmente a las empresas de módulos ópticos?

marsbitPublicado a 2026-06-17Actualizado a 2026-06-17

Resumen

Breve resumen: Un gráfico que desglosa los 20 USD mensuales de Claude Pro en costes de modelo, computación en la nube, depreciación de GPU, electricidad y cadena de suministro está impulsando un debate entre inversores sobre cómo valorar los ingresos por IA. A diferencia del SaaS tradicional, donde el coste marginal por uso adicional es casi cero, cada consulta en un modelo de IA genera costes variables de inferencia (GPU, energía, ancho de banda). Esto cuestiona si los ingresos por suscripción a IA equivalen a ingresos SaaS de alto margen. Actualmente, el crecimiento del uso de IA beneficia de forma más directa y predecible a la infraestructura (nube, GPU, HBM, electricidad) que a las empresas de aplicaciones. Los defensores argumentan que la optimización de modelos, caché, chips propios y una mejor eficiencia reducirán los costes unitarios, permitiendo márgenes similares al software. Sin embargo, el reto es si esta reducción de costes superará el aumento del volumen y la complejidad de las tareas. Para justificar valoraciones elevadas, las empresas de IA deben demostrar que pueden mantener o mejorar la rentabilidad a medida que escala el uso, no solo el número de suscriptores.

TL;DR

Un gráfico que desglosa los aproximadamente 20 dólares mensuales de la suscripción Claude Pro en Estados Unidos para la empresa del modelo, la potencia de cómputo en la nube, la depreciación de las GPU, la electricidad y la cadena de suministro, está haciendo que los inversores vuelvan a debatir cómo valorar realmente los ingresos de las aplicaciones de IA.

Este gráfico no representa datos oficiales de distribución de ingresos de Anthropic, AWS o Nvidia, ni debe tomarse como un libro contable real de ninguna empresa. Su valor radica en plantear una pregunta más fundamental: ¿cuánto de la suscripción que pagan los usuarios por las aplicaciones de IA puede capitalizarse como margen bruto de software, tal y como ocurre en el SaaS tradicional?

La narrativa de valoración del SaaS tradicional es clara. Una vez desarrollado el software, el coste marginal de vender una licencia adicional suele ser bajo, y las empresas de software maduras suelen tener márgenes brutos superiores al 70% o incluso al 80%. Los inversores están dispuestos a asignar múltiplos elevados porque a medida que crecen los ingresos, la rentabilidad tiene margen para mejorar.

El problema de las aplicaciones de IA es que cada consulta, generación de código, análisis de archivo o llamada a un agente por parte del usuario consume en el fondo tiempo de GPU, electricidad, ancho de banda de memoria y recursos en la nube. En la superficie hay una cuota mensual fija, pero en el núcleo hay una cadena de costes variable según el uso. Los usuarios ligeros pueden ser muy rentables, pero para los usuarios intensivos que ejecutan tareas continuas dentro de sus límites de uso o paquetes de herramientas, los costes pueden aumentar rápidamente.

Por lo tanto, lo que el gráfico de desglose de los 20 dólares cuestiona no es cuántos dólares se lleva exactamente cada empresa, sino si "los ingresos por aplicaciones de IA son intrínsecamente equivalentes a los ingresos por SaaS". Para demostrar que merecen múltiplos elevados, las empresas de IA no solo tienen que demostrar que los usuarios están dispuestos a pagar, sino también que el margen bruto ponderado por el volumen de uso puede mejorar de forma sostenible.

Tras la tarifa de suscripción hay una cadena de costes de inferencia

La mayor diferencia entre una suscripción a IA y una suscripción de software normal es que el coste marginal de "usarla una vez" ya no es cercano a cero.

En el SaaS tradicional, cuando un equipo añade una licencia, el proveedor también incurre en costes de servidores, atención al cliente y ancho de banda, pero estos costes no suelen aumentar linealmente con cada clic. Lo realmente caro son el desarrollo previo, las ventas y la adquisición de clientes. Una vez que el producto se escala, una parte considerable de los nuevos ingresos puede retenerse.

Los productos de modelos grandes son diferentes. El usuario introduce una consulta y el modelo genera una respuesta. Este proceso se llama inferencia, es decir, el cálculo real cuando el usuario llama al modelo. El token es la unidad básica para medir el texto que lee y escribe el modelo. Cuanto más pregunte el usuario, más largo sea el contexto y más compleja sea la generación de contenido, más tokens y potencia de cálculo se consumirán.

Esto crea una contradicción entre la suscripción fija y los costes variables. La tarifa mensual de Claude Pro en Estados Unidos ronda los 20 dólares, pero el precio puede verse afectado por la región, los impuestos y los ajustes de Anthropic. Lo que el usuario ve es un precio fijo, pero la empresa del modelo se enfrenta a patrones de uso muy diferentes. Algunos solo redactan correos y buscan información, otros procesan documentos largos, ejecutan tareas de codificación o utilizan flujos de automatización más complejos.

El gráfico de desglose que circula en el mercado intenta concretar esto: de los 20 dólares, una parte se queda en la empresa del modelo, otra paga a los proveedores de nube y cómputo. El coste del cómputo incluye electricidad, operaciones, depreciación de las GPU. La compra de GPU fluye a su vez hacia Nvidia, TSMC, proveedores de HBM (memoria de gran ancho de banda), módulos ópticos, ODM y empresas relacionadas con la electricidad.

Aquí, la "depreciación de las GPU" puede entenderse como que las costosas GPU no amortizan su coste de una vez, sino que se distribuyen gradualmente en el servicio de IA según su vida útil, intensidad de uso o criterios contables. La distribución real se verá afectada por los límites del plan, la proporción de usuarios ligeros e intensivos, los precios de liquidación interna del proveedor en la nube, los descuentos por capacidad reservada, la utilización de las GPU y la vida útil de la depreciación. El coste medio tampoco es igual al coste marginal.

Lo que realmente deben vigilar los inversores es la tendencia: las empresas de aplicaciones de IA no pueden limitarse a informar del crecimiento de los ingresos, también deben responder si los costes de cómputo subyacentes crecen al mismo ritmo. Si el volumen de uso se expande más rápido que la mejora de la eficiencia del modelo, cuanto mayores sean los ingresos por suscripción, mayor puede ser la presión sobre el margen bruto. Solo si la mejora de la eficiencia es lo suficientemente rápida, las empresas de modelos tendrán la oportunidad de volver a acercarse a la estructura de beneficios de una empresa de software.

La infraestructura obtiene primero unos ingresos más seguros

En la fase actual, el crecimiento del uso de IA fluye más directamente hacia la infraestructura, sin capitalizarse completamente en la capa de aplicación.

Independientemente de que el usuario utilice el modelo en Claude, ChatGPT, Gemini o en agentes internos de la empresa, la inferencia acaba recayendo en la potencia de cómputo, la electricidad, la memoria y la red. En la capa de aplicación puede haber rotación de productos, pero el consumo de recursos subyacentes es más rígido. Mientras el uso de la IA siga aumentando, se impulsarán los gastos de capital en la nube, la compra de GPU, la demanda de HBM y el consumo eléctrico de los centros de datos.

Esta es también la razón por la que la cadena de infraestructura, incluidas empresas como Nvidia, TSMC y SK Hynix, sigue siendo revalorizada por el mercado. El margen bruto global de Nvidia se ha mantenido en niveles altos en los últimos años, siendo el margen bruto GAAP y no GAAP para el año fiscal 2026 aproximadamente del 71,1% y 71,3%, respectivamente, y las orientaciones para los trimestres siguientes también se mantienen altas. Cabe señalar que algunos trimestres pueden verse afectados por partidas específicas, y los informes públicos no siempre permiten desglosar directamente la verdadera estructura del margen bruto de los centros de datos de IA, pero el poder de fijación de precios de la infraestructura escasa ya se refleja en los resultados.

El HBM es un eslabón típico en esta cadena. No es una memoria normal, sino un componente clave en los aceleradores de IA que soporta el cálculo de alto rendimiento. A medida que aumentan el tamaño de los modelos, la longitud del contexto y la demanda de inferencia concurrente, los chips de IA dependen más de la memoria de gran ancho de banda. Las estimaciones de la cadena de suministro muestran que la proporción de HBM en el coste de los chips de IA de nueva generación está aumentando, y esta es también una razón importante por la que SK Hynix, Samsung y Micron han sido reevaluadas en el ciclo de la IA.

La electricidad y los centros de datos también han pasado de ser un coste de fondo a una línea de inversión principal. El consumo energético de una consulta de texto normal individual puede no ser excesivo, pero los agentes complejos, los contextos largos, la generación de código y las tareas de múltiples pasos amplifican el volumen de cálculo. Para los proveedores en la nube y los operadores de centros de datos, la clave no es cuánta energía consume una consulta concreta, sino que cuando se producen de forma continua solicitudes de inferencia masivas, la utilización del clúster, el precio de la electricidad, la refrigeración, la capacidad del centro de datos y el acceso a la red eléctrica se convierten en costes y cuellos de botella.

La ventaja del lado de la infraestructura es que la validación de los resultados es más rápida. Los gastos de capital en IA de los proveedores en la nube ya se han materializado, los ingresos y márgenes de Nvidia se reflejan en sus informes, y los pedidos y precios de los fabricantes de HBM también entrarán relativamente pronto en la cuenta de resultados. En la capa de aplicación de modelos, lo que se negocia principalmente son expectativas futuras: la conversión en suscripciones, la tasa de penetración empresarial, los ingresos por API y la liberación de beneficios una vez que la curva de costes futuros descienda.

La mejora de la eficiencia sigue siendo el argumento central de los alcistas

Los inversores en software y los alcistas en IA no carecen de argumentos en contra. El argumento central de la facción de la eficiencia es que el alto coste actual de la inferencia es solo un fenómeno de la fase inicial, y que la optimización de modelos, el almacenamiento en caché, los modelos pequeños, los chips propios y una mayor utilización de los clústeres reducirán continuamente el coste unitario. Si el coste desciende lo suficientemente rápido, las aplicaciones de IA aún podrían volver a la lógica de software de alto margen.

Este contraargumento tiene una base real. Algunos modelos principales ya han reducido significativamente su precio unitario manteniendo o mejorando sus capacidades. OpenAI ha revelado que el coste por token de GPT-4o mini se ha reducido un 99% en comparación con el antiguo text-davinci-003. El ritmo no es exactamente el mismo en todas las empresas; Anthropic se ha centrado recientemente más en las actualizaciones al mismo precio y en la estratificación de modelos, pero la dirección de la industria sigue siendo ofrecer una mayor capacidad a un coste menor.

Las empresas de modelos también tienen múltiples métodos para mejorar su economía unitaria. Las tareas sencillas se delegan a modelos pequeños, las consultas comunes se reutilizan mediante caché, y los contextos largos y las tareas complejas se delegan a modelos más potentes. Los proveedores en la nube, por su parte, reducen el coste unitario del cómputo mediante el desarrollo de chips propios y la planificación de clústeres. Google tiene los TPU, Microsoft ha lanzado Maia para inferencia, y Amazon también está avanzando con Trainium e Inferentia.

Si solo nos fijamos en el progreso tecnológico, el margen de beneficio de las aplicaciones de IA tiene realmente margen de mejora. Una inferencia más barata, un mejor enrutamiento de modelos y una mayor capacidad de compresión pueden hacer que la misma suscripción de 20 dólares soporte un mayor volumen de uso. Los usuarios ligeros, los planes empresariales de alto precio, la fijación de precios por capas de la API y límites de uso más estrictos también pueden mejorar la economía unitaria general.

La dificultad radica en que la reducción de costes no es la única variable. Las aplicaciones de IA están pasando del simple chat a cargas de trabajo más intensivas. Antes, los usuarios solo podían hacer preguntas y reformular textos, pero ahora cada vez hay más demanda de agentes de código, procesamiento de documentos largos, generación de vídeo y multimodal, y flujos de automatización empresarial. Estos escenarios tienen un valor mayor, pero también un consumo mayor. Cuanto más útil sea el modelo, más probable será que los usuarios le deleguen tareas más complejas y de mayor duración.

Así, el desacuerdo se vuelve más concreto: si la velocidad de descenso del coste de inferencia puede superar el crecimiento del volumen de uso y la complejidad de las tareas. Si el coste unitario desciende rápidamente, pero el consumo medio de los usuarios crece aún más rápido, el margen bruto ponderado de la empresa del modelo seguirá bajo presión. Por el contrario, si el enrutamiento de modelos, el almacenamiento en caché, los chips propios y la estratificación de precios son lo suficientemente eficaces, las suscripciones a IA podrían desprenderse gradualmente de su característica actual de alto coste.

El número de suscriptores no es igual al margen bruto

El gráfico de desglose de los 20 dólares no debe interpretarse como un resultado final. Es más bien un recordatorio de valoración en la fase actual: mientras el mercado no disponga de datos suficientemente transparentes sobre los márgenes brutos de las empresas de modelos, los inversores necesitan descontar la hipótesis de que "las aplicaciones de IA son intrínsecamente iguales al SaaS".

Para las empresas de modelos no cotizadas, como OpenAI y Anthropic, es difícil para los inversores externos ver sus libros de cuentas completos. Los materiales de financiación, las divulgaciones de los socios, la estructura de costes en la nube, los precios de los planes empresariales, la proporción de ingresos por API y las limitaciones de uso se convertirán en pistas para juzgar. Los datos realmente valiosos no son cuántos usuarios pagan, sino qué proporción son usuarios ligeros e intensivos, si los clientes empresariales están dispuestos a pagar precios más altos por un uso intensivo, si los costes de liquidación en la nube están disminuyendo y si la reducción del coste unitario de inferencia se está trasladando al margen bruto de la empresa.

La validación en la cadena de empresas cotizadas aparecerá más rápidamente en los informes de resultados. El margen bruto global de Nvidia y la tasa de crecimiento de los ingresos de su centro de datos, la demanda de procesos avanzados y ensamblaje de TSMC, los precios y márgenes de los fabricantes de HBM y la intensidad de los gastos de capital de los proveedores en la nube seguirán reflejando si el uso de la IA sigue trasladándose al lado de la infraestructura. Si estos indicadores se mantienen sólidos, mientras que la capa de aplicación de modelos carece de pruebas de mejora del margen bruto, el mercado seguirá dando a la infraestructura una prima de valoración más segura.

En última instancia, para que las empresas de modelos recuperen un ancla de valoración más alta, lo que tienen que demostrar no es solo que los usuarios están dispuestos a pagar 20 dólares, sino que, incluso después de un uso intensivo, estas tarifas de suscripción pueden dejar suficiente margen bruto. La próxima ronda de divergencia en la valoración probablemente no esté en las cifras destacadas de los ingresos recurrentes anuales (ARR), sino en si los costes de inferencia, las limitaciones de los planes y los precios de pago empresarial pueden funcionar simultáneamente.

Preguntas relacionadas

Q¿Qué diferencia clave hay entre el modelo de suscripción de una aplicación de IA tradicional y el de una empresa de SaaS tradicional?

ALa diferencia clave radica en el costo marginal por uso. En el SaaS tradicional, el costo de atender a un usuario adicional o una acción adicional suele ser cercano a cero, lo que permite altos márgenes brutos (70-80%). En las aplicaciones de IA, cada consulta del usuario (inferencia) consume recursos de GPU, energía y ancho de banda, generando un costo variable significativo que puede erosionar la rentabilidad, especialmente con usuarios intensivos.

QSegún el artículo, ¿por qué los inversores están reevaluando cómo valorar los ingresos por suscripción de aplicaciones de IA?

ALos inversores están reevaluando la valoración porque los ingresos por suscripción de IA no se traducen automáticamente en altos márgenes de beneficio como en el SaaS tradicional. Deben analizar si las empresas de IA pueden mejorar sosteniblemente su margen bruto ponderado por el uso, a medida que crece el volumen y la complejidad de las tareas, mientras gestionan la cadena de costos variables de la inferencia (GPU, electricidad, etc.).

Q¿Qué ventaja tienen actualmente las empresas de infraestructura (como NVIDIA o los proveedores de HBM) frente a las empresas de aplicaciones de IA en términos de flujos de ingresos?

ALas empresas de infraestructura tienen la ventaja de recibir flujos de ingresos más inmediatos y predecibles. El crecimiento en el uso de IA impulsa directamente la demanda de sus productos (GPUs, HBM, energía, capacidad de centros de datos), lo que se refleja rápidamente en sus estados financieros. Su modelo de negocio, a menudo con poder de fijación de precios, ofrece una validación de ganancias más tangible frente a las expectativas futuras en las que se comercia la capa de aplicaciones.

Q¿Cuál es el principal argumento de los inversores 'alcistas' o optimistas sobre la rentabilidad futura de las aplicaciones de IA?

AEl argumento central de los inversores optimistas es que la mejora de la eficiencia reducirá drásticamente el costo unitario de la inferencia. Factores como la optimización de modelos, el uso de caché, modelos más pequeños, chips personalizados y una mejor utilización de los clústeres permitirán que el costo por token disminuya más rápido de lo que aumenta el uso y la complejidad, permitiendo eventualmente que las aplicaciones de IA alcancen márgenes brutos altos similares a los del software.

Q¿Qué dato, según el artículo, es más importante que el simple número de suscriptores de pago para evaluar la salud financiera de una empresa de modelos de IA?

AMás importante que el número total de suscriptores es entender la composición de los usuarios (ligeros vs. intensivos), la disposición de los clientes empresariales a pagar precios premium por un uso alto, la evolución de los costos de inferencia por unidad y, fundamentalmente, si las mejoras en la eficiencia y la gestión de precios se traducen en una mejora demostrable del margen bruto de la empresa, superando la presión de los costos variables.

Lecturas Relacionadas

Los halcones del Fed se reagrupan: el difícil debut de Warsh

Funcionarios de la Reserva Federal, incluidos los más "dovish" como Christopher Waller, han cambiado su postura y ahora no descartan una subida de tipos, reflejando un giro general hacia posturas más "hawkish". El nuevo presidente, Kevin Warsh, quien fue nombrado por Trump por su postura partidaria de bajadas, se enfrenta a su primera reunión en un momento incómodo: la inflación se mantiene por encima del 3%, el mercado laboral es fuerte, y la discusión interna ya no es cuándo recortar, sino si es necesario subir los tipos. El cambio es notable en figuras como Waller, que pasó de abogar por recortes a admitir la posibilidad de subidas. Incluso miembros más centrados, como Lisa Cook, ahora condicionan su postura. Los "halcones" del comité, como Hammack, Logan y Kashkari, llevan tiempo argumentando en esta dirección y piden eliminar cualquier sesgo a la baja en la comunicación. Se espera que la Fed mantenga los tipos este miércoles, pero el enfoque estará en la eliminación del "sesgo a la baja" en su comunicado y en el "dot plot", que probablemente mostrará que la mayoría de los funcionarios prevén tipos estables o incluso alguna subida este año. Warsh, crítico con estas herramientas de orientación, debe dirigir este mensaje de posible endurecimiento, que va en contra de los deseos del presidente que lo nombró. La señal es clara: el próximo movimiento de la Fed podría ser una subida de tipos.

marsbitHace 1 hora(s)

Los halcones del Fed se reagrupan: el difícil debut de Warsh

marsbitHace 1 hora(s)

¿Quién es el rey de la relación calidad-precio en el "Yi Zhong Tian" de un billón de dólares de capitalización?

El artículo analiza y compara a las tres principales empresas chinas de módulos ópticos, apodadas "Yi Zhong Tian": XSGS (Nueva Yisheng), ZKXC (Zhongji Innolight) y TFC (Tianfu Communications). Tras un crecimiento exponencial en 2025, el mercado en junio de 2026 experimentó una corrección, planteando la pregunta sobre cuál ofrece mejor valor. Se evalúan con tres criterios: PEG (precio/crecimiento), calidad de ganancias y prima por certidumbre. * **XSGS** es la más barata en PEG (0.30) y tiene alta calidad de ganancias (márgenes >47%). Su descuento refleja riesgos como alta dependencia de clientes clave y exposición geopolítica. * **ZKXC** es la más cara, con una prima pagada por su **certidumbre** como líder. Controla más del 50% del mercado de módulos 800G para Nvidia y tiene ventaja en 1.6T. Su principal riesgo son las tensiones geopolíticas (lista 1260H de EE.UU.). * **TFC** es diferente: es proveedor de componentes (motores ópticos), no de módulos terminados. Tiene los márgenes más altos (>50%) y se beneficia de la transición a arquitecturas CPO/NPO. Sin embargo, su crecimiento es más estable, su valoración muy alta (~122x P/E) y su desempeño reciente decepcionó expectativas excesivas. El análisis concluye con una variable crítica: el verdadero poder y los márgenes más altos están **río arriba**, en los fabricantes de chips láser (como Lumentum, Coherent). El valor a largo plazo de "Yi Zhong Tian" dependerá de que la industria china pueda ascender en la cadena de valor y capturar esa parte de la ganancia, un esfuerzo simbolizado por empresas como YJTech (Yuanjie). La "relación calidad-precio" final no se mide solo en números, sino en la capacidad de controlar la tecnología central.

marsbitHace 1 hora(s)

¿Quién es el rey de la relación calidad-precio en el "Yi Zhong Tian" de un billón de dólares de capitalización?

marsbitHace 1 hora(s)

La 'Acidez' y la Búsqueda de Soluciones de la Cadena de la Industria Óptica Doméstica

En la carrera global de la IA, el chip de computación es el protagonista, pero la luz, un elemento más fundamental, está determinando silenciosamente el límite de la escala de los clústeres de IA. Los módulos ópticos actúan como la red de carreteras de alta velocidad para estos clústeres, traduciendo señales eléctricas y ópticas para que los datos fluyan entre miles de GPU. Para los módulos de gama alta (800G, 1.6T), el chip DSP es el componente clave que garantiza su funcionamiento estable. Dos gigantes estadounidenses, Marvell y Broadcom, dominan el mercado global de chips DSP de alta gama, controlando conjuntamente más del 90% del mercado. Empresas chinas líderes en módulos ópticos como Zhongji Innolight y Eoptolink dependen de sus chips para los productos que exportan a los grandes fabricantes de IA de América del Norte, lo que crea un riesgo potencial de interrupción del suministro. Esta dependencia es mutua. Más del 36% de los ingresos de Marvell provienen de China continental, y la cadena de suministro global de ambas empresas incluye componentes y ensamblaje chinos. A diferencia del cuasi monopolio del DSP, el mercado de chips láser de alta velocidad (EML) tiene múltiples proveedores, y el progreso de la sustitución nacional en este campo es más rápido. Para enfrentar los riesgos, la industria china debe: 1) diversificar la cadena de suministro y los mercados a corto plazo, 2) promover la adopción a gran escala de chips nacionales en el mercado interno, y 3) enfocarse en la I+D y sustitución nacional de DSP de alta velocidad a mediano y largo plazo. El desarrollo de nuevas tecnologías como la óptica en silicio y CPO también puede reducir la dependencia a largo plazo. En resumen, aunque existe una interdependencia, la industria china debe acelerar la innovación en componentes clave como el DSP para tomar realmente la iniciativa en el desarrollo de la cadena de la fotónica.

marsbitHace 1 hora(s)

La 'Acidez' y la Búsqueda de Soluciones de la Cadena de la Industria Óptica Doméstica

marsbitHace 1 hora(s)

Trading

Spot
Futuros
活动图片