Cuando el Token es más caro que el hombre, la «narrativa de la IA» se encuentra en problemas

marsbitPublicado a 2026-05-29Actualizado a 2026-05-29

Resumen

Los gastos empresariales en IA enfrentan un desafío fundamental: el costo creciente de los tokens no se traduce en un valor comercial cuantificable. Ejecutivos como Andrew Macdonald de Uber han expresado su alarma por la falta de correlación entre el consumo de tokens y mejoras reales en los productos, un fenómeno denominado "tokenmaxxing". Casos como el de Microsoft, que redujo licencias de Claude Code por costos insostenibles, y el cambio de GitHub Copilot a un modelo de pago por uso, refuerzan esta preocupación. Datos revelan que por cada dólar gastado en tokens de IA, solo 18 centavos generan valor para el usuario final, mientras gran parte se destina a corregir errores y retrabajos. Paralelamente, los precios de los tokens han subido aproximadamente un 65% desde febrero. Existen dos visiones contrapuestas. Los optimistas, como analistas de Goldman Sachs, ven esto como un dolor transitorio y prevén un gran crecimiento futuro, con un cambio hacia métricas más sólidas. Los pesimistas, liderados por Jim Covello de la misma firma, argumentan que la cadena de valor actual es insostenible, beneficiando principalmente a los fabricantes de semiconductores como Nvidia, mientras las grandes tecnológicas aumentan su deuda. Un problema estructural subyacente es el ciclo financiero entre los gigantes de la nube (hyperscalers) y los laboratorios de IA como OpenAI y Anthropic. Grandes compromisos de gasto en la nube están vinculados a estas startups, creando un circuito donde la inve...

Escrito por: Bao Yilong

Fuente: Wall Street Insights

La racionalidad del gasto empresarial en IA está siendo sometida a una prueba rigurosa. El consumo de Tokens continúa aumentando, pero el valor comercial cuantificable es difícil de encontrar.

El 22 de mayo, Andrew Macdonald, director de operaciones de Uber, con una capitalización de mercado de más de 200.000 millones de dólares, declaró públicamente en un podcast que entre el crecimiento del consumo de unidades léxicas (Tokens) y la mejora sustancial del producto, "esa línea aún no existe".

Macdonald señaló que a las empresas les resulta cada vez más difícil justificar el aumento continuo del gasto en IA. Incluso acuñó un término para el fenómeno de despilfarro dentro de los equipos de ingeniería: "tokenmaxxing" (maximización de Tokens).

A mediados de mayo, Microsoft comenzó a reducir las licencias internas de Claude Code, argumentando que la facturación basada en Tokens era "insostenible".

La superposición de estos dos eventos obliga al mercado a afrontar una variable que antes se pasaba por alto. La economía de los Tokens, es decir, la economía unitaria del consumo de Tokens a escala empresarial, ha pasado de ser un tema marginal a convertirse en el pilar central de toda la tesis de inversión en IA.

Cinco conjuntos de datos componen un nuevo panorama

Desde abril, varios conjuntos de datos han aterrizado sucesivamente, delineando juntos una imagen alarmante.

En abril de este año, el director de tecnología de Uber declaró públicamente que la empresa había agotado su presupuesto anual para Claude Code en cuatro meses.

Entre 5000 ingenieros, la tasa de uso mensual oscilaba entre el 84% y el 95%, con facturas mensuales por persona que iban desde 150 hasta 2000 dólares. Se informó que el propio director de tecnología consumió Tokens por valor de 1200 dólares durante una demostración interna de dos horas.

Macdonald describió que al conocer esta cifra "literalmente se quedó sin palabras por la conmoción".

Respecto a Microsoft, según el boletín Notepad de Tom Warren de The Verge, Claude Code se volvió rápidamente popular entre los ingenieros internos de Microsoft, pero el modelo de facturación basado en Tokens hacía insostenible el gasto a escala, por lo que Microsoft procedió a reducir las licencias correspondientes.

GitHub anunció que a partir del 1 de junio, todos los planes de Copilot pasarían de una suscripción fija a un modelo de pago por uso.

La publicación oficial de discusión recibió cerca de 900 votos negativos, ya que según cálculos de usuarios, una sesión típica de programación con agentes consume de 30 a 40 dólares, lo que significa que un plan mensual de 10 dólares se agotaba en un solo uso.

La plataforma de productividad para desarrolladores Entelligence.AI, tras recopilar datos de 2444 empresas, descubrió que:

  • Por cada dólar invertido en costes de Tokens de IA, solo 18 centavos generaban valor real que llegaba a los usuarios.
  • 44 centavos se destinaban a corregir errores introducidos por la propia IA; 27 centavos fluían hacia retrabajos; 11 centavos se consumían en fricciones de revisión.

Según el Índice de Gasto en Tokens LLM Silicon Data de Bloomberg, el precio de los Tokens ha subido aproximadamente un 65% desde finales de febrero, y el precio del software de IA en Estados Unidos ha acumulado un aumento del 20% al 37% en el último año.

El debate bajistas vs. alcistas: un mismo hecho, dos interpretaciones

Los mismos datos, bajo diferentes marcos analíticos, apuntan a conclusiones diametralmente opuestas.

La visión alcista sostiene que el actual caos no es más que los dolores de parto de una transición exitosa.

Según el análisis de Jim Schneider de Goldman Sachs a principios de mayo, para 2030, la IA de tipo agente impulsará un crecimiento de 24 veces en el consumo de unidades léxicas, alcanzando unos 120 trillones de billones de Tokens por mes, y los márgenes brutos de los hiperescaladores de la nube y los proveedores de modelos se volverán positivos en los próximos 3 a 12 meses.

Rich Privorotsky, también de Goldman Sachs, cree que el primer trimestre de 2026 quizás marcó el pico del "tokenmaxxing" como KPI, y que la industria está pasando de perseguir el volumen de consumo a una métrica más saludable: el "coste por acción efectiva unitaria".

La investigación económica de J.P. Morgan también encontró que a principios de 2026 hubo un salto en los paquetes nuevos y actualizados de Python en PyPI, una tendencia que no se dio con el lanzamiento de ChatGPT en 2022, lo que indica que está ocurriendo una mejora real de la productividad.

Además, las 7 grandes tecnológicas (Mag 7) cotizan actualmente a unas 20 veces las ganancias futuras, muy por debajo de las 52 veces en el pico de la burbuja tecnológica del 2000, las 67 veces en Japón en 1989 y las 34 veces en la era de las "Nifty Fifty". Según los estándares de burbujas históricas, la situación actual no constituye una burbuja.

La visión bajista fue expuesta de manera más sistemática por Jim Covello, analista de semiconductores de Goldman Sachs, en un informe de abril.

Señaló que casi todo el valor en la cadena de suministro de IA fluye hacia las empresas de semiconductores, un fenómeno sin precedentes e insostenible históricamente. Las empresas de chips deberían beneficiarse cuando lo hacen sus clientes, pero en este ciclo, su prosperidad se produce a costa del consumo de toda la cadena de suministro aguas arriba.

El beneficio neto de Nvidia ha crecido aproximadamente 20 veces desde el lanzamiento de ChatGPT; los principales hiperescaladores de la nube han agotado su flujo de caja operativo y ahora recurren a la deuda: en 2025, la emisión de deuda relacionada con centros de datos fue de unos 182.000 millones de dólares, el doble que en 2024.

Un estudio del MIT Nanda muestra que el 95% de las empresas que invierten en IA generativa tienen un retorno cero. Este desacoplamiento quizás pueda mantenerse por un tiempo, pero no para siempre.

La preocupación por la estructura de financiación circular

Este debate también involucra un nivel más complejo: el ciclo financiero entre los hiperescaladores de la nube y los laboratorios de IA.

Según documentos empresariales recopilados por The Information, OpenAI y Anthropic representan conjuntamente más de la mitad de los aproximadamente 2 billones de dólares en compromisos futuros de servicios en la nube de Microsoft, Oracle, Google y Amazon. En concreto:

  • De los 627.000 millones de dólares de pedidos pendientes de servicios en la nube de Microsoft, 280.000 millones están vinculados a OpenAI;
  • De los 553.000 millones de dólares de cartera de Oracle, el 54% (unos 300.000 millones) son compromisos de OpenAI;
  • De los 467.600 millones de Google, Anthropic representa el 43% (unos 200.000 millones);
  • La exposición correspondiente de Amazon también alcanza el 51% de sus 464.000 millones pendientes.

Esta estructura de financiación tiene un carácter cíclico endógeno. La inversión de 13.000 millones de dólares de Microsoft en OpenAI se materializó principalmente en forma de créditos de Azure, que OpenAI utiliza para comprar capacidad de cálculo en Azure, y Microsoft posteriormente los contabiliza como ingresos en la nube.

Los mismos hiperescaladores son tanto inversores de capital en los laboratorios de IA como proveedores de servicios que cobran facturas por capacidad de cálculo.

Esta estructura también se refleja en los datos de beneficios. Alphabet anunció un beneficio récord de 62.600 millones de dólares en el primer trimestre, de los cuales unos 28.700 millones, casi la mitad, procedían de la revalorización contable de su participación en Anthropic.

De los 30.300 millones de dólares de beneficio del primer trimestre de Amazon, 16.800 millones fueron ganancias no realizadas antes de impuestos por Anthropic, mientras que su flujo de caja libre se desplomó un 95%, hasta 1.200 millones de dólares, debido a unos gastos de capital en centros de datos de 44.200 millones de dólares en el mismo periodo.

La sostenibilidad de este sistema depende de la capacidad de los laboratorios de IA para seguir obteniendo financiación externa para cumplir sus compromisos de computación en la nube, lo que a su vez depende de que los clientes empresariales estén dispuestos a seguir pagando facturas de Tokens cada vez mayores.

Según los informes, Anthropic actualmente incurre en un coste de 3 dólares por cada dólar de ingresos. Una vez que el ritmo de financiación se ralentice, la credibilidad de las previsiones de ingresos en la nube disminuirá, y los múltiplos de valoración de los hiperescaladores también se enfrentarán a presiones de revaloración.

Esta cadena se transmite en ambas direcciones y también puede romperse en ambas direcciones.

Esto no es 1999, pero el problema es real

La situación actual no constituye un escenario típico de burbuja.

En términos de múltiplos de valoración, las Siete Grandes Tecnológicas cotizan actualmente a unas 20 veces las ganancias futuras, muy por debajo de los niveles de 52 veces en el pico de la burbuja tecnológica del 2000, 67 veces en el mercado japonés de 1989 o 34 veces en la era de las "Nifty Fifty".

La tecnología de IA en sí misma es real. Para los grupos de usuarios intensivos, los datos de mejora de la productividad también son verificables. OpenAI tiene unos ingresos anualizados de unos 20.000 millones de dólares, Anthropic de unos 4.300 millones, y estos dos laboratorios no van a desaparecer.

Hoy, el coste del Token (gasto en capacidad de cálculo) se ha convertido en el factor clave que determina el éxito o el fracaso de la IA, mientras que hace seis meses, ni siquiera se hablaba mucho de este tema.

En aquel entonces solo se preguntaban "¿funciona la tecnología?". Ahora la respuesta es clara: para trabajos específicos y para personas específicas, la tecnología sí funciona.

Pero surge un nuevo problema: ¿el dinero que las empresas aguas abajo ahorran usando IA puede transmitirse a tiempo aguas arriba, superando la ventana de valoración que el mercado de capitales deja a los laboratorios de IA y a los gigantes de la nube?

Los optimistas de la IA creen que, a medida que la tecnología siga madurando, el ROI (retorno de la inversión) de las empresas puede volverse positivo en un plazo de 1 a 1,5 años.

Los pesimistas, en cambio, creen que más ejecutivos, como Macdonald, se quejarán públicamente de la baja relación coste-beneficio de la IA y comenzarán a recortar presupuestos.

Ambas posibilidades están ocurriendo, y el resultado está por decidirse. Lo único seguro es que la mentira de que "mientras el consumo de Tokens aumente, la transformación de la IA es un éxito" ha quedado desmontada.

Un gran consumo de unidades léxicas no equivale a valor comercial, y estas dos burbujas tarde o temprano tienen que desinflarse. La factura de la IA ha llegado, pero ¿quién la pagará al final? Por ahora, sigue siendo una incógnita.

Preguntas relacionadas

Q¿Qué problema central señala el artículo sobre la adopción de IA en las empresas?

AEl artículo señala que el gasto empresarial en IA está siendo cuestionado, ya que el consumo de 'tokens' sigue aumentando sin que se encuentre un valor comercial cuantificable claro. La economía de los tokens, o la eficiencia de su consumo a escala empresarial, se ha convertido en un pilar fundamental para justificar la inversión en IA.

Q¿Qué ejemplos concretos menciona el artículo para ilustrar la preocupación por los costos de los tokens?

AEl artículo menciona el caso de Uber, cuyo Director de Operaciones declaró que es difícil justificar el aumento del gasto en IA, acuñando incluso el término 'tokenmaxxing'. También cita a Microsoft, que redujo las licencias internas de Claude Code debido a que su facturación basada en tokens era insostenible, y a GitHub, que cambió su modelo de tarificación de Copilot a un sistema de pago por uso, lo que generó protestas por los altos costos.

QSegún los datos presentados, ¿qué porcentaje del gasto en tokens de IA genera valor real para el usuario final?

ASegún datos de la plataforma Entelligence.AI, por cada dólar gastado en tokens de IA, solo 18 centavos generan valor real que llega al usuario. El resto se destina a corregir errores introducidos por la IA (44 centavos), retrabajo (27 centavos) y fricciones en el proceso de revisión (11 centavos).

Q¿Cómo describe el artículo la relación financiera cíclica entre los grandes proveedores de nube (hyperscalers) y los laboratorios de IA?

AEl artículo describe una estructura de financiación cíclica. Los hyperscalers (como Microsoft, Google) son inversores en los laboratorios de IA (como OpenAI, Anthropic) y también sus proveedores de computación en la nube. Las inversiones se pagan a menudo en créditos de nube, que los laboratorios usan para generar costos en la misma nube, contabilizándose como ingresos para el hyperscaler. La sostenibilidad de este ciclo depende de que los laboratorios sigan recibiendo financiación externa para pagar las facturas de la nube.

Q¿Cuál es, según el artículo, la principal incógnita sobre el futuro económico de la IA en este momento?

ALa principal incógnita es si el dinero que ahorran las empresas mediante el uso de la IA puede transmitirse con suficiente rapidez a lo largo de la cadena de valor para cubrir los costos de los tokens y justificar las valoraciones de los laboratorios de IA y los hyperscalers, antes de que se cierre la 'ventana de valoración' que ofrece el mercado de capitales. En otras palabras, quién pagará finalmente la factura de la IA y si la rentabilidad de la inversión (ROI) se materializará a tiempo.

Lecturas Relacionadas

¿Por qué más agentes de IA no equivalen a mayor productividad?

**Resumen: Por qué más agentes de IA no equivalen a mayor productividad** Cuando los agentes de IA se vuelven más baratos y fáciles de ejecutar, el desarrollo de software enfrenta un nuevo desafío: el cuello de botella ya no es lanzar más agentes, sino la capacidad humana de gestionar, evaluar e integrar sus resultados. Este artículo introduce el concepto de "impuesto de orquestación". Iniciar un agente es barato (un prompt o un clic), pero cerrar el ciclo es costoso: verificar resultados, entender su impacto arquitectónico, resolver conflictos entre agentes y decidir qué código integrar. Este trabajo no se puede paralelizar; depende de un recurso en serie: el juicio humano. El desarrollador es el "GIL" (Cerradura Global del Intérprete) del sistema de agentes: el candido de un solo hilo que limita el rendimiento final. Múltiples agentes pueden ejecutarse concurrentemente, pero las fases de juicio arquitectónico, revisión de código y fusión de cambios deben pasar por la mente del desarrollador. Más agentes no siempre significan más producción; pueden solo alargar la cola de tareas pendientes de revisión, llevando a cambios de contexto más frecuentes y fatiga cognitiva. La sensación de eficiencia no equivale a productividad real. Un panel lleno de agentes en ejecución crea una ilusión de "alta producción", pero si el desarrollador no comprende, revisa e integra esos cambios, el sistema puede acumular deuda técnica y cognitiva. La discusión clave no es "cómo usar más agentes", sino "cómo rediseñar el flujo de trabajo en torno a la atención humana". La habilidad crucial es saber qué tareas delegar a la máquina para procesamiento en paralelo y cuáles reservar para el juicio humano, cuándo revisar por lotes y cuándo detener la orquestación para concentrarse en un problema central. La IA amplía la capacidad de concurrencia en la producción de software, pero la atención humana sigue siendo el recurso más escaso e irreplicable. Un flujo de trabajo maduro con agentes no consiste en asignar todas las tareas a la máquina, sino en diseñar cuidadosamente la arquitectura de la propia atención, como se haría con cualquier sistema de producción. La verdadera habilidad es diseñar el sistema respetando ese recurso en serie que no se puede clonar: tu atención.

marsbitHace 1 hora(s)

¿Por qué más agentes de IA no equivalen a mayor productividad?

marsbitHace 1 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

Tres años después: Revisando mis predicciones sobre ChatGPT en 2023 En marzo de 2023, tras el lanzamiento de ChatGPT, Wang Jianshuo hizo 20 predicciones intuitivas sobre la IA. Ahora, en mayo de 2026, un sistema con 41 agentes de IA las ha reevaluado con datos actuales. **Resultados clave:** * **Aciertos (dirección general):** La arquitectura RAG se convirtió en estándar para integrar conocimiento. La Interfaz de Usuario de Lenguaje (LUI) creó una nueva capa de interacción (ej. protocolo MCP). Surgieron redes de agentes autónomos que se comunican. China desarrolló modelos grandes útiles (ej. DeepSeek), cerrando la brecha técnica. Los LLM no tienen conciencia; el Test de Turing solo mide la apariencia. * **Errores/Matices:** La predicción de que GPT-4 tendría 100 billones de parámetros fue incorrecta (≈1.8B). Los LLM **sí** pueden hacer matemáticas complejas sin herramientas externas (ej. medallas IMO 2025). El valor no migró solo a la capa de aplicación; NVIDIA (capa de hardware) capturó gran parte. El contenido generado por IA no evade automáticamente los derechos de autor (multas multimillonarias). La IA personalizada crea, no reduce, "cámaras de eco". Los costes de entrenamiento de modelos líderes superaron con creces la estimación de 5-10 mil millones de dólares. **Lecciones aprendidas:** 1. Predecir **mecanismos y direcciones** es más fiable que dar cifras o declaraciones absolutas. 2. Se tiende a **sobreestimar la velocidad** de cambio a corto plazo y **subestimar su magnitud** a largo plazo. 3. Los promedios generales (ej. "no habrá desempleo masivo") pueden ocultar **impactos distributivos** severos (ej. en jóvenes). 4. Las afirmaciones con **matices y limitaciones** envejecen mejor. 5. Tres años no son suficientes para resolver debates fundamentales (ej. valor final, consciencia de la IA). Este ejercicio subraya la dificultad de hacer predicciones precisas en un campo en rápida evolución y la importancia de la humildad al proyectar el futuro.

marsbitHace 7 hora(s)

Tres años después: Una revisión de mis predicciones sobre ChatGPT en 2023

marsbitHace 7 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

En marzo de 2023, Wang Jianshuo hizo veinte predicciones sobre ChatGPT. Tres años después, en 2026, un análisis con múltiples agentes de IA evalúa su precisión. Aciertos clave: predijo correctamente el auge de RAG como arquitectura estándar para conocimiento y reducir alucinaciones, la LUI (interfaz de lenguaje natural) como nueva capa de interacción (aunque no reemplaza a la GUI), y la aparición de redes de agentes autónomos con nuevos protocolos de direccionamiento. También acertó en que China desarrollaría modelos de IA útiles (como DeepSeek) cerrando rápidamente la brecha, y en que ChatGPT carece de consciencia real, pasando el test de Turing por mera apariencia. Otras predicciones válidas fueron que no causaría desempleo masivo (aunque afectó a jóvenes), que 2023 sería un gran año para startups de IA, y que el momento fue similar al del navegador web en 1994. Errores notables: su estimación de que GPT-4 tendría 100 billones de parámetros fue incorrecta (tuvo ~1.8 billones). Se equivocó al declarar que era "imposible" que los LLM hicieran matemáticas complejas sin herramientas, ya que luego ganaron medallas en la Olimpiada Internacional de Matemáticas. También erró al sugerir que el valor se capturaría en la capa de aplicación y no en la base, subestimando el dominio de NVIDIA (capa de hardware), y al pensar que el contenido generado por IA "evitaría" problemas de copyright, cuando han surgido multas históricas. Además, la idea de que los LLM promoverían un "consenso mundial" al promediar opiniones se volvió incorrecta, ya que ahora priorizan la personalización y pueden crear nuevas cámaras de eco. Conclusiones: Sus predicciones sobre mecanismos y direcciones fueron mayormente acertadas, pero falló en números específicos (costes, parámetros) y en subestimar la complejidad de la distribución del impacto (ej. quién gana o pierde con la IA). Tendió a ser demasiado optimista a corto plazo pero conservador sobre los límites a largo plazo. El ejercicio subraya la importancia de predecir tendencias en lugar de cifras exactas y de dejar margen para la incertidumbre.

链捕手Hace 10 hora(s)

Tres años después: Volviendo a mis juicios sobre ChatGPT en 2023

链捕手Hace 10 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar PEOPLE

¡Bienvenido a HTX.com! Hemos hecho que comprar ConstitutionDAO (PEOPLE) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar ConstitutionDAO (PEOPLE) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu ConstitutionDAO (PEOPLE)Después de comprar tu ConstitutionDAO (PEOPLE), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear ConstitutionDAO (PEOPLE)Tradear fácilmente con ConstitutionDAO (PEOPLE) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

726 Vistas totalesPublicado en 2024.12.12Actualizado en 2025.03.21

Cómo comprar PEOPLE

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de PEOPLE (PEOPLE).

活动图片