Autor| Astronauta Yu
Los tokens son caros, y quemarlos duele.
Esta no es solo la opinión de quienes actualmente están obsesionados con el "Vibe Coding", incluso las grandes tecnológicas del Valle del Silicio, que antes promovían frenéticamente el "Tokenmaxxing", han comenzado a imponer límites de tokens a sus empleados.
Pero, de hecho, un punto contrario a la intuición es que los usuarios que actualmente utilizan suscripciones de IA están usando tokens que ya han sido subsidiados por las grandes compañías de IA, ¡con subsidios que pueden llegar a ser hasta 70 veces el costo de la suscripción!
Lo más preocupante es que OpenAI y Anthropic, los dos líderes de la IA, ya están en la fase de preparación para su OPI (Oferta Pública Inicial). Una vez que ambas empresas cotizen en bolsa,
¿seguirán el camino de las "guerras de subsidios" de la era de Internet, donde las empresas supervivientes empezaron a aumentar los precios, devolviendo el precio de los tokens a la racionalidad?
La buena noticia es que esto podría no suceder. Recientemente, Bill Maris, fundador de Google Ventures, planteó una pregunta en el podcast All-in:
Si Google decidiera reducir el precio de los tokens en otro 80%, ¿cómo responderían OpenAI y Anthropic?
No es el único caso. Poco antes, el equipo de la startup Agnes AI explicó en una transmisión en vivo con GeekPark la posible llegada de la "era de los tokens gratuitos".
Entonces, ¿el precio futuro de los tokens subirá o bajará? ¿Y qué significa esto para las personas ya adictas a la IA?
01 Los subsidios de tokens están en llamas
¿Por qué se dice que el precio actual de los tokens no es realmente caro?
Porque, al menos en las suscripciones de IA, los precios actuales de las empresas de IA ya son "precios con descuento" tras los subsidios.
Recientemente, SemiAnalysis evaluó en detalle la comparación entre el valor real de los tokens consumidos en los modelos de suscripción de OpenAI y Anthropic y la tarifa de suscripción.
SemiAnalysis hizo algo simple pero efectivo: usar la IA en varios planes de suscripción para completar tareas reales y luego calcular cuánto valdrían esos tokens usando los precios públicos de la API. Los resultados fueron los siguientes:
Observa una regla: cuanto más caro es el plan, mayor es el múltiplo del subsidio. Esto en sí mismo indica que estos planes premium no buscan generar ganancias; son una forma de "precios inversos", utilizando las pérdidas más agresivas para retener a los usuarios más intensivos. Porque los usuarios intensivos son desarrolladores y tomadores de decisiones empresariales; una vez que se vinculan a una plataforma, arrastran consigo a todo su equipo y su línea de productos.
Perdiendo tanto, ¿por qué hacerlo? La respuesta estándar es: primero quemar dinero para ganar escala, y luego subir los precios para recuperarse una vez alcanzada la escala. Así funcionó Internet móvil: Didi y Uber subsidiaron cientos de miles de millones de yuanes en viajes, y las tarifas subieron después de los subsidios; Meituan subsidió innumerables entregas de comida, y las tarifas de envío subieron después. Este lógica tiene una premisa clave: el efecto de bloqueo se estableció durante el período de subsidios.
Didi pudo subir precios porque los conductores no podían prescindir del flujo de pedidos en la plataforma, y los pasajeros no podían prescindir de los conductores. Meituan pudo subir precios porque los comerciantes no podían prescindir de su tráfico y red de reparto. Al finalizar los subsidios, los usuarios ya estaban "bloqueados" en el ecosistema, con costos de cambio extremadamente altos.
Pero la batalla de la IA tiene una diferencia fundamental con Internet: el token casi no tiene efecto de bloqueo.
Si Claude subiera los precios, los desarrolladores podrían migrar las llamadas API a GPT o Gemini en un día: las interfaces de cada uno se están estandarizando cada vez más, y muchos marcos de desarrollo incluso tienen funciones integradas para cambiar entre múltiples modelos. Para el usuario común es aún más simple: solo cambiar de URL. La IA no tiene una red local de conductores como los viajes compartidos, ni un sistema de reparto como la comida a domicilio, ni una cadena de relaciones sociales como las redes sociales. Un token es un token, sin importar quién lo produzca, todos son lo mismo.
Esto significa que una vez que los subsidios se detengan, los usuarios pueden desaparecer en un instante. Los subsidios no están "construyendo barreras", sino que se asemejan más a "mantener el pulso"—siempre que alguien ofrezca un precio más bajo, los usuarios se irán.
Y esto sin contar una nueva variable que está descontrolando la factura de todos: el Agente de IA.
Cuando chateas con ChatGPT, una conversación consume quizás unos miles de tokens. Pero cuando le pides a un Agente de IA que ejecute una tarea compleja—escribir un código y depurarlo automáticamente, analizar un documento de decenas de páginas y generar un informe—el consumo de tokens en una sesión puede ser de 5 a 30 veces mayor que una conversación normal. Un desarrollador midió que, en el plan Claude Max de 100 dólares, una sola sesión de programación con Agente puede consumir tokens por valor de casi cien dólares. El CTO de Uber reveló recientemente que la empresa agotó todo su presupuesto de IA para 2026 en solo cuatro meses.
La pregunta es: ¿puede continuar esta guerra de subsidios de tokens? ¿Quién podría ser el que quede en pie después de la batalla?
Bill Maris cree que la respuesta obviamente son los gigantes tradicionales.
02 Token como arma
Para entender la verdadera brutalidad de esta guerra de subsidios, primero hay que ver una asimetría estructural: los participantes obtienen su "munición" de fuentes completamente diferentes.
Google obtiene más de 300 mil millones de dólares anuales en ingresos por publicidad. Este no es dinero de inversionistas, no es capital de financiación para quemar, es una máquina impresora de dinero que funciona automáticamente todos los días. Miles de millones de personas en todo el mundo abren su motor de búsqueda, ven YouTube, usan Gmail, y el dinero de la publicidad fluye automáticamente a su cuenta. No necesita hacer presentaciones, no necesita complacer a los analistas, no necesita explicar a nadie por qué gasta ese dinero.
Google usa las ganancias de publicidad para subsidiar tokens de IA, como si alguien que posee un pozo de petróleo libra una guerra de precios en una estación de servicio: su petróleo sale de su propio terreno, mientras que el petróleo de su competidor lo compra con un préstamo bancario.
OpenAI y Anthropic son aquellos que compran petróleo con préstamos.
OpenAI ha recaudado más de 180 mil millones de dólares en financiación acumulada, con una valoración más reciente que supera los 850 mil millones. Anthropic ha recaudado más de 130 mil millones. Este dinero proviene de capital de riesgo e inversionistas estratégicos, quienes no dan dinero por caridad; esperan que estas empresas salgan a bolsa y obtengan un retorno lucrativo al momento de su salida.
Y después de la salida a bolsa, es cuando comienzan los verdaderos problemas. Cotizar en bolsa significa que los estados financieros son públicos para todo el mundo. Cada trimestre, los analistas de Wall Street observan los ingresos, ganancias, costo de adquisición de usuarios, costos marginales. Cuando calculan que por cada dólar de tarifa de suscripción que recibes, en realidad pierdes 70 dólares, ninguna historia de crecimiento, por gloriosa que sea, podrá sostener el precio de las acciones.
Bill Maris lo expuso claramente en el podcast. Sus palabras exactas fueron: "Si yo fuera Google y decidiera cortar arbitrariamente el precio de los tokens en un 80%, ¿qué pasaría con el modelo de negocio de OpenAI y Anthropic?"
El anfitrión preguntó qué probabilidad había. Maris no dudó: "100%. Capital como arma, tokens como arma."
Esta no es una especulación de un analista. Bill Maris es el fundador y CEO de Google Ventures, también fue Vicepresidente de Proyectos Especiales de Google y ayudó a incubar Waymo y Google X. Todos los presentes entendieron: esto no es una hipótesis, esto es algo que él ha visto personalmente hacer a Google.
El escenario que describe es simple: Google anuncia una reducción del 80% en el precio de la API de Gemini. ¿Qué harían los clientes empresariales? Si la calidad del producto es similar—en muchas pruebas de referencia Gemini ya es comparable a Claude y GPT—pero el precio es cuatro quintas partes más barato, ¿seguirías usando el más caro?
Maris mismo da la respuesta: "Si eres una empresa y puedes pagar un 80% menos en Google y Gemini por un producto básicamente idéntico, ¿por qué no lo harías? Entonces la presión sobre esas empresas se volvería muy severa."
Y OpenAI y Anthropic tienen pocos medios de respuesta simétricos. No pueden seguir bajando precios—no tienen máquina impresora, cada dólar es dinero de inversionistas. Tampoco pueden mantener una prima por diferencia tecnológica—la brecha entre los modelos grandes se está reduciendo rápidamente, si hoy lideras por tres meses, en tres meses te alcanzan. Esto no es una brecha tecnológica generacional como la del iPhone frente a Nokia. La ventaja competitiva entre modelos de IA se parece más a un dique de arena, que la marea alta arrasa con facilidad.
En la narrativa de Bill, Google tiene muchas posibilidades de ganar, pero en el mundo de la IA, ¿realmente puede Google monopolizar? Meta podría en cualquier momento abrir un modelo gratuito, China tiene DeepSeek y ByteDance, Amazon está impulsando su propio modelo. Cuando bajas el precio de los tokens al nivel del repollo chino, los competidores no desaparecen—ellos también están bajando precios.
En la batalla de la IA, puede que no haya ganadores.
03 ¿El "juego infinito" de los tokens?
Incluso aquellos que menos conocen la historia probablemente lleguen a la siguiente conclusión sobre el desenlace de la actual batalla de la IA:
El primer guion es el de los "servicios de Internet"—la historia de Didi, la historia de Amazon: primero subsidios, luego monopolio, y finalmente aumento de precios para cosechar ganancias. En este guion, la actual guerra de precios es solo el prólogo, eventualmente uno o dos ganadores ocuparán la mayor parte del mercado y obtendrán poder de fijación de precios. Si es así, las enormes pérdidas actuales son una inversión rentable, como Amazon perdió dinero durante veinte años para finalmente convertirse en el doble dominante del comercio electrónico y la computación en la nube.
El segundo guion es el de los "servicios básicos" (agua, electricidad, gas). Los tokens se convierten en un recurso básico estandarizado, como la electricidad, el ancho de banda, el almacenamiento en la nube. Nadie puede mantener el poder de fijación de precios a largo plazo porque las diferencias de producto son demasiado pequeñas y los costos de cambio demasiado bajos. La competencia empuja el precio infinitamente hacia la línea de costos, y el margen de beneficio tiende a cero. Finalmente, los gobiernos podrían intervenir con regulaciones, como hicieron hace cien años con la electricidad y las telecomunicaciones.
La división entre los dos guiones depende de una palabra:
Bloqueo.
Didi pudo subir precios porque los pasajeros estaban bloqueados en la red de conductores, y los conductores bloqueados en el flujo de pedidos. Amazon pudo subir precios porque los comerciantes estaban bloqueados en su ecosistema de logística y tráfico.
El efecto de bloqueo es la base del modelo "primero pérdidas, luego ganancias".
Pero los tokens de IA—como ya se ha argumentado repetidamente—casi no tienen bloqueo. Las API están estandarizadas, el costo de cambio es casi cero. La condición central para que el primer guion funcione simplemente no existe para el producto token.
Si el segundo guion, el desenlace de infraestructura de "servicios básicos", se acerca más a la realidad, lo que estamos presenciando no es una guerra que eventualmente tendrá un vencedor, sino una competencia de desgaste sin un final claro.
Wang Xing, fundador de Meituan, describió una vez este estado de competencia. Su visión fue: algunas competencias no tienen el concepto de "ganar". El objetivo de los participantes no es derrotar al oponente, sino asegurarse de permanecer siempre en la mesa. Porque mientras estés en la mesa, puedes seguir recaudando fondos, contratando personas, iterando. Salir de la mesa es la única forma de perder.
Usando este marco para reexaminar el panorama actual de la IA, muchas cosas aparentemente contradictorias de repente se vuelven claras.
La última ronda de valoración de OpenAI supera los 800 mil millones de dólares, no porque entrenar modelos requiera tanto dinero. Lo necesita para continuar la guerra de precios. Recaudar fondos no es para ganar, es para "tener el derecho a seguir peleando".
Google se prepara para bajar los tokens un 80%, no para eliminar a OpenAI y Anthropic. Es para asegurarse de seguir siendo un jugador central en la era de la IA, como lo hizo una vez con Android gratuito para asegurarse de no quedarse fuera de la mesa en la era móvil.
Y que Anthropic aumentara el precio de la API de su último modelo insignia, Fable 5, al doble del de la generación anterior—10 dólares por millón de tokens de entrada, 50 dólares por millón de salida—parece un "aumento de precio", pero en realidad es un filtro activo para clientes empresariales dispuestos a pagar por capacidades de gama alta, porque sabe muy bien que la guerra de subsidios en el segmento de consumo es una que no puede ganar contra Google.
Cada ronda de guerra de precios amplía la escala de uso de la IA. Una mayor escala significa más datos, más escenarios, más desarrolladores entrando en el ecosistema. Esto, a su vez, hace que los modelos de todos los participantes sean más fuertes. Los participantes usan la guerra en sí para atraer recursos y mejorarse a sí mismos—esto no es un juego de suma cero donde unos ganan y otros pierden, sino un proceso donde todos se fortalecen a través de la competencia, pero donde es poco probable que nadie obtenga ganancias exorbitantes.
¿No les suena esto al estado final de la industria eléctrica?
Hace 140 años, tanto Edison como Westinghouse pensaban que estaban compitiendo por un mercado en el que el ganador se lo llevaba todo. Apostaron todo su capital, creyendo que "quien definiera el estándar de la electricidad poseería la electricidad". Pero el destino de la electricidad nos enseña una lección simple:
Cuando una tecnología es lo suficientemente importante, lo suficientemente universal, lo suficientemente estandarizada, ya no pertenece a ninguna empresa. Pasa a ser infraestructura.
La competencia de la IA, superficialmente, parece ser Google contra OpenAI contra Anthropic, una competencia de capacidades de modelos, una lucha por la escala de financiación. Pero si alejamos el zoom, el verdadero papel de esta competencia es que está acelerando el impulso de la IA hacia un nivel de infraestructura que ninguna empresa puede poseer en exclusiva.
Cuando Bill Maris dice "sucederá al 100%". Tal vez no solo esté prediciendo que Google bajará los precios. Es posible que esté prediciendo inconscientemente una tendencia mayor—en el mundo de la IA, los tokens eventualmente no pertenecerán a nadie. Al igual que hoy nadie "posee" la electricidad.
Para OpenAI y Anthropic, esto significa algo inquietante: incluso con liderazgo tecnológico, incluso recaudando cantidades astronómicas de capital, el futuro que persiguen de "ganar mucho dinero con la IA" podría no haber existido desde el principio. No se enfrentan a una guerra de precios temporal, sino a un destino estructural—lo que están construyendo con tanto esfuerzo podría ser, en esencia, la próxima generación de agua, electricidad y carreteras.
Y para los usuarios, en cierta medida, esto podría ser una buena noticia. Porque mientras continúe la guerra de subsidios de tokens, las personas aún podrán disfrutar del "buen negocio" de 20 dólares de costo por 400 dólares de potencia de cómputo.






