Los tokens son caros, y quemarlos duele.
Esta no es solo la queja de quienes están obsesionados con el Vibe Coding en la actualidad. Incluso los gigantes tecnológicos del Valle del Silicio, que antes promovían frenéticamente el Tokenmaxxing, han comenzado a imponer límites de uso de tokens a sus propios empleados.
Pero, irónicamente, existe un punto contraintuitivo: los estudiantes que actualmente utilizan suscripciones de IA están, en realidad, usando tokens que ya han sido subvencionados por los grandes fabricantes de IA. ¡El subsidio más alto podría incluso ser 70 veces el precio de la suscripción!
Lo que es más preocupante es que OpenAI y Anthropic, dos de los principales líderes en IA, ya se encuentran en la fase de preparación para una OPV (Oferta Pública de Venta). Una vez que las dos empresas salgan a bolsa,
¿seguirá la misma pauta que la "guerra de subsidios" de la era de Internet, después de la cual las empresas supervivientes empezaron a subir los precios, devolviendo el precio de los tokens a niveles "racionales"?
La buena noticia es que esto podría no suceder. Recientemente, Bill Maris, fundador de Google Ventures, planteó una pregunta en el podcast All-in:
Si Google decidiera reducir el precio del token otro 80%, ¿cómo responderían OpenAI y Anthropic?
Por coincidencia, no hace mucho, el equipo de la startup Agnes AI, en una transmisión en vivo con GeekPark, explicó en detalle la posible llegada de la "era de los tokens gratuitos".
Entonces, ¿el precio futuro de los tokens subirá o bajará? Y, ¿qué significaría esto para aquellos que ya son adictos a la IA?
01 Los subsidios de tokens están ardiendo
¿Por qué se dice que el precio actual de los tokens no es realmente caro?
Porque al menos en las suscripciones de IA, los precios actuales de las empresas de IA ya son un "precio de ganga" después de los subsidios.
Recientemente, SemiAnalysis evaluó en detalle la comparación entre el valor real de los tokens consumidos y la tarifa de suscripción en los modelos de suscripción de OpenAI y Anthropic.
SemiAnalysis hizo algo simple pero efectivo: usar la IA en varios planes de suscripción de diferentes plataformas para completar diversas tareas, y luego calcular el valor en tokens de esas tareas utilizando los precios públicos de la API. Los resultados fueron los siguientes:
Observen una pauta: cuanto más caro es el plan, mayor es el múltiplo del subsidio. Esto en sí mismo indica que estos planes premium no están destinados a ganar dinero; son una especie de "fijación de precios inversa", utilizando pérdidas extremadamente agresivas para retener a los usuarios más intensivos. Porque los usuarios intensivos son desarrolladores y tomadores de decisiones empresariales; una vez que se vinculan a una plataforma, arrastrarán consigo a equipos enteros y líneas de productos completas.
Perdiendo a tal nivel, ¿por qué seguirlo haciendo? La respuesta estándar es: primero quemar dinero para ganar escala, y luego subir los precios para recuperar la inversión una vez alcanzada la escala. Así se jugó en la era de Internet móvil: DiDi y Uber subsidiaron cientos de miles de millones de yuanes en viajes, y después de que terminaron los subsidios, las tarifas subieron. Meituan subsidió innumerables entregas de comida, y después de que terminaron los subsidios, las tarifas de entrega subieron. Este lógica funciona bajo una premisa clave: se estableció un efecto de bloqueo durante el período de subsidios.
DiDi pudo subir los precios porque los conductores dependen del flujo de pedidos en la plataforma, y los pasajeros dependen de los conductores en la plataforma. Meituan pudo subir los precios porque los comerciantes dependen de su tráfico y red de distribución. Al finalizar los subsidios, los usuarios ya están "bloqueados" en el ecosistema, con un costo de cambio extremadamente alto.
Pero la gran guerra de la IA tiene una diferencia fundamental con Internet: los tokens prácticamente no tienen efecto de bloqueo.
Si Claude sube los precios, los desarrolladores podrían migrar las llamadas API a GPT o Gemini en un día; las interfaces de cada vez son más estandarizadas, y muchos frameworks de desarrollo incluso incluyen funciones para cambiar entre múltiples modelos. Para el usuario común es aún más simple: solo cambiar de sitio web. La IA no tiene una red local de conductores como las apps de transporte, ni un sistema de distribución como las apps de comida a domicilio, ni una cadena de relaciones sociales como las redes sociales. Un token es un token; sin importar quién lo produzca, es básicamente lo mismo.
Esto significa que una vez que los subsidios se detengan, los usuarios podrían desaparecer en un instante. Los subsidios no están "construyendo barreras", sino que se asemejan más a "mantener un latido" – siempre que alguien ofrezca un precio más bajo, los usuarios se irán.
Y esto sin contar con una nueva variable que está haciendo que las facturas de todos se descontrolen: los Agentes de IA.
Cuando chateas con ChatGPT, una conversación puede consumir quizás unos pocos miles de tokens. Pero cuando le pides a un Agente de IA que ejecute una tarea compleja – escribir un código y depurarlo automáticamente, analizar un documento de decenas de páginas y generar un informe – el consumo de tokens en una sola ronda es de 5 a 30 veces mayor que el de una conversación normal. Algunos desarrolladores han probado que, en el plan Claude Max de 100 dólares, una sola sesión de programación con un Agente puede quemar tokens por un valor de casi 100 dólares. El CTO de Uber reveló recientemente que la empresa agotó el presupuesto completo de IA para 2026 en solo cuatro meses.
La pregunta es: ¿puede durar esta guerra de subsidios de tokens? ¿Quién podría, posiblemente, seguir en pie cuando termine la batalla?
Bill Maris cree que la respuesta es, obviamente, los gigantes tradicionales.
02 El Token como arma
Para comprender la verdadera crueldad de esta guerra de subsidios, primero hay que ver una asimetría estructural: la fuente de la munición de los combatientes es completamente diferente.
Los ingresos anuales por publicidad de Google superan los 300.000 millones de dólares. Este no es dinero de inversores, ni capital quemado de financiación, sino una máquina de hacer dinero que funciona automáticamente todos los días. Miles de millones de personas en todo el mundo abren el motor de búsqueda, ven YouTube, usan Gmail, y el dinero de la publicidad fluye automáticamente a la cuenta. No necesita presentaciones a inversionistas, no necesita complacer a los analistas, no necesita explicarle a nadie por qué gasta ese dinero.
Que Google use las ganancias publicitarias para subvencionar los tokens de IA es como si una persona con pozos de petróleo en su propiedad libra una guerra de precios en las gasolineras – su petróleo sale de su propia tierra, mientras que el petróleo de sus rivales se compra con préstamos bancarios.
OpenAI y Anthropic son esos que piden préstamos para comprar petróleo.
OpenAI ha recaudado más de 180.000 millones de dólares en financiación acumulada, con una valoración más reciente que supera los 850.000 millones. Anthropic ha recaudado más de 130.000 millones. Este dinero proviene de capital de riesgo e inversores estratégicos – no dan dinero por caridad; esperan que estas empresas salgan a bolsa, esperan obtener rendimientos sustanciales al retirar su inversión.
Y una vez que salgan a bolsa, es cuando comienzan los verdaderos problemas. Salir a bolsa significa que los estados financieros son públicos para todo el mundo. Cada trimestre, los analistas de Wall Street examinarán los ingresos, ganancias, costos de adquisición de clientes y costos marginales. Cuando calculen que por cada dólar de tarifa de suscripción que recibes, realmente pierdes 70 dólares – ninguna historia de crecimiento, por gloriosa que sea, podrá sostener el precio de las acciones.
Bill Maris expresó esta lógica con franqueza en el podcast. Sus palabras exactas fueron: "Si yo fuera Google y decidiera reducir arbitrariamente el precio del token otro 80%, ¿qué le pasaría al modelo de negocio de OpenAI y Anthropic?"
El anfitrión preguntó cuál era la probabilidad de que eso ocurriera. Maris no dudó: "100%. El capital como arma, los tokens como arma."
Esto no es una especulación de un analista. Bill Maris es el fundador y CEO de Google Ventures, y también vicepresidente de Proyectos Especiales de Google, habiendo incubado Waymo y Google X. Todos los presentes entendieron: esto no es una hipótesis, es algo que ha visto hacer a Google.
El escenario que describe es simple: Google anuncia que la API de Gemini bajará de precio un 80%. ¿Qué harán los clientes empresariales? Si la calidad del producto es similar – y en muchas pruebas de referencia, Gemini ya está a la par de Claude y GPT – pero el precio es cuatro quintas partes más barato, ¿seguirías usando el caro?
El propio Maris dio la respuesta: "Si eres una empresa y puedes pagar un 80% menos por un producto básicamente idéntico en Google y Gemini, ¿por qué no lo harías? Entonces la presión sobre esas empresas se volvería muy severa."
Y OpenAI y Anthropic apenas tienen medios de represalia simétricos. No pueden igualar la bajada de precios – no tienen una máquina de hacer dinero, cada dólar es de inversores. Tampoco pueden mantener una prima basada en la brecha tecnológica – las diferencias entre los modelos grandes se están reduciendo rápidamente, hoy llevas tres meses de ventaja, en tres meses te alcanzan. No es como la diferencia generacional de tecnología entre el iPhone y Nokia. Las barreras defensivas entre los modelos de IA se asemejan más a diques de arena; la marea sube y los sobrepasa.
En la narrativa de Bill, Google tiene muchas posibilidades de ganar. Pero, ¿realmente puede Google monopolizar el mundo de la IA? Meta puede en cualquier momento lanzar un modelo gratuito de código abierto, China tiene DeepSeek y ByteDance, Amazon está promoviendo su propio modelo. Cuando reduces los tokens a precio de saldo, los competidores no desaparecen – ellos también bajan los precios.
En la gran guerra de la IA, puede que no haya ganadores.
03 ¿Un "juego infinito" para los tokens?
Incluso aquellos que no conocen bien la historia, pueden intuir cómo terminará la actual guerra de la IA:
El primer guion es el de los "servicios de Internet" – la historia de DiDi, la historia de Amazon: primero subsidiar, luego monopolizar, y luego subir los precios para cosechar beneficios. En este guion, la actual guerra de precios es solo el prólogo, y al final uno o dos ganadores ocuparán la mayor parte del mercado, obteniendo poder de fijación de precios. De ser así, las enormes pérdidas actuales son una inversión rentable – como Amazon, que perdió dinero durante veinte años para finalmente convertirse en un doble dominador del comercio electrónico y la computación en la nube.
El segundo guion es el de los "servicios básicos" (agua, electricidad, gas). Los tokens se convierten en un recurso básico estandarizado, como la electricidad, el ancho de banda o el almacenamiento en la nube. Nadie puede mantener el poder de fijación de precios a largo plazo, porque las diferencias del producto son demasiado pequeñas y el costo de cambio es demasiado bajo. La competencia empuja el precio infinitamente hacia la línea de costo, y los márgenes de beneficio se acercan a cero. Al final, los gobiernos podrían intervenir con regulaciones – como hicieron hace cien años con la electricidad y las telecomunicaciones.
La división entre los dos guiones depende de una palabra:
Bloqueo.
DiDi pudo subir los precios porque los pasajeros están bloqueados en la red de conductores, y los conductores están bloqueados en el flujo de pedidos. Amazon pudo subir los precios porque los comerciantes están bloqueados en su ecosistema logístico y de tráfico.
El efecto de bloqueo es la base del modelo "primero pierdes, luego ganas".
Pero los tokens de IA – como ya se ha argumentado repetidamente – prácticamente no tienen bloqueo. Las API están estandarizadas, el costo de cambio es casi cero. La condición central para que funcione el primer guion no existe para el producto token.
Si el segundo guion, el final de los "servicios básicos" como infraestructura, se acerca más a la realidad, entonces lo que estamos presenciando no es una guerra que eventualmente tendrá un vencedor, sino una competencia de desgaste sin final.
Wang Xing, fundador de Meituan, describió una vez este estado de competencia. Su perspicacia fue: algunas competencias no tienen el concepto de "ganar". El objetivo de los participantes no es derrotar al oponente, sino asegurarse de que siempre permanezcan en la mesa de juego. Porque mientras sigas en la mesa, puedes seguir consiguiendo financiación, contratando personal, iterando. Salir de la mesa es la única forma de perder.
Usando este marco para reexaminar el panorama actual de la IA, muchas cosas aparentemente contradictorias de repente se vuelven claras.
La última ronda de valoración de OpenAI, de más de 800.000 millones de dólares, no es porque entrenar modelos requiera tanto dinero. Necesita tanto dinero para seguir librando la guerra de precios. La financiación no es para ganar, es para "tener derecho a seguir peleando".
Google está preparándose para reducir los tokens un 80% no para eliminar a OpenAI y Anthropic. Es para asegurarse de seguir siendo un jugador central en la era de la IA – tal como lo hizo al lanzar Android gratuito para asegurarse de no quedarse fuera de la mesa en la era móvil.
Y que Anthropic haya subido el precio de la API de su último modelo insignia, Fable 5, al doble que la generación anterior – 10 dólares por millón de tokens de entrada, 50 dólares por millón de salida – parece un "aumento de precio", pero en realidad es una selección activa de clientes empresariales dispuestos a pagar por capacidades de gama alta, porque sabe claramente: no puede ganar la guerra de subsidios en el segmento de consumo contra Google.
Cada ronda de guerra de precios amplía la escala de uso de la IA. Una mayor escala significa más datos, más escenarios, más desarrolladores entrando en el ecosistema. Esto, a su vez, hace que los modelos de todos los participantes sean más fuertes. Los combatientes usan la guerra misma para atraer recursos y mejorarse a sí mismos – este no es un juego de suma cero donde uno gana y otro pierde, sino un proceso donde todos se fortalecen a través de la competencia, pero también es poco probable que nadie obtenga beneficios exorbitantes.
¿No les suena esto al resultado final de la industria eléctrica?
Hace 140 años, tanto Edison como Westinghouse creían que estaban compitiendo por un mercado donde el ganador se lo llevaba todo. Arriesgaron todas sus fortunas, apostando a que "quien definiera el estándar de la electricidad, poseería la electricidad". Pero el destino de la electricidad nos enseña una lección simple:
Cuando una tecnología es lo suficientemente importante, lo suficientemente general y lo suficientemente estandarizada, deja de pertenecer a una sola empresa. Pasa a formar parte de la infraestructura.
La competencia en IA, superficialmente, parece Google contra OpenAI contra Anthropic, una competencia de capacidades de modelos, una comparación de escala de financiación. Pero si alejamos el enfoque, el verdadero papel de esta competencia es: está acelerando el impulso de la IA hacia un nivel de infraestructura que ninguna empresa podrá poseer en exclusiva.
Cuando Bill Maris dice "ocurrirá al 100%", quizás no solo esté prediciendo que Google bajará los precios. Podría estar prediciendo inconscientemente una tendencia mayor: en el mundo de la IA, los tokens finalmente no pertenecerán a nadie. Al igual que hoy nadie "posee" la electricidad.
Para OpenAI y Anthropic, esto significa algo incómodo: incluso con liderazgo tecnológico, incluso con financiación astronómica, el futuro que persiguen de "ganar mucho dinero con la IA" podría no haber existido desde el principio. No se enfrentan a una guerra de precios temporal, sino a un destino estructural – lo que están esforzándose por construir podría ser, en esencia, la próxima generación de agua, electricidad y carreteras.
Y para los usuarios, en cierta medida, podría ser una buena noticia. Porque mientras continúe la guerra de subsidios de tokens, la gente seguirá disfrutando del "buen negocio" de obtener una potencia de cálculo de 400 dólares por un costo de 20.
Este artículo proviene del WeChat oficial "GeekPark" (ID: geekpark), autor: Astronauta.







