Subsidios → tarificación por Token → reducción de precios: ¿Inicia OpenAI la guerra de precios y se acerca el punto de inflexión de la economía del Token?

marsbit发布于2026-06-11更新于2026-06-11

文章摘要

La comercialización de la IA generativa enfrenta una revisión profunda tras la evolución desde suscripciones mensuales hasta la facturación por tokens, que ha expuesto los altos costos reales para las empresas. Según The Wall Street Journal, OpenAI considera reducir drásticamente los precios de los tokens para competir con Anthropic, lo que podría desencadenar una guerra de precios. Esta situación es crítica, ya que ambas empresas ya registran pérdidas millonarias debido a los elevados costos de computación. La facturación por tokens ha revelado gastos descontrolados: empresas como Uber agotaron su presupuesto anual en meses, mientras estudios muestran que solo el 18% del gasto en tokens genera valor real para los usuarios. Ante esto, las empresas están implementando controles más estrictos. Expertos como Gary Marcus advierten que una caída de OpenAI podría afectar a gigantes como Nvidia y Oracle. Mientras tanto, actores como DeepSeek, con precios significativamente más bajos, ganan terreno en el mercado estadounidense. El futuro de la economía del token podría incluir modelos de precios por capas o basados en la escasez, enfocándose en maximizar el valor por token en lugar del volumen. Sin embargo, la batalla de precios actual podría redefinir el panorama, beneficiando a proveedores con modelos de coste más eficientes.

Cuando realmente estalle la guerra de precios por los Tokens, ¿con qué ganará dinero la industria de la IA? Toda la lógica de valoración de la comercialización de la IA ha llegado al momento de ser reescrita. Puede que haya llegado el período de competencia por la "relación calidad-precio" y la "escasez". Para OpenAI, "la situación se está deteriorando aún más". Los analistas señalan: "Si OpenAI entra en declive, es probable que arrastre a Nvidia, Oracle, Coreweave y otros".

La narrativa de comercialización de la IA generativa se enfrenta a una de las autoevaluaciones más profundas en los últimos tres años. Desde intercambiar subsidios por usuarios y ocultar costos en suscripciones mensuales, hasta la facturación por Tokens que desencadenó una crisis en las cuentas empresariales, la industria de la IA ha completado un triple salto comercial en tres años, y una posible guerra de precios podría llevar a que toda esta lógica de monetización vuelva a cero.

Según un informe de The Wall Street Journal, OpenAI está considerando reducir significativamente las tarifas por Token que cobra a los usuarios para competir por los clientes empresariales con su rival Anthropic. Según personas informadas, esta medida es en parte para "tomar la delantera", ya que OpenAI anticipa que Anthropic tomará acciones similares de reducción de precios. Sam Altman, CEO de OpenAI, reconoció recientemente en un evento que el costo de uso de la IA se ha convertido en "un gran problema" y afirmó que "ayudará a las personas a obtener más valor con menos gasto".

El momento de esta noticia es especialmente sensible. OpenAI presentó esta semana de manera confidencial su solicitud de OPV, mientras que Anthropic también está en la cuenta regresiva para su salida a bolsa. Al mismo tiempo, el Índice de Gasto en Tokens LLM de Bloomberg Silicon Data ha caído durante 7 sesiones consecutivas, marcando la racha más larga de caídas desde enero de este año, lo que refleja una profunda ansiedad del mercado sobre la sostenibilidad de las facturas de IA. El informe afirma directamente que la guerra de precios erosionará directamente los márgenes de beneficio de ambas empresas, las cuales actualmente ya registran pérdidas de miles de millones de dólares debido a la enorme capacidad computacional requerida por sus sistemas de IA.

El núcleo de esta discusión ya no es solo una decisión de reducción de precios, sino una pregunta más fundamental: cuando la narrativa de "cuanto más consumo de Token, mejor" llegue a su fin, ¿quién contará la próxima historia comercial de la industria de la IA y cómo la contará?

01

Tres etapas iniciales: de los subsidios mensuales a las facturas por Token

La comercialización de la IA generativa ha experimentado una evolución clara en tres etapas en solo tres años.

Primera etapa: las suscripciones mensuales y anuales establecieron el tono de la industria. En febrero de 2023, OpenAI lanzó ChatGPT Plus por 19.99 dólares mensuales, iniciando el pago directo al consumidor (B2C) para modelos grandes; Baidu, Alibaba y Tencent siguieron su ejemplo, y las suscripciones de tarifa fija mensual se convirtieron en el estándar del modelo comercial inicial.

Segunda etapa: estalló la guerra de subsidios total. Para aumentar el ARR (Ingresos Recurrentes Anuales), que es el ancla central de la valoración para la financiación, los fabricantes recurrieron a subsidios a gran escala: Google ofreció 15 meses gratuitos de Gemini Advanced para estudiantes, OpenAI lanzó una membresía Team con el primer mes a 1 dólar, Doubao de ByteDance entró con precios "un 99.3% más bajos que los del sector", y Baidu anunció que sus modelos centrales serían gratuitos. La esencia de los subsidios es cambiar pérdidas por crecimiento; según informes, Microsoft pierde en promedio más de 20 dólares por usuario al mes bajo el modelo de suscripción de GitHub Copilot, y las pérdidas mensuales para algunos usuarios intensivos alcanzan los 80 dólares.

Tercera etapa: el cambio obligatorio a la facturación por uso. El 1 de junio de 2026, Microsoft anunció que todos los planes de GitHub Copilot cambiarían oficialmente a la facturación basada en el uso de Tokens, convirtiendo la tarifa mensual de 19 dólares directamente en un crédito equivalente en Tokens. Este cambio sacó a la luz el costo real oculto durante mucho tiempo por las suscripciones; según cálculos de usuarios de la comunidad de Reddit, una sesión de programación con un agente inteligente puede consumir de 30 a 40 dólares, agotando el paquete mensual en un solo uso.

02

Facturas fuera de control: cuando el Token es más caro que una persona

La implementación de la facturación por uso de Tokens presenta completamente la verdadera cara del gasto empresarial en IA.

Las cifras de las facturas en el lado empresarial son impactantes. Andrew Macdonald, COO de Uber, declaró públicamente en mayo de 2026 que entre el crecimiento del consumo de Tokens y la mejora sustancial del producto "esta línea aún no existe", y acuñó un término para ello: "tokenmaxxing" (maximización de Tokens), describiendo a los empleados realizando tareas sin valor solo para aumentar el volumen de uso.

Un dato más directo es: Uber agotó su presupuesto anual de Tokens solo en los primeros cuatro meses de 2026; Salesforce estima que sus pagos anuales a Anthropic ascenderán a aproximadamente 300 millones de dólares.

La propia documentación para desarrolladores de Anthropic muestra que el costo promedio para los desarrolladores que usan Claude Code es de aproximadamente 13 dólares por día laborable, y el 90% de los usuarios tiene un costo diario inferior a 30 dólares. Calculado, un equipo de desarrollo de 10 personas podría superar los 75,600 dólares anuales solo en costos de Tokens.

La relación costo-beneficio también es alarmante. Entelligence.AI, una plataforma de datos empresariales, tras recopilar datos de 2444 empresas, descubrió que por cada dólar invertido en costos de Tokens de IA, solo 18 centavos generaron valor real que llegó a los usuarios; 44 centavos se usaron para corregir errores introducidos por la propia IA, 27 centavos fueron para retrabajos y 11 centavos se consumieron en fricciones de revisión.

Frente a las facturas fuera de control, el lado empresarial ya ha comenzado a controlar activamente. Amazon suspendió su lista interna de clasificación de uso de IA, pidiendo a los empleados "no usar IA solo por usarla"; Microsoft planea suspender gradualmente las suscripciones a Claude Code para empleados en algunos departamentos clave de productos. Goldman Sachs señala que el gasto en Tokens de IA para algunas empresas ya representa el 10% de su costo total de mano de obra, y esta proporción podría aumentar aún más en los próximos trimestres. No es que la demanda desaparezca, sino que la era del gasto extensivo en IA está llegando a su fin.

03

Cuarto acto: se enciende la guerra de precios, OpenAI considera reducciones drásticas

Es en este contexto donde se enciende la mecha de la guerra de precios.

Según The Wall Street Journal, la consideración de Altman de reducir precios fue desencadenada directamente por la presión de alcanzar a Anthropic. Los ingresos de Anthropic han crecido significativamente recientemente, su herramienta de programación Claude Code se ha vuelto popular entre los ingenieros de software, y la valoración de esta startup de cinco años incluso superó por primera vez la de OpenAI.

Sin embargo, el costo de esta guerra de precios será excepcionalmente alto. Si los precios bajan significativamente, comprimirán aún más los márgenes de beneficio, ya negativos, de ambas empresas, y el espacio que ofrece el panorama competitivo es extremadamente limitado.

Y el riesgo subyacente identificado durante mucho tiempo por los inversores es que los productos de OpenAI y Anthropic son altamente sustituibles, los clientes pueden cambiar fácilmente de uno a otro, lo que significa que incluso si la reducción de precios retiene clientes a corto plazo, no construye realmente una barrera defensiva, solo retrasa la pérdida de participación.

Este dilema también se transmite hacia afuera a través del ciclo financiero entre los gigantes de la nube y los laboratorios de IA.

Según documentos empresariales compilados por The Information, OpenAI y Anthropic representan más de la mitad de los aproximadamente 2 billones de dólares en compromisos futuros de servicios en la nube de Microsoft, Oracle, Google y Amazon. Si la reducción de precios provoca una revisión a la baja de las expectativas de ingresos, esta cadena de transmisión se verá presionada en ambas direcciones.

Gary Marcus, experto estadounidense en neurociencia e inteligencia artificial, dijo: "Esto expone aún más la fragilidad de OpenAI e indica lo grave que es el dilema que enfrenta. Si OpenAI entra en declive, es probable que arrastre a compañías como Nvidia, Oracle, Coreweave y otras. La situación se está deteriorando rápidamente."

Las divergencias alcistas y bajistas se confrontan abiertamente en Wall Street. Mark Schilsky, analista de TMT de JPMorgan, cree que la actual ansiedad por las facturas no es más que "el mínimo obstáculo en el camino hacia un gasto mayor": si el precio promedio por millón de Tokens baja, pero la tasa de penetración de pago por IA de las empresas estadounidenses continúa aumentando, el volumen total de uso de Tokens matemáticamente debe aumentar significativamente; sumado a que la IA de agentes (agentic AI) empuja el consumo de Tokens por tarea a múltiplos del modo tradicional de preguntas y respuestas, se espera que el gasto total a largo plazo sea significativamente mayor que los niveles actuales.

Jim Covello, analista de semiconductores de Goldman Sachs, mantiene una postura más pesimista, argumentando que la prosperidad actual de la cadena de suministro dirige casi todo el valor hacia las empresas de semiconductores, un fenómeno "sin precedentes en la historia e insostenible". Una vez que las empresas enfrenten el precio real de la facturación por uso, los flujos de capital que respaldan las compras de GPU y el entrenamiento de modelos enfrentarán una reversión.

04

Quinto acto: ¿La próxima historia de la economía del Token?

Después de la guerra de precios, el próximo capítulo de la comercialización de la industria de la IA aún no está escrito, pero el contorno está surgiendo.

Un informe de Citadel Securities proporciona un marco direccional: tarificación por niveles y precios basados en la escasez. Su lógica central es que la IA de vanguardia intensiva en inferencia no desaparecerá, sino que se concentrará cada vez más en unas pocas grandes empresas capaces de asumir los costos computacionales; para una gama más amplia de empresas, modelos más simples pueden ser el camino más productivo antes de que se alivien las restricciones físicas. Esto significa que el uso de la IA se estratificará: tareas de alto valor y complejas continuarán usando modelos de vanguardia, mientras que las tareas diarias y por lotes se dirigirán a modelos baratos o locales.

JPMorgan tiene un juicio relativamente optimista: incluso si el precio unitario del Token cae, la popularización de la IA de agentes (agentic AI) multiplicará el consumo de Tokens por tarea; los datos existentes muestran que después de la agentización de los negocios, el consumo de Tokens por tarea puede multiplicarse por 3.5, por lo que se espera que la escala total de gasto continúe expandiéndose. La actual ansiedad por las facturas podría ser solo "el mínimo obstáculo en el camino hacia un gasto mayor".

Marc Boroditsky, CRO de Nebius, propuso el concepto de "valuemaxxing" (maximización de valor), abogando porque la industria pase de buscar la maximización del consumo de Tokens a hacer que cada Token realmente genere valor. Esta dirección se está convirtiendo gradualmente en un consenso de la industria, pero la verdadera implementación comercial aún requiere que los laboratorios de IA encuentren un sistema de precios que pueda reflejar los costos reales y ser aceptado por los clientes empresariales, y esta es precisamente la propuesta central aún no resuelta en todos los debates actuales.

Sin embargo, en esta guerra de precios, la variable quizás más ignorada son los modelos chinos.

Según datos de junio de la plataforma estadounidense de gestión de gastos empresariales Ramp, DeepSeek encabeza la lista de crecimiento de suscripciones de software empresarial en EE.UU. Ara Kharazian, economista jefe de Ramp, enfatizó especialmente que esto no es una implementación local de modelos de código abierto, "las empresas están enviando y recibiendo datos directamente a través de DeepSeek", es un uso de conexión directa con pago real, y admitió "no esperaba que las empresas estadounidenses fueran a usar DeepSeek". Según cálculos de terceros, el precio promedio de la API de DeepSeek V4-Pro es aproximadamente una décima parte del de GPT-5.5, y aproximadamente una onceava parte del de Claude Opus 4.7.

La lucha entre OpenAI y Anthropic, finalmente, podría beneficiar a ese jugador que ya tiene inscrita en su ADN la "tarificación inclusiva" y no necesita rendir cuentas sobre márgenes de beneficio a los inversores de su OPV. Este quizás no sea el resultado más popular de esta guerra de precios, pero se está convirtiendo en una realidad cada vez más difícil de ignorar.

Este artículo proviene del WeChat público "硬AI", autor: 徐超 (Xu Chao)

相关问答

Q¿Cuáles son las tres etapas de la comercialización de la IA generativa mencionadas en el artículo?

AEl artículo describe tres etapas claras: 1) Suscripciones mensuales/anuales (por ejemplo, ChatGPT Plus). 2) Guerras de subsidios con ofertas gratuitas o de bajo costo para captar usuarios. 3) El cambio a un modelo de facturación basado en el consumo real de tokens, que ha revelado los altos costos reales para las empresas.

QSegún el artículo, ¿por qué está considerando OpenAI reducir significativamente el precio de sus tokens?

AOpenAI está considerando una reducción significativa de precios para competir por los clientes empresariales con su rival Anthropic, que ha experimentado un gran crecimiento reciente. Se trata de una medida anticipada, ya que OpenAI espera que Anthropic también realice movimientos similares de reducción de precios, lo que podría desencadenar una guerra de precios.

Q¿Qué problema ilustra el concepto 'tokenmaxxing' acuñado por un ejecutivo de Uber?

AEl término 'tokenmaxxing' (maximización de tokens) ilustra el problema de que los empleados realizan tareas sin valor real simplemente para aumentar el consumo de tokens y justificar el uso de herramientas de IA, lo que lleva a facturas descontroladas sin una mejora productiva correspondiente.

Q¿Qué riesgo identifica el experto Gary Marcus si OpenAI entra en declive?

AGary Marcus señala que la situación de OpenAI es frágil y se está deteriorando rápidamente. Advierte que si OpenAI entra en declive, podría arrastrar consigo a empresas como Nvidia, Oracle y Coreweave, debido a los fuertes vínculos financieros y de dependencia en la cadena de suministro de la IA.

Q¿Qué actor emergente, según el artículo, podría beneficiarse de la guerra de precios entre OpenAI y Anthropic?

AEl artículo sugiere que DeepSeek, un modelo de IA chino, podría ser el gran beneficiario. Su API es significativamente más barata (aproximadamente una décima parte del costo de GPT-5.5) y ya encabeza las listas de crecimiento de suscripciones de software empresarial en EE.UU., ofreciendo una alternativa de bajo costo sin la presión de mostrar rentabilidad para una IPO.

你可能也喜欢

谷歌TPU出货量,上修50%

近期,多家海外机构上调了谷歌TPU的出货预期,将2027年需求预测从1000万颗上修至1500万颗,增幅达50%。这一变化扭转了市场对算力硬件的保守看法,并带动整条配套产业链需求同步提升。 谷歌TPU采用标准化全光互联架构,硬件配套关系固定。其中,NPO光引擎与TPU芯片按1:1匹配,光模块、OCS光交换、服务器电源、光纤及液冷等环节的需求均随芯片规模增长而确定增加。 液冷成为核心受益方向。因新一代TPU功耗大幅提升,风冷已达物理极限,谷歌集群已全面转向液冷方案。预计2026年为放量元年,下半年开始大规模交付。同时,海外厂商面临技术迭代慢、产能不足的瓶颈,为国产液冷厂商让出替代窗口。凭借快速迭代和稳定交付能力,国内企业正切入谷歌供应链,行业迎来“业绩提速+格局洗牌”的双击行情。预计伴随TPU出货量从2027年的1500万颗增长至2028年的3000-3500万颗,专属液冷市场规模将从千亿级突破至3000亿级。 光纤赛道逻辑亦被重塑。AI算力中心建设催生海量光纤需求,但光纤预制棒扩产周期长,导致供需缺口持续扩大。全球云厂商为锁定货源纷纷签订长期协议,使光纤价格与出货趋稳,摆脱周期性波动。国产光纤凭借产能与成本优势,预计2026年出口量将达2-3亿芯公里,占据全球AIDC需求的半壁江山。 此外,1.6T光模块、OCS光交换、服务器电源等配套环节均将受益于TPU放量,需求持续扩容。投资重心正从芯片算力博弈转向基础设施配套的确定性增量,产业链未来两年业绩确定性进一步增强。

marsbit6分钟前

谷歌TPU出货量,上修50%

marsbit6分钟前

币圈故事退潮后,华尔街真正想要的是什么

币圈故事退潮后,华尔街正将传统金融的核心资产与业务系统性地迁移至区块链上,其目标并非投机或去中心化叙事,而是构建一套可控、生息且合规的链上金融基础设施。 核心动向包括: 1. **资产代币化**:以贝莱德的BUIDL基金为例,它将短期美国国债等低风险资产代币化,提供链上即时结算与每日复投,成为链上金融的基石资产。过户代理机构Securitize即将上市,并与纽交所合作,旨在建立全天候的链上股票清算系统。 2. **波动率变现**:针对比特币等波动资产,贝莱德、高盛等机构推出备兑看涨期权ETF(如BITA),通过系统性卖出期权将波动转化为稳定的月度现金收益,将其包装为标准化的生息产品,以吸引传统大型资金。 3. **稳定币支付与清算**:稳定币正被定位为高效的支付与结算工具。Stripe支持商户用稳定币收款,万事达卡升级系统支持稳定币进行跨时区清算,连SWIFT也计划推出基于分布式账本的跨境清算方案,旨在释放被冻结的巨额结算准备金,提升效率。 4. **监管与合规驱动**:美国《GENIUS法案》等监管框架将合规稳定币明确定义为“支付工具”(禁止派息)并纳入强监管,使其成为美元金融体系的可编程延伸。 总之,华尔街正利用区块链技术的可编程性与效率,在链上复制并优化国债、期权、清算网络等传统金融产品与服务,每一步都紧密依托美元信用与现有监管体系,旨在打造一个更高效且由其主导的新金融管道。

marsbit23分钟前

币圈故事退潮后,华尔街真正想要的是什么

marsbit23分钟前

交易

现货
合约

热门文章

如何购买WAR

欢迎来到HTX.com!我们已经让购买WAR(WAR)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买WAR(WAR)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的WAR(WAR)购买完您的WAR(WAR)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易WAR(WAR)在HTX的现货市场轻松交易WAR(WAR)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

707人学过发布于 2024.12.11更新于 2026.06.02

如何购买WAR

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对WAR(WAR)币价的意见。

活动图片