"Tokenpocalypse": Cuando el costo supera las ganancias de productividad, ¿quién paga?

marsbit发布于2026-06-10更新于2026-06-10

文章摘要

Un nuevo término, «Tokenpocalypse» o «Apocalipsis de los tokens», está ganando relevancia tras el cambio de modelo de precios de GitHub Copilot de Microsoft, que a partir del 1 de junio factura según el uso de tokens. Los modelos más avanzados y apreciados por los usuarios han experimentado las subidas más drásticas, en algunos casos multiplicando su coste por 60. Con empresas como Anthropic y OpenAI preparando su salida a bolsa, la presión por rentabilizar sus servicios podría llevar a más proveedores a seguir esta tendencia alcista. Esto coloca a las empresas en una situación paradójica: tras fomentar e incluso obligar el uso de IA entre sus empleados —una práctica conocida como «tokenmaxxing»—, ahora deben controlar estrictamente su consumo para no disparar los costes. La falta de herramientas para limitar el uso por empleado, como señalan desarrolladores, hace que un solo trabajador pueda agotar el presupuesto mensual de toda la compañía en un día. El foco del trabajo se desvía así de resolver problemas de negocio a gestionar el gasto en tokens. El caso de Uber es ilustrativo: en menos de dos meses, la compañía agotó su presupuesto de IA mucho más rápido de lo previsto, lo que la obligó a imponer límites urgentes de uso. El dilema subyacente es si la industria podrá reducir los costes de los modelos de lenguaje hasta que sean asumibles para sus clientes. La monitorización en tiempo real del gasto en plataformas como AWS Bedrock se ha convertido en una nueva métrica emp...

Recientemente, una nueva palabra ha suscitado un amplio debate: "Tokenpocalypse" (El Apocalipsis del Token).

El detonante fue la reestructuración de precios que Microsoft aplicó a GitHub Copilot. A partir del 1 de junio, Copilot ha adoptado completamente un modelo de facturación basado en tokens, donde los multiplicadores de costo entre los diferentes modelos varían enormemente, llegando a ser el precio por token de algunos modelos hasta 60 veces superior al de otros.

Y precisamente aquellos modelos avanzados, considerados por los usuarios como "realmente buenos", son los que han experimentado los aumentos más drásticos.

A medida que empresas líderes en IA como Anthropic y OpenAI se preparan para salir a bolsa, estas compañías se enfrentarán a presiones de rentabilidad aún más severas, lo que podría obligar a más proveedores a seguir la tendencia de subir los precios.

El costo de usar la IA siempre ha sido un problema inevitable para las empresas que buscan expandir su productividad. La reciente moda del "tokenmaxxing", que competía por impulsar el volumen de uso de tokens por parte de los empleados, está llegando a su fin con la proximidad de la "Tokenpocalypse".

"Toda la moda del tokenmaxxing, desde su auge hasta su apogeo y luego hasta ser despreciada, duró apenas seis meses."

El dilema de las empresas

Este desarrollador de una gran empresa describe una situación paradójica: durante mucho tiempo, la empresa obligaba a los empleados a usar herramientas de IA, y si usaban pocos tokens, los llamaban a una reunión. Pero con la nueva estructura de precios, si usan demasiados tokens, también los llaman a una reunión.

Lo peor es que, hasta ahora, el equipo de Copilot no ha logrado implementar la función de "límite de tokens por nivel de empleado". Esto significa que, bajo el nuevo modelo de facturación, un solo empleado podría agotar todo el presupuesto mensual de tokens de la empresa en un solo día.

"Mi trabajo ya no consiste en usar software para resolver problemas de negocio," escribe este desarrollador, "mi trabajo se ha convertido en resolver problemas de uso de tokens."

Los comentarios son aún más reveladores. Un usuario resume: "La política de la empresa se ha convertido en: 'Usa IA para todo, pero ten cuidado de no usar demasiado, porque si el LLM consume demasiados tokens, te suspenderán, y luego te criticarán por no haber usado IA el resto del mes.'"

Que las empresas den demasiada importancia a la productividad de la IA también puede ser un arma de doble filo.

Un director de información de un gran bufete de abogados incluso "presumió" en un seminario sobre IA: cuando su sistema de IA se cayó, los abogados básicamente dejaron de trabajar, porque ya no pueden prescindir de la IA.

"¿Una persona con años de formación especializada admite libremente que no puede trabajar sin un chatbox de IA? Me daría vergüenza y empezaría a cuestionar mi carrera profesional."

El caso de sobrecoste de Uber: un microcosmos de la industria

Actualmente, la mayoría de los modelos de IA tienen paquetes de uso, y el problema de las empresas para controlar el presupuesto se agrava con la tendencia a facturar los tokens según el consumo.

Uber recorrió una trayectoria completa en mes y medio: primero descubrió que "el presupuesto de IA se quemaba mucho más rápido de lo previsto", y luego estableció urgentemente límites de uso y restricciones para los empleados.

"Imagínense que una empresa que usa tanta IA como Uber se topara con un límite tan rápido," se comentó en un podcast de TechCrunch. "La pregunta es: ¿pueden los laboratorios de IA reducir los costos hasta alinearse con la disposición a pagar de sus clientes?"

Un dato poco conocido: cuando ChatGPT Plus se lanzó inicialmente a 20 dólares al mes, no había ninguna consideración estratégica detrás, "simplemente tiraron un número". Toda la industria todavía está pagando las consecuencias de ese punto de partida.

"Tu trabajo no será reemplazado por la IA, pero tu presupuesto podría serlo"

En Reddit hay más detalles reveladores. Alguien creó en su empresa un panel de control de costos de AWS Bedrock, que muestra en tiempo real en CloudWatch el gasto de cada modelo y de cada token (incluidos los tokens en caché), "para que tanto los desarrolladores como las finanzas vean cómo se quema el dinero". La reacción en los comentarios fue: "Enhorabuena, acabas de proporcionarles un nuevo indicador KPI."

Otra gran empresa ya ha experimentado una restricción similar: una vez agotadas las cuotas de IA, todos fueron degradados forzosamente a GPT-4.2, perdiendo incluso la integración con VSCode.

Un observador ajeno a la industria tecnológica expresó lo que muchos piensan: "Toda esta situación consume tanta energía mental y horas de trabajo reales que ya está afectando la entrega del trabajo que realmente puede ayudar a la empresa a ganar dinero."

Mientras toda la industria sigue inmersa en la narrativa de que "la IA lo reemplazará todo", un problema más realista ya ha surgido: la factura de la potencia de cálculo, al final, alguien tiene que pagarla. Y la "Tokenpocalypse" quizás sea solo el comienzo de este ajuste de cuentas.

热门币种推荐

你可能也喜欢

SemiAnalysis 万字拆解长鑫存储:500 亿美元营收,超级周期里的 IPO

长鑫存储即将在科创板上市,有望成为中国史上最大的半导体IPO。公司成立于2016年,通过收购破产的德国DRAM厂商奇梦达的专利与技术文档起步,并吸引了包括奇梦达、美光等公司的顶尖人才。在合肥市政府“耐心资本”近十年的持续输血与产业链支持下,长鑫于2025年首次实现年度盈利。 2026年,长鑫业绩迎来爆发式增长,一季度单季营收达73亿美元,预计全年营收可能超过500亿美元。这主要得益于当前DRAM行业的“超级周期”带来的价格上涨,而非市场份额的显著提升。按产能计,长鑫已是全球第四大DRAM厂商,并正在快速逼近美光。 然而,公司在高端HBM(高带宽内存)领域面临巨大挑战。其HBM技术仍不成熟,良率远低于行业巨头,且当前将稀缺产能分配给利润率更高的大宗DRAM产品在商业上更为合理。但由于美国出口管制限制先进HBM对华销售,中国对AI算力自主可控的强烈需求可能推动长鑫未来不得不加速HBM产能布局。 此次IPO计划募资约295亿元人民币,主要用于现有DRAM产能升级与研发,并未明确提及HBM项目。其复杂的股权结构显示,国有资本合计持股超过30%,是公司的核心支持力量。分析认为,当前IPO估值可能被显著低估。随着阿里巴巴等国内核心客户兼股东的支持,长鑫在国内市场需求方面具备独特优势,但与三星、SK海力士和美光的竞争将愈发激烈。

marsbit3分钟前

SemiAnalysis 万字拆解长鑫存储:500 亿美元营收,超级周期里的 IPO

marsbit3分钟前

从Corning到Ciena,AI光通信链条里的10倍股机会

本文分析了AI数据中心背景下,光通信产业链的投资机会。随着数据传输从800G向1.6T、3.2T升级,铜缆面临物理极限,光通信因距离更远、发热更低、能耗更小成为必然选择。文章指出,最大的投资机会往往在于整个产业链中不可或缺的供应商,而非单一明星公司。 文章重点梳理了产业链关键环节的代表公司: 1. **光纤与玻璃层**:**康宁(Corning)** 作为核心供应商,凭借技术优势获得Meta、亚马逊等巨头长期大额订单,其利润增速远超收入增长,显示定价权与规模效应。 2. **互连层**:**安费诺(Amphenol)** 通过并购扩张,在AI服务器连接器市场增长强劲,利润率提升且估值相对合理。**Credo Technology** 则扮演铜缆与光通信的桥梁角色,增长迅速但客户集中度高,风险较大。 3. **系统层**:**Ciena** 是相干光学龙头,其技术能让现有光纤承载更多数据,订单积压强劲,但估值已较高。 4. **上游材料与测试**:**AXT** 提供光激光器关键材料磷化铟晶圆,具有稀缺性,但面临中国出口管制等高风险。**VEO Solutions** 作为测试设备“卖铲人”,业务不受具体技术路线影响,随着光设备需求爆发而增长。 最后,文章提及了专注于光子学的主题ETF(代码FOTO)作为一键配置选择,但提醒其成立时间短、规模尚小。总结认为,铜转光是确定趋势,投资机会将沿整条光子产业链扩散。

marsbit15分钟前

从Corning到Ciena,AI光通信链条里的10倍股机会

marsbit15分钟前

新主席、旧通胀、超预期就业:沃什首秀后,全球资产如何重新定价?

上周,美联储新任主席凯文·沃什主持了上任后首次货币政策会议。会议决定维持利率不变,但政策声明被大幅简化,删除了前瞻指引等措辞。沃什强调,美联储不应过早承诺未来行动,而应让市场重新聚焦经济数据本身。这标志着一套新沟通框架的开始。 沃什面临的首要挑战仍是通胀。4月PCE通胀数据仍远高于2%目标,且通胀压力来源多元。与此同时,5月就业数据远超预期,强劲的就业市场反而加剧了市场对货币政策收紧的担忧,导致股市下跌。沃什接手的是一个在政策方向上存在内部分歧、且面临政治压力的美联储,建立内部共识是其重要考验。 会议释放的鹰派信号影响了全球资产定价。美元因加息预期升温而走强,美债收益率面临上行压力但亦受经济前景影响,黄金在利率与地缘风险间拉锯。AI基建等成长股板块面临估值压力,但若云厂商资本开支未收缩,产业逻辑依然成立。防务板块则因订单确定性而具有一定防御性。 展望未来,市场需重点关注数据:7月初的6月非农数据可能决定7月会议基调;7月中旬的6月CPI数据直接影响通胀判断;7月底的第二次FOMC会议将是沃什做出实质性政策选择的关键节点。此外,下半年美国中期选举带来的政治压力,也将持续考验美联储的独立性。

marsbit40分钟前

新主席、旧通胀、超预期就业:沃什首秀后,全球资产如何重新定价?

marsbit40分钟前

交易

现货
合约

热门文章

如何购买BILL

欢迎来到HTX.com!我们已经让购买Billions Network(BILL)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Billions Network(BILL)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Billions Network(BILL)购买完您的Billions Network(BILL)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Billions Network(BILL)在HTX的现货市场轻松交易Billions Network(BILL)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

582人学过发布于 2026.05.07更新于 2026.06.02

如何购买BILL

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对BILL(BILL)币价的意见。

活动图片