当 Token 比人更贵,「AI 叙事」就碰到麻烦了

marsbit發佈於 2026-05-29更新於 2026-05-29

文章摘要

企业AI支出正面临成本与价值不匹配的严峻挑战。Uber和微软等公司高管公开表示,持续攀升的Token消耗并未带来相应的产品实质改善或明确的商业回报,甚至出现了为消耗而消耗的“Token极大化”现象。 数据显示,AI应用成本高企而效率堪忧:Uber工程师人均月度账单差异巨大,一次演示可能消耗1200美元;GitHub Copilot转向按用量计费引发用户不满;研究指出,企业每投入1美元AI费用,仅18美分产生用户价值,大量消耗用于修复AI自身引入的问题。与此同时,Token价格和AI软件价格持续上涨。 市场观点出现分歧。乐观者认为这是转型阵痛,未来Token消耗将转向更健康的“单位有效行动成本”衡量,真实生产力提升正在发生,且当前科技巨头估值远低于历史泡沫水平。悲观者则指出,AI供应链价值过度集中于半导体公司(如英伟达利润激增),而云服务商举债投资,多数企业投资回报为零,这种脱节难以持续。 更深层的隐忧在于超大规模云服务商与AI实验室(如OpenAI、Anthropic)之间复杂的循环融资结构。云厂商既是AI实验室的投资方,又是其算力供应商,其大量云收入承诺与AI实验室的融资能力绑定。一旦融资放缓,整个链条可能面临断裂风险。 当前并非典型的科技泡沫,AI技术真实且对部分用户有效。但核心矛盾已从“技术是否可行”转变为“经济上是否可持续”。企业使用AI节省的成本,能否覆盖并超越实验室和云巨头高昂的运营与估值成本,成为关键问题。过去单纯以Token消耗量衡量成功的叙事已破灭,AI的账单已经到期,最终由谁来为价值买单,仍是未知数。

撰文:鲍奕龙

来源:华尔街见闻

企业 AI 支出的合理性正受到严峻考验,Token 消耗量持续攀升,但可量化的商业价值却难觅踪影。

5 月 22 日,市值逾 2000 亿美元的 Uber 首席运营官 Andrew Macdonald 在一档播客中公开表示,词元(Token)消耗的增长与产品的实质改善之间,「这条线还不存在」。

Macdonald 指出,公司越来越难以为持续攀升的 AI 支出做出合理解释。他甚至为工程团队内部的浪费现象专门造了一个词:「tokenmaxxing」(Token 极大化)。

此前 5 月中旬,微软以 Token 账单「难以为继」为由,开始削减内部 Claude Code 授权许可。

两则事件叠加,令市场不得不正视一个此前被忽视的变量。Token 经济学,即企业规模下 Token 消耗的单位经济性,已从一个边缘议题,升格为整个 AI 投资论题的核心承重柱。

五组数据,拼出一幅新图景

自 4 月以来,多组数据接连落地,共同勾勒出一幅令人警觉的画面。

今年 4 月,Uber 首席技术官公开表示,公司在四个月内烧完了全年 Claude Code 预算。

5000 名工程师中,月使用率在 84% 至 95% 之间,人均月度账单从 150 美元到 2000 美元不等,该 CTO 本人在一次时长两小时的内部演示中据报消耗了价值 1200 美元的词元。

Macdonald 形容得知这一数字时「简直震惊得说不出话来」。

微软方面,据 The Verge 旗下 Tom Warren 的 Notepad 通讯报道,Claude Code 在微软内部工程师群体中迅速流行,但基于 Token 的计费模式使得规模化支出难以为继,微软随即着手削减相关授权。

GitHub 宣布自 6 月 1 日起,所有 Copilot 计划从固定订阅制转向按用量计费。

官方讨论帖收获近 900 个反对票,原因在于有用户测算,一次智能体编程会话通常消耗 30 至 40 美元,意味着一个月费 10 美元的套餐在单次使用中即告耗尽。

开发者生产力平台 Entelligence.AI 汇总了 2444 家企业的数据后发现:

  • 每投入 1 美元的 AI Token 费用,仅有 18 美分产生了触达用户的实际价值。
  • 44 美分用于修复 AI 自身引入的 Bug;27 美分流向返工;11 美分消耗于审查摩擦。

据彭博 Silicon Data LLM Token Expenditure Index,Token 价格自今年 2 月底以来已上涨约 65%,美国 AI 软件价格过去一年累计涨幅达 20% 至 37%。

多空之争:同一事实,两种解读

相同的数据,在不同分析框架下指向截然不同的结论。

多头观点认为,当前乱局不过是一次成功转型的阵痛期。

据高盛的 Jim Schneider 在 5 月初的研判,到 2030 年,代理式 AI 将推动词元消耗量增长 24 倍,达到每月约 120 万亿亿个词元,超大规模云服务商和模型提供商的毛利率将在未来 3 至 12 个月内转正。

高盛的 Rich Privorotsky 则认为,2026 年第一季度或许已是「词元最大化」作为 KPI 的顶峰,行业正在从追求消耗量转向「单位有效行动成本」这一更健康的衡量维度。

摩根大通的经济研究也发现,2026 年初 Python 新增及更新包在 PyPI 上出现跳升式增长,而这一趋势在 2022 年 ChatGPT 上线时并未出现,表明真实的生产力提升正在发生。

此外,Mag 7 当前市盈率约为 20 倍远期盈利,远低于 2000 年科技泡沫顶峰的 52 倍、1989 年日本的 67 倍和「漂亮 50」时代的 34 倍。以历史泡沫的衡量标准看,当前并不构成泡沫。

空头观点由高盛半导体分析师 Jim Covello 在 4 月的报告中最为系统地阐述。

他指出,AI 供应链中几乎所有价值都流向了半导体公司,这一现象在历史上前所未有且不可持续,芯片公司本应在客户获益时受益,而本轮周期中,它们的繁荣是以整条产业链上游的消耗为代价的。

英伟达净利润自 ChatGPT 上线以来增长约 20 倍;各大超大规模云服务商已烧完经营性现金流,转而举债——2025 年数据中心相关债务发行规模约 1820 亿美元,较 2024 年翻倍。

MIT Nanda 研究显示,95% 投资生成式 AI 的企业回报为零。这种脱钩或许可以维持一段时间,但无法永远持续。

循环融资结构的隐忧

这场讨论还涉及一个更为复杂的层面:超大规模云服务商与 AI 实验室之间的财务循环。

据 The Information 汇编的企业披露文件,OpenAI 和 Anthropic 合计占微软、甲骨文、谷歌和亚马逊约 2 万亿美元未来云服务承诺的逾半数。具体而言:

  • 微软 6270 亿美元云服务积压订单中,2800 亿美元与 OpenAI 绑定;
  • 甲骨文 5530 亿美元管道业务中,54%(约 3000 亿美元)由 OpenAI 承诺;
  • 谷歌 4676 亿美元中,Anthropic 占比 43%(约 2000 亿美元);
  • 亚马逊相应敞口亦达其 4640 亿美元积压的 51%。

这一融资结构具有内生循环性。微软向 OpenAI 的 130 亿美元投资主要以 Azure 积分形式兑现,OpenAI 将其用于购买 Azure 算力,微软随即将其计入云收入。

同样的超大规模云服务商,既是 AI 实验室的股权投资方,也是收取算力账单的服务供应商。

这一结构还体现在盈利数据上。Alphabet 公布创纪录的 626 亿美元第一季度利润,其中约 287 亿美元,近半数来自 Anthropic 持股的账面升值。

亚马逊 303 亿美元第一季度利润中,168 亿美元为 Anthropic 的税前未实现收益,而其自由现金流,因同期数据中心资本支出达 442 亿美元,而暴跌 95% 至 12 亿美元。

这一体系的可持续性,取决于 AI 实验室持续获得外部融资以兑现云计算承诺的能力,而后者又依赖于企业客户持续愿意支付攀升的 Token 账单。

据报道,Anthropic 目前每收入 1 美元,成本高达 3 美元。一旦融资节奏放缓,云收入预测的可信度将随之下降,超大规模云厂商的估值倍数亦将面临重估压力。

这条链条双向传导,也将双向断裂。

这不是 1999,但问题真实存在

当前的处境并不构成一场典型的泡沫设定。

从估值倍数来看,科技七巨头目前对应约 20 倍远期市盈率,远低于 2000 年科技泡沫顶峰时 52 倍、1989 年日本市场 67 倍或「漂亮 50」时代 34 倍的水平。

AI 技术本身是真实的。对于重度用户群体而言,生产力提升的数据也是可验证的。OpenAI 年化收入约 200 亿美元,Anthropic 约 43 亿美元,两家实验室不会就此消失。

如今,Token 成本(算力开销)已成为决定 AI 成败的关键,而在半年前,大家甚至不怎么聊这个话题。

那时候大家只关心「技术行不行」。现在答案很明确:在特定工作和特定人群眼里,技术确实行。

但新问题来了:下游企业用 AI 省下的钱,能不能及时传导上去,跑赢资本市场留给 AI 实验室和云巨头的估值窗口?

看好 AI 的人认为,只要技术继续成熟,企业的 ROI(投资回报率)在 1 到 1.5 年内就能转正。

看衰的人则认为,会有更多高管像麦克唐纳那样,公开抱怨 AI 投入产出比太低并开始砍预算。

这两种可能都在发生,胜负未分。唯一可以确定的是,过去那种「只要 Token 消耗量在涨,就说明 AI 转型成功」的谎言破灭了。

词元消耗量大不等于有商业价值,这两个泡沫终究要挤掉。AI 的账单已经到期,但最后谁来掏这个钱?目前还是个未知数。

相關問答

Q文章中提到Uber首席运营官对AI Token消耗持何种态度?

AUber首席运营官Andrew Macdonald公开表示,Token消耗的增长与产品的实质改善之间“这条线还不存在”,并且公司越来越难以为持续攀升的AI支出做出合理解释。他甚至为内部的浪费现象创造了“tokenmaxxing”(Token极大化)一词。

Q根据Entelligence.AI的数据,企业AI Token费用中实际产生用户价值的比例是多少?

A根据Entelligence.AI汇总的数据,每投入1美元的AI Token费用,仅有18美分产生了触达用户的实际价值。其余大部分用于修复AI引入的Bug(44美分)、返工(27美分)和审查摩擦(11美分)。

Q高盛分析师对于AI Token消耗的未来趋势有何预测?

A高盛分析师Jim Schneider研判,到2030年,代理式AI将推动Token消耗量增长24倍,达到每月约120万亿亿个。同时,他的同事Rich Privorotsky认为,行业正在从追求消耗量转向关注“单位有效行动成本”这一更健康的衡量维度。

Q文章指出的AI供应链循环融资结构是什么?

A这是一个内生的循环结构:超大规模云服务商(如微软)向AI实验室(如OpenAI)提供股权投资(多以云服务积分形式兑现),实验室用这些积分购买云服务商的算力,而云服务商则将这部分算力消费计入自己的收入。这形成了一个相互依赖的融资和收入循环。

Q文章认为当前AI发展面临的核心矛盾是什么?

A核心矛盾在于:AI技术的有效性和生产力提升在特定领域已得到验证,但其高昂的Token成本(算力开销)正成为制约其商业化和规模化应用的关键。下游企业通过使用AI节省的成本,能否及时、足够地传导回上游,以支撑AI实验室和云巨头的持续投入和估值,是当前的主要问题。过去的“Token消耗量增长等于成功”的叙事已经破灭,AI的商业模式和投资回报率(ROI)正面临严峻考验。

你可能也喜歡

Claude Code 推出动态工作流:让AI学会自己组队干活

Claude Code 推出了动态工作流(workflows)功能,使AI能够根据任务动态组建多个智能体(Agent)团队协同工作,从而解决复杂的长周期任务。 该功能的核心价值在于,它改变了Claude Code原有的“单智能体在单一上下文内规划并执行”的模式。通过动态工作流,Claude可以将任务拆解,分派给多个拥有独立上下文的子智能体并行处理、交叉验证甚至彼此竞争,最后综合结果。这有效缓解了单智能体在处理长任务时常见的“智能体惰性”(提前宣布完成)、“自我偏好偏差”(倾向认可自己的结论)和“目标漂移”(逐渐偏离原始目标)等问题。 动态工作流通过执行一个包含特殊函数的JavaScript文件来协调子智能体。它支持多种实用模式,例如:将任务分类后路由给不同智能体;将任务拆分为多个小步骤并行处理再综合(扇出并综合);生成多个方案后通过锦标赛机制竞争筛选;以及进行对抗式验证等。 其应用场景显著超越了传统的代码任务,扩展至非技术领域。示例包括:代码迁移与重构、深度研究与事实核查、对大量简历或工单进行排序、从历史会话中提炼行为规则、进行事故根因调查、对积压任务进行大规模分诊,以及在命名、设计等需要探索和品味判断的任务中生成并筛选方案。 文章也指出,动态工作流并非万能。它通常会消耗更多token,因此不适合所有常规编程任务。最佳实践仍在形成中,开发者需要根据任务复杂度判断是否使用。用户可以通过详细提示(prompt)设计工作流,并结合 `/goal` 和 `/loop` 等指令,或设置token使用预算来优化效果。创建的工作流可以保存、共享甚至通过技能(skill)进行分发。 总的来说,动态工作流标志着Claude Code从一个代码助手向一个可编排的智能体工作台演进。未来AI工具的竞争力,可能不仅在于单个模型的智能程度,更在于其组织可靠、可复用执行流程的能力。

marsbit12 分鐘前

Claude Code 推出动态工作流:让AI学会自己组队干活

marsbit12 分鐘前

Hyperliquid,华尔街全天候交易便利店

《华尔街日报》报道,去中心化加密交易平台Hyperliquid已成为华尔街交易者,尤其是短线操作者的重要工具。其核心优势在于提供全年无休、全天候交易服务,允许投资者在美股休市(如周末)时提前建仓或平仓,以捕捉如地缘政治事件等带来的市场波动。对冲基金交易员Vala Zeinali分享了他利用该平台在中东冲突消息发布后,及时交易原油衍生品并获得高额回报的经历。 平台由前高频交易员Jeff Yan创立,旨在提供高性能且用户自主托管资产的交易系统,以应对类似FTX破产的风险。尽管公司仅有11名员工,但其业务增长迅速,去年营收约8亿美元,其原生代币HYPE市值已达约160亿美元。 Hyperliquid提供多样化的交易标的,包括比特币、标普500指数、原油以及SpaceX等未上市公司的永续合约,吸引了大量传统金融和加密领域资金。平台的高杠杆特性也意味着高风险,曾在市场剧烈波动时导致巨额爆仓。 目前,美国用户虽被协议禁止使用,但仍有人通过VPN访问。平台吸引力还在于其简洁的界面、丰富的产品以及活跃的社区文化,用户甚至可以直接与创始团队互动。Hyperliquid计划未来拓展至预测市场和期权交易领域,其终极目标是整合所有金融业务。然而,监管机构警告,永续合约结构复杂,面向散户的风险披露可能不足,存在隐患。

marsbit12 分鐘前

Hyperliquid,华尔街全天候交易便利店

marsbit12 分鐘前

谁为代理提供资金?

文章探讨了人工智能代理支付领域的关键问题:治理层的价值与竞争。OpenAI曾因缺乏清晰的购物规则(如退货、防欺诈)而关闭代理购物功能,这凸显了治理(支出控制、身份验证、政策执行)在代理经济中的核心地位。 目前,代理支付平均金额仅31美分,传统支付手续费(如Stripe)使得利润微薄,这为低成本的加密货币结算层(如Layer-2稳定币支付)创造了机会。Coinbase的x402协议和Stripe等公司推出的机器支付协议(MPP)正在争夺支付基础设施的主导权。 然而,真正的价值不仅在于处理交易,更在于管理资金流动的规则,即治理层。钱包(如Stripe收购的Privy)因其处在资金流动的关键节点,成为实施消费限额和审批的理想治理层。Stripe、Coinbase等巨头正通过垂直整合技术栈(覆盖结算、钱包、协议、治理等层面)来建立竞争优势。它们通过投资或收购治理初创公司,确保无论治理功能是内嵌还是独立,都能获利。 分析指出,支付处理终将商品化,价值会向上转移到决定交易能否发生的治理环节。预计到2030年,AI代理交易额可达3-5万亿美元,即使收取很低的治理费率,也能产生数十亿美元收入,堪比Coinbase目前的年订阅服务总收入。因此,在钱包、结算和治理层进行垂直整合,通过浮动余额收益、结算费用和合规费用多元获利,将是企业在代理支付时代保持竞争力的关键商业模式。

marsbit40 分鐘前

谁为代理提供资金?

marsbit40 分鐘前

交易

現貨
合約

熱門文章

如何購買PEOPLE

歡迎來到HTX.com!在這裡,購買ConstitutionDAO (PEOPLE)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買ConstitutionDAO (PEOPLE)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的ConstitutionDAO (PEOPLE)購買ConstitutionDAO (PEOPLE)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易ConstitutionDAO (PEOPLE)在HTX的現貨市場輕鬆交易ConstitutionDAO (PEOPLE)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

762 人學過發佈於 2024.12.12更新於 2026.06.02

如何購買PEOPLE

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 PEOPLE (PEOPLE)幣價的意見。

活动图片