Claude刷爆5亿，一夜涨60倍，你的Token账单还撑得住？

marsbit發佈於 2026-06-01更新於 2026-06-01

文章摘要

近日，科技圈曝出多起因AI使用不当导致天价账单的案例。一家企业因未设置使用上限，一个月内在Claude上消耗高达5亿美元；另有谷歌云用户因API密钥泄露，一夜收到1.8万美元账单；OpenAI内部实验也曾单月烧掉130万美元。这些事件共同揭示：在智能体时代，失控的密钥、无休的AI任务或疏于管理的账户，都可能导致Token账单瞬间“爆仓”。背后原因是计费模式的转变。OpenAI、GitHub等平台正从包月制转向按Token用量计费，以应对智能体任务带来的成本差异——重度用户与轻度用户的消耗可能相差数个量级。新计费方式引发部分用户不满，有开发者晒出账单显示费用从几十美元飙升至数千美元，但亦有观点认为这能遏制滥用，促使资源合理分配。企业内部也存在“为用AI而用AI”的浪费现象。例如亚马逊员工曾为冲上内部AI使用排行榜，刻意刷高Token消耗。这种将使用量等同于绩效的误区，加剧了成本失控。面对高昂账单，市场开始出现优化方案。例如通过工具为AI提供精准上下文以减少冗余请求，或采用模型路由将任务智能分配至性价比更高的模型。研究表明，智能体任务的Token消耗可达普通任务的千倍，且更高消耗未必带来更好效果，成本预测往往偏低。当前，AI成本在一些企业中已逼近甚至超过人力成本，迫使管理者重新审视ROI。随着免费畅用的窗口期关闭，如何让每个Token发挥最大价值，成为开发者与企业必须精打细算的课题。未来胜出的，将是那些最先学会算好“Token账”的玩家。

1个月烧出5亿美元账单!

近日,科技圈曝出一桩惊天乌龙。据Axios报道,一家企业在短短1个月内,竟然在Claude上刷爆5亿美元!

原因令人哭笑不得:管理层在给员工开通Claude账号权限时,忘了设置使用额度上限。

其实,AI账单爆仓的远不止这一家。

今年4月,一名谷歌云用户因公开服务中遗留的API key被滥用,原本只有7美元预算的账户,一夜之间收到了1.8万美元的账单。

这个倒霉用户名叫Jesse Davies,是一名澳大利亚AI顾问、Agentic Labs创始人。他给自己的Google Cloud账户设了两道保险:一个10澳元(约7美元)的预算预警,一个1400美元的硬性消费上限。

据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,发了6万多个请求,两道保险都没拦住:账单计算有延迟,等系统反应过来,金额已经飙到了1.8万美元。

5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单130万美元。

他的团队只有三个人,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求。还好,这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI,这130万美元被当作一次内部实验:

测试如果不考虑Token成本,AI编程能跑到什么极限。他补充道,这是Codex「Fast Mode」(高速档计费)的结果,关掉之后大约30万美元。

更早一些,Uber的CTO Praveen Neppalli Naga也曾向The Information承认,公司4月份就把全年的Claude Code预算烧光了,他们的COO也公开表示,AI成本越来越「难以自圆其说」。

5亿、130万、1.8万,金额虽然差出几个数量级,却指向同一个事实:

在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,都能让你的Token账单一夜刷爆。

AI账单为什么会爆仓?

答案主要藏在计费方式的变化里。

从今年4月起,OpenAI的包月计费方式开始转向按Token用量计费。

4月2日,Codex计费从按消息估算改成按Token用量对齐:输入、缓存输入、输出三类Token分开算。4月23日,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了。

GitHub也紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑作废,换成AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率结算。

GitHub官方解释了这么做的原因:

现在一个快速的聊天提问,和一次跑好几小时的自主编码任务,用户花的钱一样多。GitHub一直在替那些跑重度任务的用户买单,但这套模式已经不可持续。

AI智能体崛起之前,聊天和补全成本差不多,月费兜得住。

智能体崛起之后,一次任务能连续跑几小时、改动整个代码库,重度用户和轻度用户的成本差可以拉到几个数量级。月费制在这种差距面前,直接崩了。

消息一出,Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图,直言新定价「就是个笑话」。原本28.12美元/月的开销,按新制要付746.01美元,他已决定退订,「这个价格,我自己租云服务器都还便宜」。

另一名用户截图更夸张,费用从50美元一路狂飙到3000美元,他说没想到定价这样离谱,「还有人继续订阅吗?」

不过也有Copilot老用户出来反驳:这些极端账单多半是vibe-coder(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。

一位老用户在评论区留言:「我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。」另一位则更直接:「就是有人要全自动的YOLO模式开发,让AI随便跑。这种浪费被剔除,对其他人反而是好事。」

有一点必须清楚:GitHub没有废除月费,基础订阅价格并没有变。真正变的是额外用量、智能体任务、更贵的模型调用,从此进入用量计费。

被冲击最大的,是那些靠Copilot跑长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费失守,一面是平台改了计费规则,另一面是用AI的人,自己也在拼命烧。

5月,Business Insider报道,Amazon下线了一个名叫KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称,这个榜单悄悄催生了一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不解决实际问题的Token消耗,纯粹为了排名。

事情曝出之后,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。」

这事虽然有点荒唐,但毫不意外。当「烧Token」能上榜,员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字:Tokenmaxxing(极限烧Token),把消耗量当生产力。

Axios的报道里也提到,有CTO发现员工拿AI模型查天气、写日常邮件,简单到不行的事,套上最贵的前沿模型,账单就能悄无声息地飞涨。

KiroRank并非Amazon官方考核体系,而是员工自发搭的非正式工具。但它清楚地暴露了一个经典的管理学规律:当KPI设错的时候,人就会用最聪明的方式钻空子。

把「用了多少」等同于「干得好不好」——这正是这一轮AI浪费的制度性根源。

算Token账的人,已经在赚钱

Token账单焦虑的另一面,有人悄悄把它做成了生意。

第一条路:用上下文喂饱AI。

Glean正是Arvind自家公司。它做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。

这套机制让Glean的年度营收15个月翻三倍,跨过3亿美元,客户包括Databricks、Reddit、Samsung。

第二条路:把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事:自动把每个任务派给最合适的模型,简单任务走便宜档,复杂任务走顶配。Arvind也讲过:路由做对了,能省10倍。

这两条路殊途同归:让AI干活,但别让它乱烧。

学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底怎么烧钱。

结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。

结论二:同一个任务跑多次,Token消耗能差出30倍。

结论三:更高的Token消耗,并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。

论文还发现,前沿模型连预测自己要烧多少Token都做不到,普遍低估真实成本。

你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准。

当AI账单开始赶超人力成本

「这是我记忆中第一次,技术成本开始和人力成本持平。」

5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios访谈里提到:对于他的团队来说,算力成本已经远远超过员工薪资。

类似的现象正在多家公司浮现:从做企业AI的Glean,到卖AI算力的英伟达,再到用AI的Uber,都在重新审视这笔账。

在Arvind看来,历史上技术只是企业整体成本里很小的一块,但现在AI成本已经能追平工资单了,很多企业的年度AI预算通常都是一到两个月就烧光。

过去一年,AI使用率是被崇拜的指标:多用就是先进,烧Token就是拥抱未来。现在,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?

免费包月畅用的窗口期,恰恰正在此时关上。

接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。

未来真正的赢家,毫无疑问将是最先学会算Token账的那个。

参考资料:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜歡

Chatbot烧钱三年，还是AI时代的“新大陆”吗？

过去几年，AI行业曾将Chatbot视为类似移动互联网超级入口的“新大陆”，但烧钱三年后，其商业化和可持续性面临严峻挑战。 OpenAI的ChatGPT虽拥有庞大用户，却陷入亏损，每收入1美元亏损1.22美元。国内豆包尝试付费也引发用户负面反馈。相比之下，Anthropic以企业服务为主（85%收入来自企业），年化收入已反超OpenAI，显示B端路径更清晰。用户真正需要的是能完成任务的AI助手，而非单纯聊天的对话窗口。 Chatbot的商业模式存在根本矛盾。它形似互联网产品，但底层经济学不同：每次推理都消耗高昂算力，用户越多成本越高，且缺乏网络效应和数据飞轮。其用户迁移成本低，护城河主要依赖模型能力，而随着各模型能力趋同，竞争可能沦为价格战。变现之路同样艰难。付费订阅率低（ChatGPT付费用户仅占5%），国内付费意愿更弱。广告模式则因Chatbot交互缺乏明确购买意图、答案形式单一、损害用户信任而难以奏效，Perplexity的失败便是例证。注意力经济在Chatbot上似乎失效——供给（算力）昂贵，用户注意力却短暂。数据表明Chatbot增长放缓，用户日均使用时长远低于主流App。其产品形态将AI能力局限在被动、回合制的“询问”，而未来方向是能多步“执行”的Agent。但若长出这些能力，它就不再是传统Chatbot。更可能的方向是AI不再需要独立App，而是嵌入现有应用（如微信）、操作系统或硬件。行业逐渐意识到，Chatbot可能只是通往AGI的中间形态。若继续固守“入口+流量”的旧地图，恐难找到真正的新大陆。未来的价值更可能在于AI作为底层能力，与各类产品和场景深度融合。

marsbit16 分鐘前

marsbit16 分鐘前

多链去中心化超额抵押稳定币USDD亮相2026年伊斯坦布尔区块链周

2026年伊斯坦布尔区块链周于6月2日至3日举行。多链去中心化超额抵押稳定币USDD在大会亮相，并与波场TRON设立联合展位，向与会者展示稳定币及Web3生态的最新发展成果。本届大会聚焦现实世界资产代币化、人工智能、稳定币、监管合规等关键议题，吸引了全球众多Web3机构及项目参与。USDD旨在借此盛会深化与全球Web3资源的连接，推动其生态的全球化拓展与应用落地。

marsbit50 分鐘前

marsbit50 分鐘前

TaiJi 完成 350 万美元战略融资，Castrum Capital、Becker Ventures 与 Coinvestor Ventures 参与投资

项目TaiJi近日宣布完成350万美元战略融资，投资方包括Castrum Capital、Becker Ventures和Coinvestor Ventures。本轮资金将主要用于产品研发、AI推演引擎升级、多Agent分析系统建设、市场数据基础设施完善、全球社区拓展及生态合作。 TaiJi致力于在BSC生态上构建一个AI驱动的链上市场智能网络。随着Web3市场进入更复杂、事件驱动的新阶段，平台旨在整合市场行情、链上资金、流动性变化、社媒情绪及项目动态等多维数据，并通过多Agent协同分析框架（如市场Agent、链上Agent、情绪Agent等），将碎片化信息转化为结构化的事件推演、影响路径、风险判断和观察指标，帮助用户更全面地理解市场。其第一阶段产品核心模块包括：实时市场情报聚合（Market Intelligence）、基于事件的AI情景推演引擎（Scenario Engine）、展示多维影响的可视化图谱（Impact Map）、风险信号识别（Risk Signals）以及个性化用户工作台（My TaiJi）。TaiJi强调其定位为智能分析工具，不托管用户资产、不提供交易服务或投资建议。通过此次融资，TaiJi将加速产品迭代与测试，逐步开放核心功能，并继续深化在BSC生态及全球Web3市场中的布局。

marsbit1 小時前

TaiJi 完成 350 万美元战略融资，Castrum Capital、Becker Ventures 与 Coinvestor Ventures 参与投资

marsbit1 小時前

黄仁勋、Marvell CEO同台对谈：未来AI拼的不是算力是连接，“能用铜就用铜，必须用光才用光”

在2024年台北Computex大会上，Marvell CEO Matt Murphy与特邀嘉宾英伟达CEO黄仁勋同台对谈，揭示了AI基础设施发展的核心趋势：连接（Connectivity）正取代算力与内存，成为定义系统性能的关键瓶颈。黄仁勋指出，“实用型AI”已经到来，能够盈利的AI工作负载（如智能体Agent）催生了海量需求，使得分布式计算集群中的互联变得至关重要。他高度评价Marvell，称其为“下一个万亿美元公司”。双方深入探讨了从铜缆向光纤过渡的路线图。黄仁勋提出了明确策略：“能用铜就用铜，必须用光才用光”。由于铜缆存在带宽与距离的物理极限（例如400Gbps时难以覆盖整个机架），而光通信则不受此限，因此未来5-10年将是铜缆与光器件并存的时期。Murphy解释，铜缆的物理瓶颈（“铜墙”）正在移动，这将引爆光通信需求。为此，Marvell正重注共封装光学（CPO）等前沿技术，以解决密度和功耗问题，并在大会上发布了专为AI数据中心设计的100T以太网交换机。Marvell凭借覆盖从毫米级芯片互联到公里级数据中心互联的完整技术组合，确立了其在连接领域的领导地位。此外，双方强调了通过NV Link Fusion等技术实现的深度战略合作（英伟达已向Marvell投资20亿美元），旨在构建解耦、异构的数据中心，满足云服务商的定制化需求。Murphy将Marvell定位为AI时代的“瑞士”，与所有计算和存储公司深度合作。最终，两位领袖展望了全光互连的未来。当距离不再受限，数据中心架构将发生根本性变革，计算、内存等资源可以被池化并动态组合，从而构建出完全由工作负载需求定义、而非由连接限制定义的“无距离数据中心”。

marsbit1 小時前

黄仁勋、Marvell CEO同台对谈：未来AI拼的不是算力是连接，“能用铜就用铜，必须用光才用光”

marsbit1 小時前

美股期权数据亮红灯：上次出现这种信号是2022年熊市前夕

美国股市期权市场的一项关键预警指标跌至近四年低位，与2022年熊市启动前的水平高度吻合，引发市场警惕。Cboe股票看跌/看涨比率的五日移动均线降至0.452，意味着看涨期权需求远超看跌期权，显示出极端的看涨情绪。分析人士指出，这与2021年末市场见顶及2022年熊市反弹高峰时的情形相似，历史经验表明此后可能出现持续性下跌。尽管该指标亮起红灯，市场多头势头未减，美股三大指数本周一仍刷新历史收盘纪录。然而，市场内部出现显著分化：整体波动率指标VIX保持低位，但单只股票的隐含波动率却大幅攀升至近一年高位，两者价差创下历史纪录。这反映出当前上涨主要由人工智能等少数科技股推动，市场广度不足。专家认为，当前读数虽非直接卖出信号，但已显示散户情绪在AI热潮下过于亢奋，风险偏好接近极端水平，投资者应保持审慎。

marsbit1 小時前

marsbit1 小時前

交易

現貨

合約

Claude刷爆5亿，一夜涨60倍，你的Token账单还撑得住？

文章摘要

AI账单为什么会爆仓?

被自己人玩坏的排行榜

算Token账的人,已经在赚钱

当AI账单开始赶超人力成本

相關問答

你可能也喜歡

Chatbot烧钱三年，还是AI时代的“新大陆”吗？

多链去中心化超额抵押稳定币USDD亮相2026年伊斯坦布尔区块链周

TaiJi 完成 350 万美元战略融资，Castrum Capital、Becker Ventures 与 Coinvestor Ventures 参与投资

黄仁勋、Marvell CEO同台对谈：未来AI拼的不是算力是连接，“能用铜就用铜，必须用光才用光”

美股期权数据亮红灯：上次出现这种信号是2022年熊市前夕

交易

熱門文章

如何購買BILL

相關討論

熱門問答

熱門分類

熱門標籤