Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

marsbit發佈於 2026-06-01更新於 2026-06-01

文章摘要

近日,科技圈曝出多起因AI使用不当导致天价账单的案例。一家企业因未设置使用上限,一个月内在Claude上消耗高达5亿美元;另有谷歌云用户因API密钥泄露,一夜收到1.8万美元账单;OpenAI内部实验也曾单月烧掉130万美元。这些事件共同揭示:在智能体时代,失控的密钥、无休的AI任务或疏于管理的账户,都可能导致Token账单瞬间“爆仓”。 背后原因是计费模式的转变。OpenAI、GitHub等平台正从包月制转向按Token用量计费,以应对智能体任务带来的成本差异——重度用户与轻度用户的消耗可能相差数个量级。新计费方式引发部分用户不满,有开发者晒出账单显示费用从几十美元飙升至数千美元,但亦有观点认为这能遏制滥用,促使资源合理分配。 企业内部也存在“为用AI而用AI”的浪费现象。例如亚马逊员工曾为冲上内部AI使用排行榜,刻意刷高Token消耗。这种将使用量等同于绩效的误区,加剧了成本失控。 面对高昂账单,市场开始出现优化方案。例如通过工具为AI提供精准上下文以减少冗余请求,或采用模型路由将任务智能分配至性价比更高的模型。研究表明,智能体任务的Token消耗可达普通任务的千倍,且更高消耗未必带来更好效果,成本预测往往偏低。 当前,AI成本在一些企业中已逼近甚至超过人力成本,迫使管理者重新审视ROI。随着免费畅用的窗口期关闭,如何让每个Token发挥最大价值,成为开发者与企业必须精打细算的课题。未来胜出的,将是那些最先学会算好“Token账”的玩家。

1个月烧出5亿美元账单!

近日,科技圈曝出一桩惊天乌龙。据Axios报道,一家企业在短短1个月内,竟然在Claude上刷爆5亿美元!

原因令人哭笑不得:管理层在给员工开通Claude账号权限时,忘了设置使用额度上限。

其实,AI账单爆仓的远不止这一家。

今年4月,一名谷歌云用户因公开服务中遗留的API key被滥用,原本只有7美元预算的账户,一夜之间收到了1.8万美元的账单。

这个倒霉用户名叫Jesse Davies,是一名澳大利亚AI顾问、Agentic Labs创始人。他给自己的Google Cloud账户设了两道保险:一个10澳元(约7美元)的预算预警,一个1400美元的硬性消费上限。

据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,发了6万多个请求,两道保险都没拦住:账单计算有延迟,等系统反应过来,金额已经飙到了1.8万美元。

5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单130万美元。

他的团队只有三个人,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求。还好,这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI,这130万美元被当作一次内部实验:

测试如果不考虑Token成本,AI编程能跑到什么极限。他补充道,这是Codex「Fast Mode」(高速档计费)的结果,关掉之后大约30万美元。

更早一些,Uber的CTO Praveen Neppalli Naga也曾向The Information承认,公司4月份就把全年的Claude Code预算烧光了,他们的COO也公开表示,AI成本越来越「难以自圆其说」。

5亿、130万、1.8万,金额虽然差出几个数量级,却指向同一个事实:

在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,都能让你的Token账单一夜刷爆。

AI账单为什么会爆仓?

答案主要藏在计费方式的变化里。

从今年4月起,OpenAI的包月计费方式开始转向按Token用量计费。

4月2日,Codex计费从按消息估算改成按Token用量对齐:输入、缓存输入、输出三类Token分开算。4月23日,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了。

GitHub也紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑作废,换成AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率结算。

GitHub官方解释了这么做的原因:

现在一个快速的聊天提问,和一次跑好几小时的自主编码任务,用户花的钱一样多。GitHub一直在替那些跑重度任务的用户买单,但这套模式已经不可持续。

AI智能体崛起之前,聊天和补全成本差不多,月费兜得住。

智能体崛起之后,一次任务能连续跑几小时、改动整个代码库,重度用户和轻度用户的成本差可以拉到几个数量级。月费制在这种差距面前,直接崩了。

消息一出,Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图,直言新定价「就是个笑话」。原本28.12美元/月的开销,按新制要付746.01美元,他已决定退订,「这个价格,我自己租云服务器都还便宜」。

另一名用户截图更夸张,费用从50美元一路狂飙到3000美元,他说没想到定价这样离谱,「还有人继续订阅吗?」

不过也有Copilot老用户出来反驳:这些极端账单多半是vibe-coder(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。

一位老用户在评论区留言:「我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。」另一位则更直接:「就是有人要全自动的YOLO模式开发,让AI随便跑。这种浪费被剔除,对其他人反而是好事。

有一点必须清楚:GitHub没有废除月费,基础订阅价格并没有变。真正变的是额外用量、智能体任务、更贵的模型调用,从此进入用量计费。

被冲击最大的,是那些靠Copilot跑长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费失守,一面是平台改了计费规则,另一面是用AI的人,自己也在拼命烧。

5月,Business Insider报道,Amazon下线了一个名叫KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称,这个榜单悄悄催生了一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不解决实际问题的Token消耗,纯粹为了排名。

事情曝出之后,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。」

这事虽然有点荒唐,但毫不意外。当「烧Token」能上榜,员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字:Tokenmaxxing(极限烧Token),把消耗量当生产力。

Axios的报道里也提到,有CTO发现员工拿AI模型查天气、写日常邮件,简单到不行的事,套上最贵的前沿模型,账单就能悄无声息地飞涨。

KiroRank并非Amazon官方考核体系,而是员工自发搭的非正式工具。但它清楚地暴露了一个经典的管理学规律:当KPI设错的时候,人就会用最聪明的方式钻空子

把「用了多少」等同于「干得好不好」——这正是这一轮AI浪费的制度性根源。

算Token账的人,已经在赚钱

Token账单焦虑的另一面,有人悄悄把它做成了生意。

第一条路:用上下文喂饱AI。

Glean正是Arvind自家公司。它做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。

这套机制让Glean的年度营收15个月翻三倍,跨过3亿美元,客户包括Databricks、Reddit、Samsung。

第二条路:把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事:自动把每个任务派给最合适的模型,简单任务走便宜档,复杂任务走顶配。Arvind也讲过:路由做对了,能省10倍

这两条路殊途同归:让AI干活,但别让它乱烧

学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底怎么烧钱。

结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。

结论二:同一个任务跑多次,Token消耗能差出30倍。

结论三:更高的Token消耗,并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。

论文还发现,前沿模型连预测自己要烧多少Token都做不到,普遍低估真实成本。

你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准

当AI账单开始赶超人力成本

「这是我记忆中第一次,技术成本开始和人力成本持平。」

5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios访谈里提到:对于他的团队来说,算力成本已经远远超过员工薪资。

类似的现象正在多家公司浮现:从做企业AI的Glean,到卖AI算力的英伟达,再到用AI的Uber,都在重新审视这笔账。

在Arvind看来,历史上技术只是企业整体成本里很小的一块,但现在AI成本已经能追平工资单了,很多企业的年度AI预算通常都是一到两个月就烧光。

过去一年,AI使用率是被崇拜的指标:多用就是先进,烧Token就是拥抱未来。现在,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?

免费包月畅用的窗口期,恰恰正在此时关上。

接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。

未来真正的赢家,毫无疑问将是最先学会算Token账的那个。

参考资料:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

本文来自微信公众号“新智元”,作者:ASI启示录

相關問答

Q文章中提到哪个企业在短短一个月内因未设置使用额度上限,在Claude上刷爆了5亿美元账单?

A文章中提到一家未具名的企业,因管理层在给员工开通Claude账号权限时忘了设置使用额度上限,导致在短短一个月内刷爆了5亿美元账单。

QGitHub Copilot的计费方式从2026年6月1日起将发生什么重大变化?

AGitHub Copilot将从2026年6月1日起,所有套餐从包月计费转向按实际Token用量计费。旧的‘高级请求’逻辑将被废除,转而采用AI额度,并根据输入Token、输出Token和缓存Token的实际消耗,对照每个模型的API费率进行结算。

Q根据文章,导致AI账单爆仓(失控)的主要原因有哪些?(请列出至少两个)

A根据文章,导致AI账单爆仓的主要原因包括:1. 计费方式从包月制转向按Token用量计费,使重度智能体用户成本飙升。2. 内部管理疏忽,如未设置使用额度上限或API密钥泄露被滥用。3. 员工行为,如为了在内部排行榜上刷排名而浪费Token(Token maxxing现象),或使用昂贵模型处理简单任务。

Q文章中提到,哪篇学术论文首次系统拆解了智能体编码任务的成本构成?它得出了哪三个主要结论?

A文章提到一篇2026年4月的arXiv论文首次系统拆解了智能体编码任务的成本。主要结论是:1. 智能体任务的Token消耗可达普通代码推理的上千倍,主要推高成本的是输入Token。2. 同一任务跑多次,Token消耗能差出30倍。3. 更高的Token消耗并不必然带来更高准确率,精度往往在中等成本处见顶,再往上烧钱效果会饱和。

QGlean公司的CEO Arvind Jain在采访中提出了一个关于企业成本的重要观察是什么?

AGlean公司的CEO Arvind Jain在采访中指出,AI成本已经增长到能够追平甚至赶超人力成本的程度,这是他记忆中第一次技术成本开始和人力成本持平。许多企业的年度AI预算常常在一到两个月内就迅速耗尽。

你可能也喜歡

脱钩时代来临,比特币不再是加密的唯一罗盘

文章指出,加密市场正告别以比特币为单一风向标的时代,分化为“内生型”和“外生型”两大资产阵营。 内生型资产(如比特币和多数传统加密货币)的价值仍与加密市场整体行情深度绑定。而外生型资产的崛起成为新趋势,其价值主要依托自身业务的真实需求和基本面,日益独立于比特币价格波动。 例如,Hyperliquid作为混合型案例,其部分合约交易已转向非加密资产。Venice等项目则完全脱离加密市场,其商业模式更接近消费级AI服务,收入来自用户为AI推理付费。Figure公司利用区块链技术提升贷款效率,其核心价值在于金融科技业务本身。 此外,稳定币等赛道的企业收购与高增长(如BVNK、Bridge),也显示了其发展与加密牛熊周期的脱钩。 这一转变意味着行业分析逻辑的根本改变:研究外生型资产需要像分析传统企业一样,专注于用户群体、经济模型和行业护城河等基本面,而非紧盯比特币价格。文章列举了多个具备潜力的外生型赛道,包括链上金融服务、AI与加密融合、新型数字银行、支付、非金融消费产品等。 目前,投资相关企业股权仍是主要途径,代币机制仍需优化。但核心趋势已定:加密市场的驱动力正变得多元,行业研究重心将从解读比特币图表转向深耕企业基本面。未来,加密市场齐涨共跌的局面或将不再。

marsbit40 分鐘前

脱钩时代来临,比特币不再是加密的唯一罗盘

marsbit40 分鐘前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

比特币主导着市场走向,但随着其市值增长,分析师普遍认为下一周期最高的百分比涨幅将来自具有更高增长潜力的资产。尽管比特币可能稳步上涨,但一些加密货币——从成熟平台到新兴的AI基础设施项目——有望实现相对于比特币的超额回报。 以下是分析师认为在百分比涨幅上可能超越比特币的五种资产,其中Ozak AI被视为本周期增长潜力最大的黑马。 **Ozak AI ($OZ)**:这是一款处于预售阶段(价格0.014美元)的AI基础设施代币,目标是上市价格达到1美元。它正在构建一个完整的AI原生区块链生态系统,包括用于AI预测的预测代理、实时数据交付网络、共享安全层、可扩展执行层以及结构化AI数据集。其极低的起始估值意味着其具备比特币难以比拟的增长倍数潜力。 **以太坊 (ETH)**:作为主导性的智能合约平台,以太坊支撑着DeFi、资产代币化和Layer-2扩展。由于其网络活动和费用生成能力以及机构采用,分析师认为其相对上涨弹性仍优于比特币的价值存储模式。 **Solana (SOL)**:其高吞吐量、低费用和不断扩展的开发者生态,使其在流动性回归时能够迅速增长。历史上SOL在风险偏好改善时展现过大幅超越比特币的能力。 **Chainlink (LINK)**:作为领先的预言机提供商,LINK处于DeFi、代币化资产乃至AI驱动区块链应用的中心。其对整个加密经济的杠杆效应使其常在扩张周期中实现强劲的百分比涨幅。 **Avalanche (AVAX)**:其子网架构和对企业友好的设计,使其在Layer-1平台中具有独特地位。随着现实世界资产代币化和机构区块链部署的增长,AVAX有望获得不成比例的利益。 **总结**:比特币的上涨需要巨大的资金流入,而像Ozak AI这样的早期阶段资产,其估值重估速度可以非常快。随着市场周期加速,资本可能轮动到以AI为重点的早期基础设施代币中,以寻求最高的增长潜力。对于寻求平衡稳定性和指数级上行潜力的投资者而言,Ozak AI可能成为增长最快的领域。

TheNewsCrypto1 小時前

在下一周期,由于更高的增长速度,这五种加密货币可能超越比特币表现

TheNewsCrypto1 小時前

黄仁勋的「Agent工厂」里,装了什么新故事?

在COMPUTEX 2026期间,英伟达CEO黄仁勋发表了主题演讲,核心聚焦于“Agent AI”时代的到来。此次发布的关键在于,英伟达正围绕智能体生态,构建从芯片、数据中心到软件平台的全栈技术体系。 硬件层面,专为Agent工作负载设计的Vera Rubin平台已进入量产,其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。该平台引入共封装光学(CPO)网络技术以降低能耗,并强化了机密计算安全能力。同时,英伟达推出了新型处理器“Vera” CPU,这是首款为AI智能体设计的CPU,与Rubin GPU通过高速NVLink互联,优化了Agent任务中的数据传递。 软件与模型方面,英伟达推出“AI工厂运营工具箱”DSX,整合了设计、仿真、建设到运营的全流程。发布了5500亿参数的混合专家模型Nemotron 3 Ultra,以及配套的NemoClaw、OpenShell等工具,旨在帮助企业构建能安全接入业务流程的“数字同事”。此外,面向物理AI的世界基础模型Cosmos 3正式发布,它能统一理解、生成和预测物理世界信息。 在物理AI领域,英伟达联合宇树发布了基于Isaac GR00T平台的人形机器人参考设计H2 Plus,旨在降低开发门槛。还开源了一套物理AI技能工具集,让智能体能直接调用标准化操作。 产品布局上,推出了“DGX Station for Windows”桌面AI超算工作站,让Agent能在企业本地Windows环境中安全运行。并与微软合作推出基于Arm架构的RTX Spark SoC,瞄准AI PC市场。 最后,英伟达升级了AI原生存储架构,在BlueField-4 STX中强化了针对Agent数据访问的安全管控能力。 总结来看,英伟达正通过Vera Rubin、DSX、Nemotron、Cosmos 3、H2 Plus等一系列产品,从算力供给、模型智能、安全管控、物理形态到部署运营,全方位构建服务于Agent的基础设施,宣告一个以智能体为核心的新计算时代已经开启。

marsbit1 小時前

黄仁勋的「Agent工厂」里,装了什么新故事?

marsbit1 小時前

交易

現貨
合約

熱門文章

如何購買BILL

歡迎來到HTX.com!在這裡,購買Billions Network (BILL)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Billions Network (BILL)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Billions Network (BILL)購買Billions Network (BILL)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Billions Network (BILL)在HTX的現貨市場輕鬆交易Billions Network (BILL)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

258 人學過發佈於 2026.05.07更新於 2026.06.01

如何購買BILL

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 BILL (BILL)幣價的意見。

活动图片