Claude刷爆5亿,一夜涨60倍,你的Token账单还撑得住?

marsbitОпубліковано о 2026-06-01Востаннє оновлено о 2026-06-01

Анотація

近日,科技圈曝出多起因AI使用不当导致天价账单的案例。一家企业因未设置使用上限,一个月内在Claude上消耗高达5亿美元;另有谷歌云用户因API密钥泄露,一夜收到1.8万美元账单;OpenAI内部实验也曾单月烧掉130万美元。这些事件共同揭示:在智能体时代,失控的密钥、无休的AI任务或疏于管理的账户,都可能导致Token账单瞬间“爆仓”。 背后原因是计费模式的转变。OpenAI、GitHub等平台正从包月制转向按Token用量计费,以应对智能体任务带来的成本差异——重度用户与轻度用户的消耗可能相差数个量级。新计费方式引发部分用户不满,有开发者晒出账单显示费用从几十美元飙升至数千美元,但亦有观点认为这能遏制滥用,促使资源合理分配。 企业内部也存在“为用AI而用AI”的浪费现象。例如亚马逊员工曾为冲上内部AI使用排行榜,刻意刷高Token消耗。这种将使用量等同于绩效的误区,加剧了成本失控。 面对高昂账单,市场开始出现优化方案。例如通过工具为AI提供精准上下文以减少冗余请求,或采用模型路由将任务智能分配至性价比更高的模型。研究表明,智能体任务的Token消耗可达普通任务的千倍,且更高消耗未必带来更好效果,成本预测往往偏低。 当前,AI成本在一些企业中已逼近甚至超过人力成本,迫使管理者重新审视ROI。随着免费畅用的窗口期关闭,如何让每个Token发挥最大价值,成为开发者与企业必须精打细算的课题。未来胜出的,将是那些最先学会算好“Token账”的玩家。

1个月烧出5亿美元账单!

近日,科技圈曝出一桩惊天乌龙。据Axios报道,一家企业在短短1个月内,竟然在Claude上刷爆5亿美元!

原因令人哭笑不得:管理层在给员工开通Claude账号权限时,忘了设置使用额度上限。

其实,AI账单爆仓的远不止这一家。

今年4月,一名谷歌云用户因公开服务中遗留的API key被滥用,原本只有7美元预算的账户,一夜之间收到了1.8万美元的账单。

这个倒霉用户名叫Jesse Davies,是一名澳大利亚AI顾问、Agentic Labs创始人。他给自己的Google Cloud账户设了两道保险:一个10澳元(约7美元)的预算预警,一个1400美元的硬性消费上限。

据Tom's Hardware报道,攻击者发现了他几个月前从AI Studio发布的一个Cloud Run服务,发了6万多个请求,两道保险都没拦住:账单计算有延迟,等系统反应过来,金额已经飙到了1.8万美元。

5月中旬,开源项目OpenClaw的创始人Peter Steinberger在X上贴出一张截图:30天,OpenAI API账单130万美元。

他的团队只有三个人,但他们指挥的100个Codex智能体在并行跑:30天烧掉6030亿个Token、跑出760万次请求。还好,这130万美元并非他自掏腰包。

Steinberger今年2月加入了OpenAI,这130万美元被当作一次内部实验:

测试如果不考虑Token成本,AI编程能跑到什么极限。他补充道,这是Codex「Fast Mode」(高速档计费)的结果,关掉之后大约30万美元。

更早一些,Uber的CTO Praveen Neppalli Naga也曾向The Information承认,公司4月份就把全年的Claude Code预算烧光了,他们的COO也公开表示,AI成本越来越「难以自圆其说」。

5亿、130万、1.8万,金额虽然差出几个数量级,却指向同一个事实:

在智能体时代,失控的密钥、昼夜无休的智能体军团、忘了设上限的账号:任何一个,都能让你的Token账单一夜刷爆。

AI账单为什么会爆仓?

答案主要藏在计费方式的变化里。

从今年4月起,OpenAI的包月计费方式开始转向按Token用量计费。

4月2日,Codex计费从按消息估算改成按Token用量对齐:输入、缓存输入、输出三类Token分开算。4月23日,这套规则扩展到所有Enterprise、Edu、Health、Gov方案:月费里那笔看不见的折扣被抽掉了。

GitHub也紧随其后,刚刚官宣:所有Copilot套餐从2026年6月1日起,转向按用量计费。旧的高级请求逻辑作废,换成AI额度,按输入Token、输出Token、缓存Token的实际消耗,对照每个模型的API费率结算。

GitHub官方解释了这么做的原因:

现在一个快速的聊天提问,和一次跑好几小时的自主编码任务,用户花的钱一样多。GitHub一直在替那些跑重度任务的用户买单,但这套模式已经不可持续。

AI智能体崛起之前,聊天和补全成本差不多,月费兜得住。

智能体崛起之后,一次任务能连续跑几小时、改动整个代码库,重度用户和轻度用户的成本差可以拉到几个数量级。月费制在这种差距面前,直接崩了。

消息一出,Reddit和X上一片哗然。

一位ID为JBusu的开发者晒出了账单截图,直言新定价「就是个笑话」。原本28.12美元/月的开销,按新制要付746.01美元,他已决定退订,「这个价格,我自己租云服务器都还便宜」。

另一名用户截图更夸张,费用从50美元一路狂飙到3000美元,他说没想到定价这样离谱,「还有人继续订阅吗?」

不过也有Copilot老用户出来反驳:这些极端账单多半是vibe-coder(凭感觉编码者)们不把烧Token当回事给烧出来的,未必能代表正常使用。

一位老用户在评论区留言:「我整天都在用,月底基本不超额,很难相信这是工作复杂度的差异。」另一位则更直接:「就是有人要全自动的YOLO模式开发,让AI随便跑。这种浪费被剔除,对其他人反而是好事。

有一点必须清楚:GitHub没有废除月费,基础订阅价格并没有变。真正变的是额外用量、智能体任务、更贵的模型调用,从此进入用量计费。

被冲击最大的,是那些靠Copilot跑长链任务的重度智能体用户。

被自己人玩坏的排行榜

月费失守,一面是平台改了计费规则,另一面是用AI的人,自己也在拼命烧。

5月,Business Insider报道,Amazon下线了一个名叫KiroRank的内部AI使用排行榜。

该报道援引知情人士的话称,这个榜单悄悄催生了一种奇怪的工作方式:部分员工为了在榜单上多爬几位,会去刷一些并不解决实际问题的Token消耗,纯粹为了排名。

事情曝出之后,Amazon高级副总裁Dave Treadwell直接向全员喊话:「别为了用AI而用AI。用它去解决客户问题,解决业务问题,去创新。」

这事虽然有点荒唐,但毫不意外。当「烧Token」能上榜,员工自然就会去烧Token。

硅谷给这种现象起了个专门的名字:Tokenmaxxing(极限烧Token),把消耗量当生产力。

Axios的报道里也提到,有CTO发现员工拿AI模型查天气、写日常邮件,简单到不行的事,套上最贵的前沿模型,账单就能悄无声息地飞涨。

KiroRank并非Amazon官方考核体系,而是员工自发搭的非正式工具。但它清楚地暴露了一个经典的管理学规律:当KPI设错的时候,人就会用最聪明的方式钻空子

把「用了多少」等同于「干得好不好」——这正是这一轮AI浪费的制度性根源。

算Token账的人,已经在赚钱

Token账单焦虑的另一面,有人悄悄把它做成了生意。

第一条路:用上下文喂饱AI。

Glean正是Arvind自家公司。它做的就是企业AI工作助手:把分散在公司各处的知识统一打通,让员工的AI直接拿到上下文,不必再四处翻箱倒柜。AI少绕路,烧的Token自然就少。

这套机制让Glean的年度营收15个月翻三倍,跨过3亿美元,客户包括Databricks、Reddit、Samsung。

第二条路:把活分给对的模型。

模型路由初创公司Factory AI干的就是这件事:自动把每个任务派给最合适的模型,简单任务走便宜档,复杂任务走顶配。Arvind也讲过:路由做对了,能省10倍

这两条路殊途同归:让AI干活,但别让它乱烧

学术圈的研究,也在为这种转向奠基。

https://arxiv.org/pdf/2604.22750

2026年4月的一篇arXiv论文,第一次系统拆解了智能体编码任务到底怎么烧钱。

结论一:智能体任务的Token消耗,可达普通代码推理和代码对话的上千倍,推高成本的主因是输入Token。

结论二:同一个任务跑多次,Token消耗能差出30倍。

结论三:更高的Token消耗,并不必然带来更高准确率。精度往往在中等成本处见顶——再往上烧,钱花了,效果反而饱和。

论文还发现,前沿模型连预测自己要烧多少Token都做不到,普遍低估真实成本。

你以为多花钱就能多办事。实际是钱花了,活不一定更好,预算还算不准

当AI账单开始赶超人力成本

「这是我记忆中第一次,技术成本开始和人力成本持平。」

5月29日,Glean CEO Arvind Jain在接受CNBC记者Deirdre Bosa采访时这样讲道。

英伟达应用深度学习副总裁Bryan Catanzaro的观察也印证了这一点。

他在Axios访谈里提到:对于他的团队来说,算力成本已经远远超过员工薪资。

类似的现象正在多家公司浮现:从做企业AI的Glean,到卖AI算力的英伟达,再到用AI的Uber,都在重新审视这笔账。

在Arvind看来,历史上技术只是企业整体成本里很小的一块,但现在AI成本已经能追平工资单了,很多企业的年度AI预算通常都是一到两个月就烧光。

过去一年,AI使用率是被崇拜的指标:多用就是先进,烧Token就是拥抱未来。现在,许多企业开始反思那句朴素的话:这些烧掉的Token,到底换来了什么?

免费包月畅用的窗口期,恰恰正在此时关上。

接下来,摆在所有开发者面前的是这样一个问题:如何精打细算,让每一个Token发挥出最大价值。

未来真正的赢家,毫无疑问将是最先学会算Token账的那个。

参考资料:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

本文来自微信公众号“新智元”,作者:ASI启示录

Пов'язані питання

Q文章中提到哪个企业在短短一个月内因未设置使用额度上限,在Claude上刷爆了5亿美元账单?

A文章中提到一家未具名的企业,因管理层在给员工开通Claude账号权限时忘了设置使用额度上限,导致在短短一个月内刷爆了5亿美元账单。

QGitHub Copilot的计费方式从2026年6月1日起将发生什么重大变化?

AGitHub Copilot将从2026年6月1日起,所有套餐从包月计费转向按实际Token用量计费。旧的‘高级请求’逻辑将被废除,转而采用AI额度,并根据输入Token、输出Token和缓存Token的实际消耗,对照每个模型的API费率进行结算。

Q根据文章,导致AI账单爆仓(失控)的主要原因有哪些?(请列出至少两个)

A根据文章,导致AI账单爆仓的主要原因包括:1. 计费方式从包月制转向按Token用量计费,使重度智能体用户成本飙升。2. 内部管理疏忽,如未设置使用额度上限或API密钥泄露被滥用。3. 员工行为,如为了在内部排行榜上刷排名而浪费Token(Token maxxing现象),或使用昂贵模型处理简单任务。

Q文章中提到,哪篇学术论文首次系统拆解了智能体编码任务的成本构成?它得出了哪三个主要结论?

A文章提到一篇2026年4月的arXiv论文首次系统拆解了智能体编码任务的成本。主要结论是:1. 智能体任务的Token消耗可达普通代码推理的上千倍,主要推高成本的是输入Token。2. 同一任务跑多次,Token消耗能差出30倍。3. 更高的Token消耗并不必然带来更高准确率,精度往往在中等成本处见顶,再往上烧钱效果会饱和。

QGlean公司的CEO Arvind Jain在采访中提出了一个关于企业成本的重要观察是什么?

AGlean公司的CEO Arvind Jain在采访中指出,AI成本已经增长到能够追平甚至赶超人力成本的程度,这是他记忆中第一次技术成本开始和人力成本持平。许多企业的年度AI预算常常在一到两个月内就迅速耗尽。

Пов'язані матеріали

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

Decoding Agent Commerce, Payments, and Infrastructure: The Reality Over the past year, I've been building infrastructure for the Agent economy, engaging with major players like Stripe, Visa, Coinbase, Google, and dozens of startups. A clear conclusion emerges: true, large-scale demand does not yet exist. Startups face structural challenges. Data points illustrate this gap. Stripe's Agent commerce platform has over 1,000 merchants but only single-digit transacting agents. Visa's Agent payment token requires 9-month KYC and a $250M revenue threshold, accessible only to giants like Amazon. On-chain analysis reveals actual daily Agent transaction volume is around $17k, half of which are test transactions. The article analyzes four potential markets: **1. Agent-to-Merchant (A2M):** Current AI shopping UX is often inferior to traditional e-commerce for visual, comparison-heavy purchases (clothing, electronics). Chat interfaces are a step back. Real merchant interest is defensive "Agent Engine Optimization," fearing future obsolescence, not current demand. Potential exists in high-frequency, low-decision purchases (e.g., food delivery) or simplifying terrible UX (complex checkouts, non-native shoppers), but these require massive consumer distribution channels dominated by giants like DoorDash and Amazon. **2. Agent-to-API (A2A):** Developers already have subscriptions and billing for core APIs (compute, data). The argument for micro-payments via crypto for sub-dollar API calls is addressed by pre-paid balances today. The deeper issue is supplier resistance; major SaaS firms rely on enterprise contracts, not fractional cent pricing. Opportunity lies in the long tail of niche services, but this is a smaller market catering to developers, a historically low-paying group. **3. Agent-to-Agent (A2A):** This remains a theoretical long-term vision with near-zero current transaction volume. It involves unique challenges: discovery, trust, negotiation, dispute resolution. When it materializes, it will require a fundamentally new settlement infrastructure for high-speed, variable-value, multi-party transactions. It's a real long-term bet, but not the current market. **4. Agent-to-Finance (A2F):** This is the only category with existing, paying demand. Integrating AI into financial workflows (trading, portfolio management) is a natural evolution and enables new capabilities like autonomous rebalancing. However, competition favors incumbents with regulatory licenses, compliance infrastructure, and existing client relationships. **The Real Issue:** Why is infrastructure still being built? Incumbents can afford long-term bets, and payment companies see every problem as a nail for their payment hammer. However, payment is just one piece. The core challenge is *coordination*—orchestrating work between Agents and humans, verifying outcomes, and settling results. Payment is part of settlement, which is part of coordination. Companies that solve the coordination problem will subsume payments, not the other way around. Startups lack the infinite runway of giants and must find today's real market, which, after a year of exploration, lies outside these four categories—in an area with real, growing, and underserved activity.

marsbit19 хв тому

Uncovering the Truth About Agent Commerce, Payments, and Infrastructure

marsbit19 хв тому

Kalshi, MTS, and a16z's Ambition

The article "Kalshi, MTS, and a16z's Ambition" explores prediction markets as a focal point of excitement in 2025 for investors, crypto enthusiasts, and media. It traces their intellectual lineage from Friedrich Hayek's ideas on dispersed knowledge and market coordination to Robin Hanson's Logarithmic Market Scoring Rule (LMSR), which incentivizes truthful information sharing. The piece argues that a16z's significant investment in prediction market platform Kalshi (valued at $220B) transcends mere financial speculation. a16z frames prediction markets as a new form of "media" that provides "presence"—a way for individuals to actively engage with and influence world events through financial stakes, countering postmodern detachment. By wagering on outcomes, users become "super observers," and the market's aggregated probabilities gain authoritative power to define event truth and importance. The article uses media company MTS ("Monitoring The Situation") as a case study of a16z's "new media" strategy: rapidly producing high-intensity, multi-format content to "take over the timeline." However, prediction markets like Kalshi are presented as the ultimate piece in this media empire. Their real-money, crowd-sourced probabilities possess a unique "reality distortion field" and perceived objectivity, potentially swaying public opinion and granting a private company unprecedented interpretive power over reality. Ultimately, Kalshi's immense valuation is attributed not just to its exchange model, but to its role as a foundational component in a16z's envisioned new media landscape, where prediction markets define narrative and truth.

链捕手20 хв тому

Kalshi, MTS, and a16z's Ambition

链捕手20 хв тому

Торгівля

Спот
Ф'ючерси

Популярні статті

Як купити BILL

Ласкаво просимо до HTX.com! Ми зробили покупку Billions Network (BILL) простою та зручною. Дотримуйтесь нашої покрокової інструкції, щоб розпочати свою криптовалютну подорож.Крок 1: Створіть обліковий запис на HTXВикористовуйте свою електронну пошту або номер телефону, щоб зареєструвати обліковий запис на HTX безплатно. Пройдіть безпроблемну реєстрацію й отримайте доступ до всіх функцій.ЗареєструватисьКрок 2: Перейдіть до розділу Купити крипту і виберіть спосіб оплатиКредитна/дебетова картка: використовуйте вашу картку Visa або Mastercard, щоб миттєво купити Billions Network (BILL).Баланс: використовуйте кошти з балансу вашого рахунку HTX для безперешкодної торгівлі.Треті особи: ми додали популярні способи оплати, такі як Google Pay та Apple Pay, щоб підвищити зручність.P2P: Торгуйте безпосередньо з іншими користувачами на HTX.Позабіржова торгівля (OTC): ми пропонуємо індивідуальні послуги та конкурентні обмінні курси для трейдерів.Крок 3: Зберігайте свої Billions Network (BILL)Після придбання Billions Network (BILL) збережіть його у своєму обліковому записі на HTX. Крім того, ви можете відправити його в інше місце за допомогою блокчейн-переказу або використовувати його для торгівлі іншими криптовалютами.Крок 4: Торгівля Billions Network (BILL)Легко торгуйте Billions Network (BILL) на спотовому ринку HTX. Просто увійдіть до свого облікового запису, виберіть торгову пару, укладайте угоди та спостерігайте за ними в режимі реального часу. Ми пропонуємо зручний досвід як для початківців, так і для досвідчених трейдерів.

317 переглядів усьогоОпубліковано 2026.05.07Оновлено 2026.06.02

Як купити BILL

Обговорення

Ласкаво просимо до спільноти HTX. Тут ви можете бути в курсі останніх подій розвитку платформи та отримати доступ до професійної ринкової інформації. Нижче представлені думки користувачів щодо ціни BILL (BILL).

活动图片