AI Billing Black Box Exposed: 1.7 Million Overcharged, Anthropic Refunds But Doesn’t Admit Fault

marsbitXuất bản vào 2026-06-29Cập nhật gần nhất vào 2026-06-29

Tóm tắt

A startup named Vaudit, founded by former Oracle director Michael Hahn, audits AI bills for companies and claims to have identified approximately $1.7 million in overcharges across 60 businesses, totaling $34 million in reviewed bills. The alleged discrepancies primarily involve charges for Anthropic's Claude Code. Common issues cited include billing for newer, more expensive models when older, cheaper ones were used; charging for failed or errored requests; and "retry storms" where AI agents silently retry failed tasks, accumulating costs unnoticed. Major clients like Panasonic, HP, and Honda were among those audited. While Vaudit reports that around 80% of the disputed charges were refunded by providers like Amazon, Google, Microsoft, Anthropic, and OpenAI after申诉, the AI companies largely deny systemic problems. Anthropic stated overcharges do not appear widespread and it does not bill for uncompleted requests or errors, while OpenAI said it found no evidence of such issues affecting its customers. The situation highlights the inherent opacity and complexity of AI billing, which is based on token usage that is difficult to track and predict, especially with multi-agent, multi-model workflows. This complexity is creating a new market for third-party AI bill auditing services like Vaudit, which charges fees based on recovered amounts. Separately, Anthropic faces a proposed class-action lawsuit alleging its high-tier subscription plans deliver far less usage than advertis...

A former Oracle director named Michael Hahn has recently started a business exposing fake AI bills.

His company, Vaudit, examined AI bills totaling approximately $34 million from 60 companies, primarily for the use of Claude Code, and identified about $1.7 million in overcharges.

The Information reported: The auditing firm Vaudit stated that it identified about $1.7 million in suspected overcharges in the corporate AI bills it handled, mainly involving Claude Code.

The audited client list included major corporations such as Panasonic, HP, and Honda.

But if you ask the two AI giants on the other side of the bills, you get a different version.

Anthropic says it does not charge for unfulfilled requests or errors, nor does it secretly route requests to older models, and overcharging does not appear to be a widespread phenomenon.

OpenAI is more direct: there is no evidence that these issues occurred with its customers.

Both sides claim there is no problem.

However, after rounds of appeals by Vaudit and its clients, about 80% of these disputed amounts were ultimately refunded by Amazon, Google, Microsoft, Anthropic, and OpenAI.

Hahn says these companies were very cooperative when issues arose, agreeing to refund the money but refusing to admit any mistake.

Thus, the situation becomes strange: the auditing firm points to the ledger saying "I found it," about 80% of the overcharges were refunded, yet the model vendors collectively shrug and say "nothing happened."

If everyone claims there's no mistake, how did these refunds come about?

How Did This 1.7 Million Become "Excess"?

First, let's see what Vaudit uncovered.

Michael listed three of the most common overcharging methods, each hidden in inconspicuous corners of the bill where no one would normally check line by line.

The first: model misassignment.

The client actually called an older, cheaper model, but the bill was calculated based on a newer, more expensive tier.

For example, you bought an economy-class seat but were charged a first-class price. It's unnoticeable once or twice, but after millions of calls, the price difference becomes apparent.

The second: paying for failure.

An agent or chatbot that fails to complete a request, or even directly returns an error, is still included in the bill.

The third is the most insidious. Hahn calls it a "retry storm." An agent task fails, and it silently retries repeatedly in the background. The user has no idea money is being burned in the background, and the costs stack up layer by layer.

None of these three are caused by the user "actively using more."

The third one is the most frightening.

In the past, when you used software, you monitored it step by step, and could immediately stop it if it went haywire.

But the selling point of AI agents is precisely "let it work on its own," with the human stepping out of the process.

This means that when an AI agent hits a wall, retries, hits another wall, and burns tokens like crazy in the background, the person who would normally call a stop doesn't know about it, and the bill doesn't arrive until the end of the month.

Anthropic, OpenAI: We Didn't Overcharge

The point of this matter is not "who cheated whom."

Vaudit found it, but Anthropic and OpenAI didn't admit it. This is just the auditing firm's version. One cannot simply label the two companies as overchargers based on the phrase "found 1.7 million."

But they did cooperate when it came to refunds. The fact that 80% was refunded at once precisely shows that this 80% shouldn't have been charged in the first place.

Refunds are error corrections. The money is back, but the account is still a mess.

The reason for this "refund without admission" stalemate lies in the inherent algorithm of the AI billing business itself.

Why AI Bills Are Inherently Incomprehensible

The problem might not be "miscalculation," but "inherently impossible to calculate clearly."

Because it charges based on token usage—the more you use, the more you pay; the more complex the usage, the more you pay. Yet tokens are essentially invisible in the infrastructure dashboards you commonly use.

What's more troublesome is that it can fluctuate wildly. Asking the same question, depending on which model is used, how the prompt is written, and how the agent is orchestrated, the tokens burned can differ by orders of magnitude.

The more models move towards being "agentic," the more tokens they consume. An agent running a task for you could involve dozens or even hundreds of model calls in the background, each burning money.

Inherently unpredictable and hard to explain—this is how the ambiguous zone of "overcharging" emerges.

Hahn's words hit the nail on the head: AI bills are becoming increasingly opaque. This statement precisely hits the soft spot of the entire industry.

AI has evolved from the earliest "per-call billing" to today's "multi-model + multi-agent + cloud intermediary," stretching the billing chain longer and longer: the model vendor charges once, the cloud vendor charges once, and the SDK agent in the middle adds another layer.

Each layer looks reasonable on its own, but when the three are stacked together, it's hard to see at a glance where the money was actually spent.

What's even more critical is that money is often not burned where you can see it.

The scenarios that truly eat up the bill are almost all hidden in the background, and each one has publicly available GitHub issues or incident reports that can be checked.

After looking at these eight scenarios, you'll find that either the context is repeatedly retransmitted, or sub-agents run idly overnight with no one watching, and the bill just grows larger and larger on its own, out of sight.

$200 Subscription, $50,000 Bill

This is not the first time Anthropic has faced challenges with AI billing.

On June 15, a client from Washington D.C., Karl Kahn, sued Anthropic in federal court, accusing it of failing to deliver on high-priced subscriptions.

According to The Wall Street Journal, Anthropic's Max 5x costs $100 per month, and Max 20x costs $200 per month. The advertised selling point was 5 times and 20 times the usage limits of the Pro plan, respectively.

But Kahn says the actual usable amount is far lower than advertised.

He upgraded to Max 20x in April this year, but within weeks, he hit the weekly usage ceiling. One 5-hour sprint directly burned through 15% of his weekly quota.

He was left with only three options: stop work, use sparingly, or pay more for additional purchases.

The basis of this lawsuit is primarily a batch of emails sent by Anthropic in July 2025 to subscribers of different tiers, which specified the approximate weekly usage for each tier.

The plaintiff used these black-and-white emails to compare against the actual quotas received, concluding they were "far below the advertised amount."

The lawsuit seeks class-action status, covering all individuals who purchased these two tiers since April 2025.

Finding Errors in AI Bills Is Becoming a Business

Vaudit, which "exposes" AI bills, was founded in 2023 and has a team of about 30 people.

Founder Hahn is a former Oracle director. His old trade was auditing bills for logistics, transportation, advertising, and cloud services—essentially, he specialized in helping people "check accounts and save money."

Earlier this year, he applied this skill directly to AI bills.

Vaudit's website states that it monitors and recovers every penny of your AI spending, having audited over $1 billion to date.

Vaudit's method is straightforward:

Clients install a piece of software into their AI environment, typically via a Software Development Kit (SDK), which quietly captures raw data on AI usage. This data is then compared line by line with invoices and bills. If they don't match, Vaudit files appeals on the client's behalf.

The fee structure is also direct: 1% of the audited amount, plus 30% of the recovered money. The more they recover for you, the more they earn themselves.

The fact that specializing in finding errors in AI bills can become a business in itself shows: AI billing has become so complex that hiring a "third-party auditor" is now necessary.

And all of this happens at a微妙 (subtle) point in time.

Both Anthropic and OpenAI are sprinting toward IPOs, rushing to pack new features for customers. On one side is the狂奔 (galloping) valuation and revenue, and on the other side are paying users frowning at incomprehensible bills.

Thus, a completely new profession has emerged: the "bill tax accountant" of the AI era.

And who has calculated that AI bill in your hand?

References:

https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi

This article is from the WeChat public account "New Zhiyuan," author: ASI Apocalypse.

Tiền kỹ thuật số thịnh hành

Nội dung Liên quan

Thời đại AI, Bitcoin còn lại gì?

Tác giả Sevclub từ Seven Research chia sẻ quan điểm rằng AI và Bitcoin là hai mặt của một đồng xu trong thời đại số hiện nay. Trong khi AI làm giảm chi phí sản xuất thông tin đến mức gần như bằng không, dẫn đến sự tràn ngập nội dung thật giả lẫn lộn và khó kiểm chứng, thì Bitcoin lại đóng vai trò ngược lại: nó là cỗ máy tạo ra "khả năng xác minh". Bằng cách tiêu thụ năng lượng (thường bị chỉ trích là lãng phí), mạng lưới Bitcoin không tạo ra nội dung hay năng lực tính toán như AI, mà đảm bảo tính bất biến và có thể xác minh độc lập cho một cuốn sổ cái phân tán. Mọi giao dịch đều được xác thực bằng toán học và mật mã học, không cần tin tưởng vào bất kỳ ngân hàng, nền tảng hay cá nhân trung tâm nào. Trong một thế giới mà AI có thể dễ dàng tạo ra văn bản, hình ảnh, video giả mạo, thì thứ trở nên khan hiếm và quý giá chính là những sự thật có thể kiểm chứng được. Tác giả so sánh: AI giống như máy in thời kỳ Phục Hưng, cách mạng hóa việc sản xuất và sao chép; còn blockchain (với Bitcoin là ứng dụng điển hình) giống như phương pháp kế toán kép mới, cách mạng hóa việc xác minh và ghi chép. Chúng không cạnh tranh mà bổ sung cho nhau — một bên giảm chi phí tạo lập, một bên giảm chi phí xác thực. Do đó, giá trị cốt lõi của Bitcoin trong kỷ nguyên AI có thể không nằm ở việc là "tiền" mà ở việc là một "cỗ máy tạo ra tính có thể xác minh" cho lịch sử và tài sản kỹ thuật số.

链捕手47 phút trước

Thời đại AI, Bitcoin còn lại gì?

链捕手47 phút trước

Nhãn mác "chuỗi ma" của Cardano bị bác bỏ? Tại sao 34 ứng dụng phi tập trung (dApp) của ADA không kể toàn bộ câu chuyện

Bài báo thảo luận về nhãn "ghost chain" (blockchain ma) thường bị gán cho Cardano (ADA) do số lượng dApp ít ỏi (chỉ 34) so với các đối thủ như Ethereum hay Solana. Dữ liệu cho thấy hoạt động on-chain và số người dùng hàng ngày của Cardano thấp hơn đáng kể. Tuy nhiên, bài viết lập luận rằng chỉ số này không kể câu chuyện toàn diện. Cardano sử dụng mô hình EUTXO (Extended Unspent Transaction Output) độc đáo, nơi các giao dịch được tổng hợp (batch) trước khi ghi vào sổ cái. Điều này mang lại lợi thế về bảo mật và tính xác định, nhưng cũng dẫn đến việc đánh giá thấp số liệu hoạt động thực tế trên chuỗi. Bên cạnh đó, Cardano tập trung vào phát triển bền vững, bảo mật và phương pháp nghiên cứu chuyên sâu, phù hợp cho các ứng dụng tuân thủ và doanh nghiệp. Mặc dù có những lo ngại như việc đóng cửa công cụ TapTools và cảnh báo về một số dApp có thể ngừng hoạt động, số liệu phát triển của Cardano vẫn rất mạnh. Do đó, bài viết kết luận rằng việc gọi Cardano là "ghost chain" chỉ dựa trên số lượng dApp là không đủ căn cứ, vì nó bỏ qua kiến trúc kỹ thuật và định hướng chiến lược riêng biệt của mạng lưới này.

ambcrypto1 giờ trước

Nhãn mác "chuỗi ma" của Cardano bị bác bỏ? Tại sao 34 ứng dụng phi tập trung (dApp) của ADA không kể toàn bộ câu chuyện

ambcrypto1 giờ trước

Cơ quan FCA của Anh công bố sổ tay quy định về tiền mã hóa: Phương pháp tiếp cận dựa trên rủi ro bắt đầu vào tháng 10/2027

Cơ quan Giám sát Tài chính Anh (FCA) đã công bố một khuôn khổ quy định mới cho tiền mã hóa, áp dụng từ tháng 10/2027, thay vì các quy định cứng nhắc, đồng loạt. Cách tiếp cận dựa trên rủi ro này yêu cầu các công ty tiền mã hóa duy trì vốn đủ để bù đắp tổn thất tiềm năng, nhưng số vốn sẽ thay đổi tùy theo mức độ rủi ro của từng doanh nghiệp. Các công ty nhỏ hơn và ít rủi ro hơn sẽ có yêu cầu công bố thông tin giảm bớt, giúp tiết kiệm chi phí tuân thủ. Các công ty sẽ tự đánh giá rủi ro trên bảng cân đối kế toán và thực hiện kiểm tra áp lực hàng năm, sau đó FCA sẽ xem xét các đánh giá này. Mục tiêu của những thay đổi này là tăng cường sự tin tưởng của thị trường và thu hút thêm 3-4 triệu người dùng tiền mã hóa tại Anh. Đối với stablecoin, FCA đã giữ cấu trúc cơ bản nhưng nới lỏng một số yêu cầu, đồng thời tăng cường bảo vệ người tiêu dùng bằng quy định tài sản dự trữ phải được nắm giữ trong một ủy thác theo luật định. Các quy tắc này tạo thành khuôn khổ cơ bản, trong đó những tổ chức phát hành lớn có thể phải đối mặt với giám sát chặt chẽ hơn.

ambcrypto3 giờ trước

Cơ quan FCA của Anh công bố sổ tay quy định về tiền mã hóa: Phương pháp tiếp cận dựa trên rủi ro bắt đầu vào tháng 10/2027

ambcrypto3 giờ trước

Giao dịch

Giao ngay

Bài viết Nổi bật

Làm thế nào để Mua T

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Threshold Network Token (T) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Threshold Network Token (T) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Threshold Network Token (T) của BạnSau khi mua Threshold Network Token (T), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Threshold Network Token (T)Giao dịch Threshold Network Token (T) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 532Xuất bản vào 2024.12.13Cập nhật vào 2026.06.02

Làm thế nào để Mua T

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến ​​của người dùng về giá của T (T) được trình bày dưới đây.

活动图片