Michael Hahn, cựu Giám đốc tại Oracle, gần đây đã bắt đầu một công việc kinh doanh mới: kiểm tra và phát hiện sai sót trong hóa đơn AI.
Công ty Vaudit của ông đã xem xét hóa đơn AI của 60 doanh nghiệp, tổng trị giá khoảng 34 triệu USD, chủ yếu là phí sử dụng Claude Code, và phát hiện ra khoảng 1.7 triệu USD phí tính thừa.

The Information đưa tin: Công ty kiểm toán Vaudit tuyên bố đã phát hiện khoảng 1.7 triệu USD phí nghi ngờ tính thừa trong các hóa đơn AI do họ xử lý, chủ yếu liên quan đến Claude Code.
Trong danh sách khách hàng được kiểm toán có không ít những tên tuổi lớn như Panasonic, HP, Honda.
Tuy nhiên, nếu bạn hỏi hai gã khổng lồ AI ở đầu bên kia của hóa đơn, câu trả lời nhận được sẽ là một phiên bản khác.
Anthropic nói rằng họ không tính phí cho các yêu cầu chưa hoàn thành hoặc báo lỗi, cũng không âm thầm định tuyến yêu cầu đến các mô hình cũ, việc tính thừa có vẻ không phải là hiện tượng phổ biến.
OpenAI còn dứt khoát hơn: không có bằng chứng nào cho thấy những vấn đề này xảy ra với khách hàng của họ.
Cả hai bên đều nói không có vấn đề.
Nhưng sau nhiều vòng khiếu nại giữa Vaudit và khách hàng, khoảng 80% số tiền tranh chấp này cuối cùng đã được Amazon, Google, Microsoft, Anthropic và OpenAI hoàn trả.
Hahn cho biết các công ty này rất hợp tác khi có vấn đề xảy ra, đồng ý hoàn tiền, nhưng không đồng ý thừa nhận lỗi.
Vì vậy, tình hình trở nên kỳ lạ: công ty kiểm toán cầm sổ sách nói 'Tôi đã phát hiện ra', khoảng 80% phí tính thừa cũng được hoàn trả, nhưng các nhà cung cấp mô hình lại đồng loạt phủ nhận 'Không có chuyện đó'.
Nếu đều nói không sai, vậy số tiền này đã được hoàn trả như thế nào?
1.7 triệu USD này được tính 'thừa' ra như thế nào?
Trước tiên, hãy xem Vaudit đã phát hiện ra những gì.
Michael đưa ra ba cách tính thừa phổ biến nhất, mỗi cách đều ẩn trong những góc khuất không ai để ý của hóa đơn, thông thường sẽ không có ai kiểm tra từng khoản một.
Thứ nhất, nhầm lẫn mô hình.
Khách hàng thực tế gọi đến một mô hình cũ hơn, rẻ hơn, nhưng hóa đơn lại tính theo mô hình mới hơn, đắt hơn.
Ví dụ, bạn mua một ghế hạng phổ thông, nhưng khi thanh toán lại bị tính giá hạng thương gia. Một hai lần thì không thấy, nhưng sau vài triệu lần gọi, chênh lệch giá sẽ hiện ra.
Thứ hai, trả tiền cho thất bại.
Agent hoặc chatbot không hoàn thành yêu cầu, thậm chí báo lỗi trực tiếp, nhưng phần này vẫn bị tính vào hóa đơn.
Thứ ba là ẩn tinh nhất, Hahn gọi nó là 'cơn bão thử lại' (retry storm). Một nhiệm vụ của Agent thất bại, nó âm thầm tự thử lại nhiều lần, người dùng hoàn toàn không biết hậu trường đang đốt tiền, và chi phí cứ thế chồng chất lên.
Trong ba loại này, không có loại nào do người dùng 'chủ động sử dụng nhiều' gây ra.

Đáng sợ nhất là loại thứ ba.
Trước đây khi bạn dùng phần mềm, bạn thực hiện từng bước, tự mình theo dõi, một khi nó chạy lệch lạc, bạn có thể lập tức ngắt ngay.
Nhưng điểm bán hàng của AI Agent lại chính là 'để nó tự làm', con người lùi ra khỏi quy trình.
Điều này có nghĩa là khi AI Agent đâm đầu vào tường ở hậu trường, thử lại, rồi lại đâm đầu, đốt token điên cuồng, người vốn sẽ hô 'dừng' lại hoàn toàn không biết, còn hóa đơn thì phải đợi đến cuối tháng mới được gửi đến tay bạn.
Anthropic, OpenAI: Chúng tôi không tính phí bừa bãi
Điểm mấu chốt của việc này không phải là 'ai lừa ai'.
Vaudit phát hiện ra, nhưng Anthropic và OpenAI không thừa nhận. Đây vốn là quan điểm của công ty kiểm toán, không ai có thể chỉ dựa vào câu 'phát hiện 1.7 triệu' mà vội vàng gán cho hai công ty cái mũ 'tính phí bừa bãi'.
Nhưng bước hoàn tiền, mỗi công ty đều hợp tác. Có thể một mạch hoàn trả 80%, điều đó lại càng chứng tỏ 80% này vốn không nên thu.
Hoàn tiền là sửa sai, tiền đã hoàn, nhưng sổ sách vẫn là một mớ hỗn độn.
Lý do xuất hiện thế cục 'hoàn tiền nhưng không nhận lỗi' này, gốc rễ nằm ở thuật toán của chính ngành kinh doanh tính phí AI.
Tại sao hóa đơn AI vốn dĩ khó hiểu
Vấn đề có thể không nằm ở 'tính sai', mà ở chỗ 'vốn dĩ tính không rõ'.
Bởi vì nó tính phí dựa trên lượng token sử dụng, bạn dùng nhiều thì trả nhiều, dùng phức tạp thì trả còn nhiều hơn, nhưng token trong các bảng điều khiển cơ sở hạ tầng mà bạn thường dùng, về cơ bản là vô hình.
Phiền phức hơn nữa là nó còn có thể dao động mạnh. Cùng hỏi một câu, dùng mô hình nào, viết prompt ra sao, sắp xếp agent như thế nào, lượng token đốt cháy có thể chênh lệch vài bậc độ lớn.
Mô hình càng tiến theo hướng 'agent hóa' (agentic), càng tốn token. Một agent chạy một nhiệm vụ thay bạn, đằng sau có thể là hàng chục, thậm chí hàng trăm lần gọi mô hình, mỗi lần đều đang đốt tiền.
Vốn dĩ khó dự đoán, khó giải thích, 'vùng xám' của việc 'tính thừa' chính là để lại như vậy.
Lời nói của Hahn thật sắc bén: Hóa đơn AI đang ngày càng trở nên không minh bạch. Câu nói này vừa vặn chạm đúng điểm yếu của toàn ngành.
AI từ thời kỳ đầu 'tính phí theo lần gọi', đi suốt đến ngày nay 'đa mô hình + đa agent + trung chuyển đám mây', chuỗi hóa đơn bị kéo dài ngày càng dài: nhà cung cấp mô hình thu một vòng, nhà cung cấp đám mây thu một vòng, SDK proxy ở giữa lại vòng qua một vòng nữa.
Xét riêng từng vòng đều hợp lý, nhưng ba vòng chồng lên nhau, rất khó để nhìn ra ngay số tiền này cuối cùng đã chi vào đâu.
Quan trọng hơn nữa, tiền thường không đốt ở nơi bạn nhìn thấy.
Những tình huống thực sự làm hao hụt hóa đơn, hầu như đều ẩn trong hậu trường, và mỗi loại đều có các issue trên GitHub hoặc báo cáo sự cố công khai để tra cứu.

Sau khi xem tám loại này, bạn sẽ phát hiện ra, hoặc là ngữ cảnh được truyền đi truyền lại nhiều lần, hoặc là các agent con lợi dụng lúc không ai giám sát để chạy rỗng suốt đêm, hóa đơn ở nơi bạn không thấy, tự nó càng lăn càng lớn.
Gói đăng ký 200 USD, hóa đơn 50.000 USD
Anthropic đối mặt với thách thức từ hóa đơn AI không chỉ một lần.
Vào ngày 15 tháng 6, một khách hàng ở Washington D.C. là Karl Kahn, đã kiện Anthropic ra tòa án liên bang, cáo buộc công ty này 'hàng không đúng như mô tả' đối với các gói đăng ký cao cấp.

Theo Wall Street Journal đưa tin, Max 5x của Anthropic là 100 USD mỗi tháng, Max 20x là 200 USD mỗi tháng, điểm bán hàng khi quảng cáo là gấp 5 lần và 20 lần giới hạn sử dụng của gói Pro.
Nhưng Kahn nói rằng, lượng thực tế có thể sử dụng thấp hơn rất nhiều so với quảng cáo.
Ông nâng cấp lên Max 20x vào tháng 4 năm nay, nhưng chỉ vài tuần sau đã chạm trần giới hạn sử dụng hàng tuần, một đợt chạy nước rút 5 giờ đồng hồ, đã đốt mất 15% hạn mức tuần.
Hoặc là dừng công việc, hoặc là dùng tiết kiệm, hoặc là bỏ thêm tiền mua thêm, ông chỉ còn lại ba con đường này.
Căn cứ của vụ kiện này, chủ yếu là một loạt email mà Anthropic đã gửi cho những người đăng ký các gói khác nhau vào tháng 7 năm 2025, trong đó ghi rõ mỗi gói mỗi tuần đại khái có thể sử dụng bao nhiêu.
Nguyên đơn chính là dùng những chứng cứ trắng đen rõ ràng này để so sánh với hạn mức thực tế nhận được, và kết luận 'thấp hơn rất nhiều so với quảng cáo'.
Đơn kiện yêu cầu công nhận tư cách vụ kiện tập thể, bao phủ tất cả những người đã mua hai gói này kể từ tháng 4 năm 2025.
Phát hiện sai sót hóa đơn AI, đang trở thành một ngành kinh doanh
Vaudit, công ty 'chuyên phát hiện sai sót' cho hóa đơn AI, được thành lập vào năm 2023, đội ngũ khoảng 30 người.
Người sáng lập Hahn là cựu Giám đốc Oracle, nghề cũ là kiểm toán hóa đơn cho dịch vụ hậu cần, vận tải, quảng cáo và đám mây, nói thẳng ra, đây là một dịch vụ chuyên giúp người khác 'kiểm tra sổ sách và tiết kiệm tiền'.
Đầu năm nay, ông đã áp dụng nguyên xi kỹ năng này vào hóa đơn AI.

Trang web của Vaudit viết: Giám sát và thu hồi từng khoản chi tiêu AI của bạn, hiện đã tích lũy kiểm toán số tiền hơn 1 tỷ USD.
Cách chơi của Vaudit đơn giản và trực tiếp:
Khách hàng cài đặt một phần mềm vào môi trường AI của mình, thông thường thông qua SDK, lặng lẽ thu thập dữ liệu gốc về việc sử dụng AI, sau đó đem so sánh từng mục với hóa đơn, biên lai. Nếu không khớp, Vaudit sẽ thay khách hàng khiếu nại.
Cách tính phí cũng trực tiếp: lấy 1% số tiền được kiểm toán, sau đó chia 30% số tiền thu hồi được. Nó càng giúp bạn thu hồi nhiều, thì bản thân nó càng kiếm được nhiều.
Chuyên phát hiện sai sót cho hóa đơn AI, lại có thể làm thành một ngành kinh doanh. Bản thân việc này đã chứng tỏ: Tính phí AI đã phức tạp đến mức phải mời 'bên thứ ba kiểm tra sổ sách'.
Và tất cả những điều này, vừa vặn rơi vào một thời điểm tế nhị.
Anthropic và OpenAI đang lao vào IPO, tranh nhau đưa tính năng mới cho khách hàng. Một bên là sự tăng vọt về định giá và doanh thu, một bên là người dùng trả phí cau mày trước những hóa đơn không hiểu nổi.
Vì vậy, một ngành nghề hoàn toàn mới đã ra đời: 'Kế toán viên hóa đơn' của thời đại AI.
Còn hóa đơn AI trong tay bạn, đã có ai tính giúp chưa?
Tài liệu tham khảo:
https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi
Bài viết này đến từ tài khoản công chúng WeChat "New Zhiyuan", tác giả: ASI Khải Thị Lục








