Seorang mantan direktur Oracle bernama Michael Hahn, baru-baru ini memulai bisnis "pembongkar" tagihan AI.
Perusahaannya, Vaudit, meneliti tagihan AI dari 60 perusahaan senilai sekitar US$34 juta, dengan sebagian besar terkait biaya penggunaan Claude Code, dan menemukan tagihan lebih bayar sekitar US$1,7 juta.

The Information melaporkan: Perusahaan audit Vaudit menyatakan menemukan sekitar US$1,7 juta diduga tagihan lebih dalam tagihan AI perusahaan yang ditanganinya, terutama terkait Claude Code.
Daftar klien yang diaudit termasuk perusahaan-perusahaan seperti Panasonic, HP, dan Honda.
Tapi jika Anda bertanya kepada dua raksasa AI di sisi lain tagihan, jawaban yang Anda dapatkan adalah versi lain.
Anthropic mengatakan, mereka tidak menagih untuk permintaan yang tidak selesai atau error, juga tidak akan mengarahkan permintaan secara diam-diam ke model lama, dan kelebihan tagihan ini tampaknya bukan fenomena umum.
OpenAI lebih tegas: Tidak ada bukti menunjukkan masalah ini terjadi pada klien mereka.
Kedua belah pihak mengatakan tidak ada masalah.
Tapi setelah proses banding berulang antara Vaudit dan klien, sekitar 80% dari jumlah yang disengketakan akhirnya dikembalikan oleh Amazon, Google, Microsoft, Anthropic, dan OpenAI.
Hahn mengatakan perusahaan-perusahaan ini sangat kooperatif saat ada masalah, setuju mengembalikan uang, namun tidak setuju mengakui kesalahan.
Maka situasinya menjadi aneh: Perusahaan audit memegang buku tagihan mengatakan 'saya menemukannya', sekitar 80% biaya kelebihan juga dikembalikan, sementara vendor model AI serempak menggelengkan tangan mengatakan 'tidak ada hal seperti itu'.
Kalau semua bilang tidak salah, uang ini, bagaimana bisa dikembalikan?
Bagaimana US$1,7 Juta Ini Bisa "Lebih"?
Pertama, lihat apa saja yang ditemukan Vaudit.
Michael memberikan tiga cara penagihan lebih yang paling umum, masing-masing tersembunyi di sudut tagihan yang tidak mencolok, yang biasanya tidak akan diperiksa satu per satu.
Pertama, model yang salah.
Klien sebenarnya memanggil model yang lebih lama dan lebih murah, tetapi tagihan dihitung berdasarkan model yang lebih baru dan lebih mahal.
Misalnya, Anda membeli tempat duduk kelas ekonomi, tapi saat membayar dikenakan harga kelas satu. Satu dua kali tidak terlihat, tapi setelah jutaan kali panggilan, selisih harganya pun muncul.
Kedua, membayar untuk kegagalan.
Agen atau chatbot yang tidak menyelesaikan permintaan, bahkan langsung melaporkan error, bagian ini tetap masuk ke tagihan.
Yang ketiga paling tersembunyi, Hahn menyebutnya badai percobaan ulang (retry storm). Sebuah tugas agen gagal, dia diam-diam mencoba berulang kali sendiri, pengguna sama sekali tidak tahu di belakang layar sedang membakar uang, biayanya pun menumpuk lapis demi lapis.
Dari ketiga ini, tidak satupun disebabkan oleh pengguna yang "secara aktif menggunakan lebih banyak".

Yang paling menakutkan adalah yang ketiga.
Dulu saat Anda menggunakan perangkat lunak, itu adalah langkah demi langkah, Anda sendiri yang mengawasi, begitu melenceng langsung bisa dihentikan.
Tapi justru poin penjualan agen AI adalah "biarkan dia bekerja sendiri", manusia mundur ke luar alur kerja.
Ini berarti ketika agen AI menabrak dinding di belakang layar, mencoba ulang, menabrak lagi, membakar token secara gila-gilaan, orang yang seharusnya berteriak berhenti itu sama sekali tidak tahu, sementara tagihannya baru akan sampai di hadapan Anda di akhir bulan.
Anthropic, OpenAI, Kami Tidak Menagih Sembarangan
Inti dari hal ini, bukanlah "siapa yang menipu siapa".
Vaudit menemukannya, tapi Anthropic dan OpenAI tidak mengakuinya, ini memang sudut pandang perusahaan audit, tidak ada yang bisa hanya dengan kalimat 'menemukan US$1,7 juta', langsung mencap kedua perusahaan ini dengan tuduhan menagih sembarangan.
Tapi langkah pengembalian uang ini, setiap perusahaan juga kooperatif. Bisa langsung mengembalikan 80% sekaligus, justru membuktikan bahwa 80% ini seharusnya tidak ditagih sejak awal.
Pengembalian uang adalah koreksi kesalahan, uang dikembalikan, tagihannya tetap kabur.
Alasan munculnya kebuntuan "kembalikan uang tapi tidak akui kesalahan" ini, akarnya terletak pada algoritma bisnis penagihan AI itu sendiri.
Mengapa Tagihan AI Secara Alami Sulit Dipahami
Masalahnya mungkin bukan pada "salah hitung", tapi pada "secara alami tidak jelas hitungannya".
Karena ditagih berdasarkan penggunaan token, semakin banyak Anda gunakan semakin banyak Anda bayar, semakin kompleks penggunaannya semakin banyak pula yang harus dibayar, tapi token di dashboard infrastruktur yang biasa Anda gunakan, pada dasarnya tidak terlihat.
Yang lebih merepotkan, nilainya juga bisa berfluktuasi drastis. Pertanyaan yang sama, model mana yang digunakan, bagaimana prompt ditulis, bagaimana agen disusun, token yang terbakar bisa berbeda dalam beberapa orde magnitudo.
Semakin model bergerak ke arah "agen (agentic)", semakin banyak token yang dikonsumsi. Sebuah agen menjalankan satu tugas untuk Anda, di belakangnya bisa jadi puluhan bahkan ratusan kali panggilan model, setiap kali itu membakar uang.
Secara alami sulit diprediksi, sulit dijelaskan, itulah cara "zona abu-abu" penagihan lebih ini muncul.
Perkataan Hahn sangat tepat: Tagihan AI, semakin tidak transparan. Kalimat ini tepat mengenai titik lemah seluruh industri.
AI dari awal "dikenakan biaya per panggilan", hingga hari ini menjadi "multi-model + multi-agen + perantara cloud", rantai tagihan semakin panjang: vendor model menagih sekali, vendor cloud menagih sekali, dan SDK perantara yang ada di tengah memutar lagi sekali.
Masing-masing terlihat masuk akal, tapi ketika ketiganya bertumpuk, sulit untuk langsung melihat uang ini sebenarnya dibelanjakan untuk apa.
Yang lebih parah, uang seringkali tidak terbakar di tempat yang Anda lihat.
Skenario yang benar-benar menghabiskan tagihan, hampir semuanya tersembunyi di belakang layar, dan setiap jenisnya ada issue GitHub atau laporan insiden yang dapat diperiksa secara publik.

Setelah melihat delapan jenis ini, Anda akan menemukan, entah itu konteks yang berulang kali dikirim ulang, atau sub-agen yang berputar sepanjang malam tanpa ada yang mengawasi, tagihan pun di tempat yang tidak Anda lihat, semakin membesar sendiri.
Langganan US$200, Tagihan US$50.000
Tantangan tagihan AI yang dihadapi Anthropic, tidak hanya sekali.
Pada 15 Juni, seorang klien di Washington D.C., Karl Kahn, menggugat Anthropic di pengadilan federal, menuduhnya melakukan "ketidaksesuaian barang" pada langganan berharga tinggi.

Menurut The Wall Street Journal, Max 5x Anthropic seharga US$100 per bulan, Max 20x seharga US$200 per bulan, dengan poin penjualan saat promosi adalah 5 kali dan 20 kali batas penggunaan paket Pro.
Tapi Kahn mengatakan, jumlah yang sebenarnya bisa digunakan jauh lebih rendah dari yang diiklankan.
Dia meningkatkan ke Max 20x pada April tahun ini, tapi dalam beberapa minggu sudah mencapai batas penggunaan mingguan, sekali sprint 5 jam, langsung menghabiskan 15% kuota mingguan.
Entah berhenti bekerja, entah menghemat penggunaannya, atau membayar lagi untuk tambahan, dia dipaksa hanya tersisa tiga jalan ini.
Dasar gugatan ini, terutama adalah beberapa email yang dikirim Anthropic pada Juli 2025 kepada pelanggan dengan tingkat langganan berbeda, yang menuliskan kira-kira berapa banyak yang bisa digunakan setiap tingkat per minggu.
Penggugat justru mengambil dokumen hitam di atas putih ini, untuk membandingkan dengan kuota yang sebenarnya diterima, dan menyimpulkan "jauh lebih rendah dari iklan".
Gugatan meminta status class action, mencakup semua orang yang membeli dua paket ini sejak April 2025.
Mencari Kesalahan Tagihan AI, Sedang Menjadi Sebuah Bisnis
Vaudit yang "membongkar" tagihan AI, didirikan pada 2023, timnya sekitar 30 orang.
Pendirinya, Hahn, adalah mantan direktur Oracle, latar belakangnya adalah audit tagihan logistik, transportasi, iklan, dan layanan cloud, sederhananya, dia adalah spesialis yang membantu orang "memeriksa tagihan dan menghemat uang".
Awal tahun ini, dia memindahkan keterampilan ini persis seperti itu ke tagihan AI.

Situs web Vaudit menulis: Memantau dan menagih kembali setiap pengeluaran AI Anda, saat ini telah mengaudit total lebih dari US$1 miliar.
Cara kerja Vaudit sederhana dan kasar:
Klien memasang sepotong perangkat lunak ke lingkungan AI mereka, biasanya melalui software development kit (SDK), menangkap diam-diam data mentah penggunaan AI, lalu mencocokkannya satu per satu dengan faktur dan tagihan. Jika tidak cocok, Vaudit akan mengajukan banding atas nama klien.
Cara pembayarannya juga langsung: 1% dari jumlah yang diaudit, 30% dari uang yang berhasil ditagih kembali. Semakin banyak yang berhasil ditagih kembali untuk klien, semakin banyak pula yang dihasilkannya sendiri.
Khusus mencari kesalahan tagihan AI, ternyata bisa dijadikan sebuah bisnis. Hal ini sendiri menunjukkan: Penagihan AI sudah sangat kompleks hingga harus meminta "pihak ketiga untuk memeriksa tagihan".
Dan semua ini, kebetulan terjadi pada momen waktu yang微妙.
Anthropic dan OpenAI sama-sama sedang berlomba menuju IPO, bergegas memberikan fitur-fitur baru kepada klien. Di satu sisi ada lomba valuasi dan pendapatan, di sisi lain ada pengguna berbayar yang mengerutkan kening melihat tagihan yang tidak bisa dipahami.
Maka sebuah profesi baru pun muncul: "Akuntan Pajak Tagihan" era AI.
Dan tagihan AI yang Anda pegang, siapa yang pernah menghitungnya untuk Anda?
Referensi:
https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi
Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录






