Tagihan 500 Juta Dolar Terbakar dalam 1 Bulan!
Belakangan ini, komunitas teknologi dikejutkan oleh sebuah kesalahan besar. Menurut laporan Axios, sebuah perusahaan berhasil menghabiskan 500 juta dolar di Claude hanya dalam waktu 1 bulan!
Alasannya lucu sekaligus memprihatinkan: pihak manajemen lupa menetapkan batas penggunaan saat memberikan izin akses akun Claude kepada karyawan.
Sebenarnya, kasus tagihan AI meledak bukan hanya terjadi di perusahaan ini.
Pada April tahun ini, seorang pengguna Google Cloud menerima tagihan 18 ribu dolar dalam semalam, padahal anggarannya hanya 7 dolar, karena API key yang tersisa di layanan publiknya disalahgunakan.
Pengguna malang tersebut bernama Jesse Davies, seorang konsultan AI asal Australia dan pendiri Agentic Labs. Dia memasang dua lapis pengaman untuk akun Google Cloud-nya: peringatan anggaran 10 AUD (sekitar 7 USD) dan batas pengeluaran keras 1400 USD.
Menurut laporan Tom's Hardware, penyerang menemukan layanan Cloud Run yang dia rilis beberapa bulan lalu dari AI Studio, mengirim lebih dari 60 ribu permintaan. Kedua pengaman itu gagal menahan: perhitungan tagihan tertunda, ketika sistem bereaksi, jumlahnya sudah melonjak menjadi 18 ribu USD.
Pertengahan Mei, Peter Steinberger, pendiri proyek open-source OpenClaw, memposting tangkapan layar di X: Tagihan API OpenAI 1,3 juta dolar dalam 30 hari.
Timnya hanya tiga orang, tetapi mereka mengendalikan 100 agen Codex yang berjalan paralel: menghabiskan 603 miliar Token, menghasilkan 7,6 juta permintaan dalam 30 hari. Untungnya, 1,3 juta dolar itu tidak dia bayar sendiri.
Steinberger bergabung dengan OpenAI pada Februari tahun ini, dan 1,3 juta USD tersebut dianggap sebagai eksperimen internal:
Menguji sejauh apa pemrograman AI bisa mencapai batasnya jika biaya Token tidak dipertimbangkan. Dia menambahkan, ini adalah hasil dari mode "Fast Mode" Codex (penagihan gigi tinggi), setelah dimatikan biayanya sekitar 300 ribu USD.
Lebih awal, CTO Uber, Praveen Neppalli Naga, juga mengakui kepada The Information bahwa perusahaan telah menghabiskan anggaran Claude Code tahunan pada bulan April. COO mereka juga secara terbuka menyatakan bahwa biaya AI semakin "sulit dibenarkan".
500 juta, 1,3 juta, 18 ribu, meskipun jumlahnya berbeda beberapa tingkat, semuanya mengarah pada fakta yang sama:
Di era agen, kunci yang tidak terkendali, pasukan agen yang bekerja tanpa henti siang dan malam, akun yang lupa diberi batas: salah satunya dapat membuat tagihan Token Anda meledak dalam semalam.
Mengapa Tagihan AI Bisa Meledak?
Jawabannya terutama terletak pada perubahan cara penagihan.
Mulai April tahun ini, metode penagihan bulanan OpenAI mulai beralih ke penagihan berdasarkan penggunaan Token.
Pada 2 April, penagihan Codex berubah dari estimasi berdasarkan pesan menjadi penyesuaian berdasarkan penggunaan Token: Token masukan, masukan cache, dan keluaran dihitung terpisah. Pada 23 April, aturan ini diperluas ke semua paket Enterprise, Edu, Health, Gov: diskon tak terlihat dalam biaya bulanan dihapus.
GitHub juga segera mengikuti, baru saja mengumumkan secara resmi: Semua paket Copilot mulai 1 Juni 2026 akan beralih ke penagihan berdasarkan penggunaan. Logika permintaan lanjutan lama dihapus, diganti dengan kuota AI, diselesaikan berdasarkan konsumsi aktual Token masukan, keluaran, dan cache, sesuai dengan tarif API setiap model.
GitHub menjelaskan alasan melakukan hal ini:
Saat ini, pertanyaan chat cepat, dan tugas pengkodean otonom yang berjalan beberapa jam, biayanya sama bagi pengguna. GitHub selama ini telah menanggung biaya pengguna yang menjalankan tugas berat, tetapi model ini sudah tidak berkelanjutan.
Sebelum kemunculan agen AI, biaya chat dan penyelesaian kira-kira sama, biaya bulanan masih bisa menutupi.
Setelah kemunculan agen, satu tugas dapat berjalan terus-menerus selama beberapa jam, mengubah seluruh basis kode, perbedaan biaya antara pengguna berat dan ringan dapat mencapai beberapa tingkat. Sistem biaya bulanan langsung runtuh di hadapan kesenjangan ini.
Begitu berita ini keluar, Reddit dan X ramai dengan protes.
Seorang pengembang dengan ID JBusu membagikan tangkapan layar tagihan, menyatakan langsung bahwa harga baru ini "hanya lelucon". Biaya sebelumnya 28,12 USD/bulan, menurut sistem baru harus membayar 746,01 USD. Dia telah memutuskan untuk berhenti berlangganan, "Dengan harga ini, saya sendiri menyewa server cloud masih lebih murah".
Pengguna lain menunjukkan tangkapan layar yang lebih ekstrem, biaya melonjak dari 50 USD menjadi 3000 USD. Dia berkata tidak menyangka harga bisa separah ini, "Masih ada yang terus berlangganan?"
Namun, ada juga pengguna lama Copilot yang membantah: Tagihan ekstrem ini kemungkinan besar dihasilkan oleh para vibe-coder (pengkode berdasarkan perasaan) yang tidak peduli membakar Token, belum tentu mewakili penggunaan normal.
Seorang pengguna lama berkomentar di bagian komentar: "Saya menggunakannya sepanjang hari, pada akhir bulan hampir tidak pernah melebihi batas, sulit dipercaya ini adalah perbedaan kompleksitas pekerjaan." Yang lain lebih langsung: "Ada orang yang ingin pengembangan mode YOLO sepenuhnya otomatis, membiarkan AI berjalan sembarangan. Pemborosan seperti ini dihilangkan justru baik bagi orang lain."
Satu hal yang harus jelas: GitHub tidak menghapus biaya bulanan, harga langganan dasar tidak berubah. Yang benar-benar berubah adalah penggunaan tambahan, tugas agen, pemanggilan model yang lebih mahal, mulai sekarang masuk ke penagihan berdasarkan penggunaan.
Yang paling terpukul adalah pengguna agen berat yang mengandalkan Copilot untuk menjalankan tugas berantai panjang.
Peringkat yang Dirusak oleh Rekan Sendiri
Kejatuhan sistem bulanan, di satu sisi karena platform mengubah aturan penagihan, di sisi lain, orang yang menggunakan AI sendiri juga membakar dengan keras.
Pada Mei, Business Insider melaporkan bahwa Amazon menonaktifkan peringkat penggunaan AI internal bernama KiroRank.
Laporan tersebut mengutip sumber yang mengetahui bahwa papan peringkat ini diam-diam menciptakan cara kerja yang aneh: beberapa karyawan untuk naik beberapa posisi di papan peringkat, akan membakar konsumsi Token yang sebenarnya tidak menyelesaikan masalah nyata, murni untuk peringkat.
Setelah masalah ini terungkap, Wakil Presiden Senior Amazon, Dave Treadwell, langsung berpidato kepada seluruh staf: "Jangan menggunakan AI hanya untuk menggunakan AI. Gunakan untuk menyelesaikan masalah pelanggan, menyelesaikan masalah bisnis, untuk berinovasi."
Meskipun hal ini agak konyol, tetapi sama sekali tidak mengejutkan. Ketika "membakar Token" bisa masuk peringkat, karyawan secara alami akan membakar Token.
Silicon Valley memberi nama khusus untuk fenomena ini: Token maxxing (membakar Token ekstrem), menganggap volume konsumsi sebagai produktivitas.
Laporan Axios juga menyebutkan, ada CTO yang menemukan karyawan menggunakan model AI untuk memeriksa cuaca, menulis email sehari-hari, hal-hal yang sangat sederhana, dipasangkan dengan model terkini termahal, tagihan dapat melonjak diam-diam.
KiroRank bukan bagian dari sistem penilaian resmi Amazon, melainkan alat informal yang dibuat secara spontan oleh karyawan. Tetapi ini dengan jelas mengekspos sebuah hukum manajemen klasik: Ketika KPI salah ditetapkan, orang akan menggunakan cara paling cerdas untuk mencari celah.
Menyamakan "berapa banyak digunakan" dengan "seberapa baik kinerjanya"—inilah akar kelembagaan pemborosan AI gelombang ini.
Orang yang Menghitung Token, Sudah Mulai Menghasilkan Uang
Sisi lain dari kecemasan tagihan Token, ada orang yang diam-diam menjadikannya bisnis.
Jalur pertama: Memberi makan AI dengan konteks.
Glean adalah perusahaan milik Arvind sendiri. Yang dilakukannya adalah asisten kerja AI perusahaan: Menyatukan pengetahuan yang tersebar di seluruh perusahaan, memungkinkan AI karyawan langsung mendapatkan konteks, tidak perlu lagi mencari-cari. AI mengurangi jalan memutar, Token yang dibakar secara alami berkurang.
Mekanisme ini membuat pendapatan tahunan Glean naik tiga kali lipat dalam 15 bulan, melewati 300 juta dolar, klien termasuk Databricks, Reddit, Samsung.
Jalur kedua: Membagi pekerjaan ke model yang tepat.
Perusahaan rintisan perutean model Factory AI melakukan hal ini: secara otomatis mengirimkan setiap tugas ke model yang paling sesuai, tugas sederhana menggunakan tingkat murah, tugas kompleks menggunakan tingkat teratas. Arvind juga pernah mengatakan: Jika perutean dilakukan dengan benar, dapat menghemat 10 kali lipat.
Kedua jalur ini bermuara pada tujuan yang sama: Biarkan AI bekerja, tetapi jangan biarkan membakar sembarangan.
Penelitian di lingkaran akademis juga sedang membangun fondasi untuk perubahan ini.
https://arxiv.org/pdf/2604.22750
Sebuah makalah arXiv pada April 2026, untuk pertama kalinya secara sistematis membongkar bagaimana tugas pengkodean agen benar-benar menghabiskan uang.
Kesimpulan satu: Konsumsi Token tugas agen dapat mencapai ribuan kali lipat dari penalaran kode biasa dan percakapan kode, penyebab utama tingginya biaya adalah Token masukan.
Kesimpulan dua: Tugas yang sama dijalankan beberapa kali, konsumsi Token dapat berbeda 30 kali lipat.
Kesimpulan tiga: Konsumsi Token yang lebih tinggi, tidak selalu menghasilkan akurasi yang lebih tinggi. Presisi sering kali memuncak pada biaya menengah—jika dibakar lebih lanjut, uang dihabiskan, efeknya justru jenuh.
Makalah ini juga menemukan bahwa model terkini bahkan tidak dapat memprediksi berapa banyak Token yang akan mereka bakar, secara umum meremehkan biaya sebenarnya.
Anda pikir dengan membayar lebih banyak, pekerjaan akan lebih baik. Kenyataannya adalah Uang dihabiskan, pekerjaan belum tentu lebih baik, anggaran bahkan tidak dapat diperkirakan dengan akurat.
Ketika Tagihan AI Mulai Menyamai Biaya Tenaga Kerja
"Ini pertama kalinya dalam ingatan saya, biaya teknologi mulai menyamai biaya tenaga kerja."
Pada 29 Mei, CEO Glean Arvind Jain mengatakan hal ini dalam wawancara dengan jurnalis CNBC Deirdre Bosa.
Observasi Wakil Presiden Deep Learning Terapan Nvidia, Bryan Catanzaro, juga membuktikan hal ini.
Dia menyebutkan dalam wawancara Axios: Bagi timnya, biaya komputasi telah jauh melebihi gaji karyawan.
Fenomena serupa sedang muncul di beberapa perusahaan: Dari Glean yang membuat AI perusahaan, hingga Nvidia yang menjual daya komputasi AI, hingga Uber yang menggunakan AI, semuanya sedang meninjau ulang perhitungan ini.
Menurut Arvind, dalam sejarah, teknologi hanyalah bagian kecil dari total biaya perusahaan, tetapi sekarang biaya AI sudah bisa mengejar gaji, anggaran AI tahunan banyak perusahaan biasanya habis dalam satu hingga dua bulan.
Setahun terakhir, tingkat penggunaan AI adalah metrik yang dipuja: menggunakan lebih banyak berarti maju, membakar Token berarti merangkul masa depan. Sekarang, banyak perusahaan mulai merenungkan kalimat sederhana itu: Apa yang didapat dari Token yang terbakar ini?
Masa jendela penggunaan bulanan gratis dan tak terbatas, justru sedang tertutup saat ini.
Selanjutnya, di hadapan semua pengembang adalah pertanyaan seperti ini: Bagaimana menghitung dengan cermat, membuat setiap Token memberikan nilai maksimal.
Pemenang sejati di masa depan, tidak diragukan lagi, adalah yang pertama kali belajar menghitung tagihan Token.
Referensi:
https://x.com/dee_bosa/status/2060791500049613306%20
https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20
https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20
https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5
Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录

















