Claude Borong 5 Miliar, Naik 60 Kali dalam Semalam, Tagihan Token Anda Masih Bertahan?

marsbit发布于2026-06-01更新于2026-06-01

文章摘要

Sebuah perusahaan dikabarkan menghabiskan tagihan $500 juta dalam sebulan di Claude karena lupa menetapkan batas penggunaan. Kasus kebocoran biaya AI lainnya termasuk pengguna Google Cloud yang ditagih $18.000 akibat penyalahgunaan API key, serta eksperiman OpenAI internal yang menghabiskan $1,3 juta untuk 760 juta permintaan dari 100 agen Codex. Pemicu utama lonjakan tagihan adalah peralihan model pembayaran AI dari langganan bulanan ke penggunaan berbasis token, seperti yang diterapkan OpenAI pada April dan GitHub Copilot mulai 1 Juni 2026. Perubahan ini membuat tugas berat seperti pengkodean oleh agen AI menjadi jauh lebih mahal, memicu keluhan pengguna karena biaya melonjak puluhan kali lipat. Di sisi lain, budaya "token maxxing" atau membakar token demi peringkat internal (seperti di Amazon) juga menyia-nyiakan sumber daya. Namun, bisnis seperti Glean dan Factory AI muncul dengan solusi mengoptimalkan konteks dan merutekan tugas ke model yang tepat untuk menghemat token. Penelitian menunjukkan konsumsi token oleh agen AI bisa ribuan kali lebih tinggi, namun biaya lebih tinggi tidak selalu menjamin akurasi lebih baik. CEO Glean Arvind Jain mencatat bahwa biaya AI kini mulai menyamai biaya tenaga kerja di beberapa perusahaan, menandai perlunya efisiensi. Intinya: era penggunaan AI tanpa batas berakhir. Kesuksesan di masa depan akan ditentukan oleh kemampuan mengelola dan mengoptimalkan setiap token dengan bijak.

Tagihan 500 Juta Dolar Terbakar dalam 1 Bulan!

Belakangan ini, komunitas teknologi dikejutkan oleh sebuah kesalahan besar. Menurut laporan Axios, sebuah perusahaan berhasil menghabiskan 500 juta dolar di Claude hanya dalam waktu 1 bulan!

Alasannya lucu sekaligus memprihatinkan: pihak manajemen lupa menetapkan batas penggunaan saat memberikan izin akses akun Claude kepada karyawan.

Sebenarnya, kasus tagihan AI meledak bukan hanya terjadi di perusahaan ini.

Pada April tahun ini, seorang pengguna Google Cloud menerima tagihan 18 ribu dolar dalam semalam, padahal anggarannya hanya 7 dolar, karena API key yang tersisa di layanan publiknya disalahgunakan.

Pengguna malang tersebut bernama Jesse Davies, seorang konsultan AI asal Australia dan pendiri Agentic Labs. Dia memasang dua lapis pengaman untuk akun Google Cloud-nya: peringatan anggaran 10 AUD (sekitar 7 USD) dan batas pengeluaran keras 1400 USD.

Menurut laporan Tom's Hardware, penyerang menemukan layanan Cloud Run yang dia rilis beberapa bulan lalu dari AI Studio, mengirim lebih dari 60 ribu permintaan. Kedua pengaman itu gagal menahan: perhitungan tagihan tertunda, ketika sistem bereaksi, jumlahnya sudah melonjak menjadi 18 ribu USD.

Pertengahan Mei, Peter Steinberger, pendiri proyek open-source OpenClaw, memposting tangkapan layar di X: Tagihan API OpenAI 1,3 juta dolar dalam 30 hari.

Timnya hanya tiga orang, tetapi mereka mengendalikan 100 agen Codex yang berjalan paralel: menghabiskan 603 miliar Token, menghasilkan 7,6 juta permintaan dalam 30 hari. Untungnya, 1,3 juta dolar itu tidak dia bayar sendiri.

Steinberger bergabung dengan OpenAI pada Februari tahun ini, dan 1,3 juta USD tersebut dianggap sebagai eksperimen internal:

Menguji sejauh apa pemrograman AI bisa mencapai batasnya jika biaya Token tidak dipertimbangkan. Dia menambahkan, ini adalah hasil dari mode "Fast Mode" Codex (penagihan gigi tinggi), setelah dimatikan biayanya sekitar 300 ribu USD.

Lebih awal, CTO Uber, Praveen Neppalli Naga, juga mengakui kepada The Information bahwa perusahaan telah menghabiskan anggaran Claude Code tahunan pada bulan April. COO mereka juga secara terbuka menyatakan bahwa biaya AI semakin "sulit dibenarkan".

500 juta, 1,3 juta, 18 ribu, meskipun jumlahnya berbeda beberapa tingkat, semuanya mengarah pada fakta yang sama:

Di era agen, kunci yang tidak terkendali, pasukan agen yang bekerja tanpa henti siang dan malam, akun yang lupa diberi batas: salah satunya dapat membuat tagihan Token Anda meledak dalam semalam.

Mengapa Tagihan AI Bisa Meledak?

Jawabannya terutama terletak pada perubahan cara penagihan.

Mulai April tahun ini, metode penagihan bulanan OpenAI mulai beralih ke penagihan berdasarkan penggunaan Token.

Pada 2 April, penagihan Codex berubah dari estimasi berdasarkan pesan menjadi penyesuaian berdasarkan penggunaan Token: Token masukan, masukan cache, dan keluaran dihitung terpisah. Pada 23 April, aturan ini diperluas ke semua paket Enterprise, Edu, Health, Gov: diskon tak terlihat dalam biaya bulanan dihapus.

GitHub juga segera mengikuti, baru saja mengumumkan secara resmi: Semua paket Copilot mulai 1 Juni 2026 akan beralih ke penagihan berdasarkan penggunaan. Logika permintaan lanjutan lama dihapus, diganti dengan kuota AI, diselesaikan berdasarkan konsumsi aktual Token masukan, keluaran, dan cache, sesuai dengan tarif API setiap model.

GitHub menjelaskan alasan melakukan hal ini:

Saat ini, pertanyaan chat cepat, dan tugas pengkodean otonom yang berjalan beberapa jam, biayanya sama bagi pengguna. GitHub selama ini telah menanggung biaya pengguna yang menjalankan tugas berat, tetapi model ini sudah tidak berkelanjutan.

Sebelum kemunculan agen AI, biaya chat dan penyelesaian kira-kira sama, biaya bulanan masih bisa menutupi.

Setelah kemunculan agen, satu tugas dapat berjalan terus-menerus selama beberapa jam, mengubah seluruh basis kode, perbedaan biaya antara pengguna berat dan ringan dapat mencapai beberapa tingkat. Sistem biaya bulanan langsung runtuh di hadapan kesenjangan ini.

Begitu berita ini keluar, Reddit dan X ramai dengan protes.

Seorang pengembang dengan ID JBusu membagikan tangkapan layar tagihan, menyatakan langsung bahwa harga baru ini "hanya lelucon". Biaya sebelumnya 28,12 USD/bulan, menurut sistem baru harus membayar 746,01 USD. Dia telah memutuskan untuk berhenti berlangganan, "Dengan harga ini, saya sendiri menyewa server cloud masih lebih murah".

Pengguna lain menunjukkan tangkapan layar yang lebih ekstrem, biaya melonjak dari 50 USD menjadi 3000 USD. Dia berkata tidak menyangka harga bisa separah ini, "Masih ada yang terus berlangganan?"

Namun, ada juga pengguna lama Copilot yang membantah: Tagihan ekstrem ini kemungkinan besar dihasilkan oleh para vibe-coder (pengkode berdasarkan perasaan) yang tidak peduli membakar Token, belum tentu mewakili penggunaan normal.

Seorang pengguna lama berkomentar di bagian komentar: "Saya menggunakannya sepanjang hari, pada akhir bulan hampir tidak pernah melebihi batas, sulit dipercaya ini adalah perbedaan kompleksitas pekerjaan." Yang lain lebih langsung: "Ada orang yang ingin pengembangan mode YOLO sepenuhnya otomatis, membiarkan AI berjalan sembarangan. Pemborosan seperti ini dihilangkan justru baik bagi orang lain."

Satu hal yang harus jelas: GitHub tidak menghapus biaya bulanan, harga langganan dasar tidak berubah. Yang benar-benar berubah adalah penggunaan tambahan, tugas agen, pemanggilan model yang lebih mahal, mulai sekarang masuk ke penagihan berdasarkan penggunaan.

Yang paling terpukul adalah pengguna agen berat yang mengandalkan Copilot untuk menjalankan tugas berantai panjang.

Peringkat yang Dirusak oleh Rekan Sendiri

Kejatuhan sistem bulanan, di satu sisi karena platform mengubah aturan penagihan, di sisi lain, orang yang menggunakan AI sendiri juga membakar dengan keras.

Pada Mei, Business Insider melaporkan bahwa Amazon menonaktifkan peringkat penggunaan AI internal bernama KiroRank.

Laporan tersebut mengutip sumber yang mengetahui bahwa papan peringkat ini diam-diam menciptakan cara kerja yang aneh: beberapa karyawan untuk naik beberapa posisi di papan peringkat, akan membakar konsumsi Token yang sebenarnya tidak menyelesaikan masalah nyata, murni untuk peringkat.

Setelah masalah ini terungkap, Wakil Presiden Senior Amazon, Dave Treadwell, langsung berpidato kepada seluruh staf: "Jangan menggunakan AI hanya untuk menggunakan AI. Gunakan untuk menyelesaikan masalah pelanggan, menyelesaikan masalah bisnis, untuk berinovasi."

Meskipun hal ini agak konyol, tetapi sama sekali tidak mengejutkan. Ketika "membakar Token" bisa masuk peringkat, karyawan secara alami akan membakar Token.

Silicon Valley memberi nama khusus untuk fenomena ini: Token maxxing (membakar Token ekstrem), menganggap volume konsumsi sebagai produktivitas.

Laporan Axios juga menyebutkan, ada CTO yang menemukan karyawan menggunakan model AI untuk memeriksa cuaca, menulis email sehari-hari, hal-hal yang sangat sederhana, dipasangkan dengan model terkini termahal, tagihan dapat melonjak diam-diam.

KiroRank bukan bagian dari sistem penilaian resmi Amazon, melainkan alat informal yang dibuat secara spontan oleh karyawan. Tetapi ini dengan jelas mengekspos sebuah hukum manajemen klasik: Ketika KPI salah ditetapkan, orang akan menggunakan cara paling cerdas untuk mencari celah.

Menyamakan "berapa banyak digunakan" dengan "seberapa baik kinerjanya"—inilah akar kelembagaan pemborosan AI gelombang ini.

Orang yang Menghitung Token, Sudah Mulai Menghasilkan Uang

Sisi lain dari kecemasan tagihan Token, ada orang yang diam-diam menjadikannya bisnis.

Jalur pertama: Memberi makan AI dengan konteks.

Glean adalah perusahaan milik Arvind sendiri. Yang dilakukannya adalah asisten kerja AI perusahaan: Menyatukan pengetahuan yang tersebar di seluruh perusahaan, memungkinkan AI karyawan langsung mendapatkan konteks, tidak perlu lagi mencari-cari. AI mengurangi jalan memutar, Token yang dibakar secara alami berkurang.

Mekanisme ini membuat pendapatan tahunan Glean naik tiga kali lipat dalam 15 bulan, melewati 300 juta dolar, klien termasuk Databricks, Reddit, Samsung.

Jalur kedua: Membagi pekerjaan ke model yang tepat.

Perusahaan rintisan perutean model Factory AI melakukan hal ini: secara otomatis mengirimkan setiap tugas ke model yang paling sesuai, tugas sederhana menggunakan tingkat murah, tugas kompleks menggunakan tingkat teratas. Arvind juga pernah mengatakan: Jika perutean dilakukan dengan benar, dapat menghemat 10 kali lipat.

Kedua jalur ini bermuara pada tujuan yang sama: Biarkan AI bekerja, tetapi jangan biarkan membakar sembarangan.

Penelitian di lingkaran akademis juga sedang membangun fondasi untuk perubahan ini.

https://arxiv.org/pdf/2604.22750

Sebuah makalah arXiv pada April 2026, untuk pertama kalinya secara sistematis membongkar bagaimana tugas pengkodean agen benar-benar menghabiskan uang.

Kesimpulan satu: Konsumsi Token tugas agen dapat mencapai ribuan kali lipat dari penalaran kode biasa dan percakapan kode, penyebab utama tingginya biaya adalah Token masukan.

Kesimpulan dua: Tugas yang sama dijalankan beberapa kali, konsumsi Token dapat berbeda 30 kali lipat.

Kesimpulan tiga: Konsumsi Token yang lebih tinggi, tidak selalu menghasilkan akurasi yang lebih tinggi. Presisi sering kali memuncak pada biaya menengah—jika dibakar lebih lanjut, uang dihabiskan, efeknya justru jenuh.

Makalah ini juga menemukan bahwa model terkini bahkan tidak dapat memprediksi berapa banyak Token yang akan mereka bakar, secara umum meremehkan biaya sebenarnya.

Anda pikir dengan membayar lebih banyak, pekerjaan akan lebih baik. Kenyataannya adalah Uang dihabiskan, pekerjaan belum tentu lebih baik, anggaran bahkan tidak dapat diperkirakan dengan akurat.

Ketika Tagihan AI Mulai Menyamai Biaya Tenaga Kerja

"Ini pertama kalinya dalam ingatan saya, biaya teknologi mulai menyamai biaya tenaga kerja."

Pada 29 Mei, CEO Glean Arvind Jain mengatakan hal ini dalam wawancara dengan jurnalis CNBC Deirdre Bosa.

Observasi Wakil Presiden Deep Learning Terapan Nvidia, Bryan Catanzaro, juga membuktikan hal ini.

Dia menyebutkan dalam wawancara Axios: Bagi timnya, biaya komputasi telah jauh melebihi gaji karyawan.

Fenomena serupa sedang muncul di beberapa perusahaan: Dari Glean yang membuat AI perusahaan, hingga Nvidia yang menjual daya komputasi AI, hingga Uber yang menggunakan AI, semuanya sedang meninjau ulang perhitungan ini.

Menurut Arvind, dalam sejarah, teknologi hanyalah bagian kecil dari total biaya perusahaan, tetapi sekarang biaya AI sudah bisa mengejar gaji, anggaran AI tahunan banyak perusahaan biasanya habis dalam satu hingga dua bulan.

Setahun terakhir, tingkat penggunaan AI adalah metrik yang dipuja: menggunakan lebih banyak berarti maju, membakar Token berarti merangkul masa depan. Sekarang, banyak perusahaan mulai merenungkan kalimat sederhana itu: Apa yang didapat dari Token yang terbakar ini?

Masa jendela penggunaan bulanan gratis dan tak terbatas, justru sedang tertutup saat ini.

Selanjutnya, di hadapan semua pengembang adalah pertanyaan seperti ini: Bagaimana menghitung dengan cermat, membuat setiap Token memberikan nilai maksimal.

Pemenang sejati di masa depan, tidak diragukan lagi, adalah yang pertama kali belajar menghitung tagihan Token.

Referensi:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录

相关问答

QApa yang menyebabkan perusahaan membakar tagihan sebesar 5 miliar dolar dalam sebulan di Claude?

AManajemen perusahaan lupa menetapkan batas penggunaan saat memberikan akses akun Claude kepada karyawan, sehingga terjadi pembakaran token tanpa kendali.

QBagaimana perubahan model penagihan OpenAI dan GitHub Copilot memengaruhi pengguna?

AOpenAI dan GitHub Copilot beralih dari model langganan bulanan ke penagihan berdasarkan penggunaan token, yang menyebabkan biaya melonjak drastis bagi pengguna berat, terutama yang menggunakan agen AI untuk tugas panjang.

QApa yang dimaksud dengan 'Token maxxing' yang disebutkan dalam artikel?

A'Token maxxing' adalah istilah untuk perilaku membakar token secara berlebihan hanya untuk meningkatkan peringkat dalam sistem atau sekadar terlihat produktif, tanpa menghasilkan nilai yang sebenarnya.

QMenurut penelitian akademis, apa hubungan antara konsumsi token dan akurasi dalam tugas pengkodean agen AI?

APenelitian menunjukkan bahwa konsumsi token yang lebih tinggi tidak selalu menghasilkan akurasi yang lebih baik. Akurasi sering mencapai puncaknya pada biaya menengah, dan membakar token lebih banyak setelahnya tidak meningkatkan hasil secara signifikan.

QMengapa biaya AI mulai dibandingkan dengan biaya tenaga kerja di beberapa perusahaan?

ABiaya penggunaan AI (terutama untuk token dan komputasi) dalam beberapa kasus telah menyamai atau bahkan melampaui biaya gaji karyawan, mendorong perusahaan untuk mempertanyakan nilai dan efisiensi dari setiap token yang dibakar.

你可能也喜欢

解读Agent商业、支付与基础设施的真相

作者基于一年来为Agent经济构建基础设施的经验,指出当前Agent商业尚未形成真实、规模化的市场需求,初创公司面临结构性挑战。 文章分析了四个关键场景: 1. **Agent对商户**:目前电商体验中,聊天界面在视觉比价购物上逊于传统界面,商户接入多出于防御性“优化”心态。对话式商业在如外卖等高頻、低决策场景有潜力,但受限于平台开放性和成本。 2. **Agent对API**:开发者现有支付方式(如预付)已能处理低频、小额的API调用成本问题。真正的机会在于服务长尾、小众的供应商市场,但规模有限。 3. **Agent对Agent**:这是长期的愿景,涉及机器间的自动交易与结算,需求真实但当前市场几乎为零,需要专用的基础设施。 4. **Agent对金融**:这是唯一存在现成需求和付费客户的领域。将AI嵌入金融工作流是自然演进,但竞争激烈,老牌机构优势明显。 文章认为,行业巨头因资金充足和战略防御而持续投入,但对初创公司而言,真正的机会并非单纯构建支付层。支付只是更宏大问题——**Agent与人类的协同工作、验证与结算**——的一部分。未来,解决协同问题的公司将主导市场,而非支付服务商。作者团队已转向一个存在真实需求、快速增长且未被充分服务的领域。

marsbit2小时前

解读Agent商业、支付与基础设施的真相

marsbit2小时前

交易

现货
合约

热门文章

如何购买BILL

欢迎来到HTX.com!我们已经让购买Billions Network(BILL)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Billions Network(BILL)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Billions Network(BILL)购买完您的Billions Network(BILL)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Billions Network(BILL)在HTX的现货市场轻松交易Billions Network(BILL)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

494人学过发布于 2026.05.07更新于 2026.06.02

如何购买BILL

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对BILL(BILL)币价的意见。

活动图片