Claude Borong 5 Miliar, Naik 60 Kali dalam Semalam, Tagihan Token Anda Masih Bertahan?

marsbitPublicado a 2026-06-01Actualizado a 2026-06-01

Resumen

Sebuah perusahaan dikabarkan menghabiskan tagihan $500 juta dalam sebulan di Claude karena lupa menetapkan batas penggunaan. Kasus kebocoran biaya AI lainnya termasuk pengguna Google Cloud yang ditagih $18.000 akibat penyalahgunaan API key, serta eksperiman OpenAI internal yang menghabiskan $1,3 juta untuk 760 juta permintaan dari 100 agen Codex. Pemicu utama lonjakan tagihan adalah peralihan model pembayaran AI dari langganan bulanan ke penggunaan berbasis token, seperti yang diterapkan OpenAI pada April dan GitHub Copilot mulai 1 Juni 2026. Perubahan ini membuat tugas berat seperti pengkodean oleh agen AI menjadi jauh lebih mahal, memicu keluhan pengguna karena biaya melonjak puluhan kali lipat. Di sisi lain, budaya "token maxxing" atau membakar token demi peringkat internal (seperti di Amazon) juga menyia-nyiakan sumber daya. Namun, bisnis seperti Glean dan Factory AI muncul dengan solusi mengoptimalkan konteks dan merutekan tugas ke model yang tepat untuk menghemat token. Penelitian menunjukkan konsumsi token oleh agen AI bisa ribuan kali lebih tinggi, namun biaya lebih tinggi tidak selalu menjamin akurasi lebih baik. CEO Glean Arvind Jain mencatat bahwa biaya AI kini mulai menyamai biaya tenaga kerja di beberapa perusahaan, menandai perlunya efisiensi. Intinya: era penggunaan AI tanpa batas berakhir. Kesuksesan di masa depan akan ditentukan oleh kemampuan mengelola dan mengoptimalkan setiap token dengan bijak.

Tagihan 500 Juta Dolar Terbakar dalam 1 Bulan!

Belakangan ini, komunitas teknologi dikejutkan oleh sebuah kesalahan besar. Menurut laporan Axios, sebuah perusahaan berhasil menghabiskan 500 juta dolar di Claude hanya dalam waktu 1 bulan!

Alasannya lucu sekaligus memprihatinkan: pihak manajemen lupa menetapkan batas penggunaan saat memberikan izin akses akun Claude kepada karyawan.

Sebenarnya, kasus tagihan AI meledak bukan hanya terjadi di perusahaan ini.

Pada April tahun ini, seorang pengguna Google Cloud menerima tagihan 18 ribu dolar dalam semalam, padahal anggarannya hanya 7 dolar, karena API key yang tersisa di layanan publiknya disalahgunakan.

Pengguna malang tersebut bernama Jesse Davies, seorang konsultan AI asal Australia dan pendiri Agentic Labs. Dia memasang dua lapis pengaman untuk akun Google Cloud-nya: peringatan anggaran 10 AUD (sekitar 7 USD) dan batas pengeluaran keras 1400 USD.

Menurut laporan Tom's Hardware, penyerang menemukan layanan Cloud Run yang dia rilis beberapa bulan lalu dari AI Studio, mengirim lebih dari 60 ribu permintaan. Kedua pengaman itu gagal menahan: perhitungan tagihan tertunda, ketika sistem bereaksi, jumlahnya sudah melonjak menjadi 18 ribu USD.

Pertengahan Mei, Peter Steinberger, pendiri proyek open-source OpenClaw, memposting tangkapan layar di X: Tagihan API OpenAI 1,3 juta dolar dalam 30 hari.

Timnya hanya tiga orang, tetapi mereka mengendalikan 100 agen Codex yang berjalan paralel: menghabiskan 603 miliar Token, menghasilkan 7,6 juta permintaan dalam 30 hari. Untungnya, 1,3 juta dolar itu tidak dia bayar sendiri.

Steinberger bergabung dengan OpenAI pada Februari tahun ini, dan 1,3 juta USD tersebut dianggap sebagai eksperimen internal:

Menguji sejauh apa pemrograman AI bisa mencapai batasnya jika biaya Token tidak dipertimbangkan. Dia menambahkan, ini adalah hasil dari mode "Fast Mode" Codex (penagihan gigi tinggi), setelah dimatikan biayanya sekitar 300 ribu USD.

Lebih awal, CTO Uber, Praveen Neppalli Naga, juga mengakui kepada The Information bahwa perusahaan telah menghabiskan anggaran Claude Code tahunan pada bulan April. COO mereka juga secara terbuka menyatakan bahwa biaya AI semakin "sulit dibenarkan".

500 juta, 1,3 juta, 18 ribu, meskipun jumlahnya berbeda beberapa tingkat, semuanya mengarah pada fakta yang sama:

Di era agen, kunci yang tidak terkendali, pasukan agen yang bekerja tanpa henti siang dan malam, akun yang lupa diberi batas: salah satunya dapat membuat tagihan Token Anda meledak dalam semalam.

Mengapa Tagihan AI Bisa Meledak?

Jawabannya terutama terletak pada perubahan cara penagihan.

Mulai April tahun ini, metode penagihan bulanan OpenAI mulai beralih ke penagihan berdasarkan penggunaan Token.

Pada 2 April, penagihan Codex berubah dari estimasi berdasarkan pesan menjadi penyesuaian berdasarkan penggunaan Token: Token masukan, masukan cache, dan keluaran dihitung terpisah. Pada 23 April, aturan ini diperluas ke semua paket Enterprise, Edu, Health, Gov: diskon tak terlihat dalam biaya bulanan dihapus.

GitHub juga segera mengikuti, baru saja mengumumkan secara resmi: Semua paket Copilot mulai 1 Juni 2026 akan beralih ke penagihan berdasarkan penggunaan. Logika permintaan lanjutan lama dihapus, diganti dengan kuota AI, diselesaikan berdasarkan konsumsi aktual Token masukan, keluaran, dan cache, sesuai dengan tarif API setiap model.

GitHub menjelaskan alasan melakukan hal ini:

Saat ini, pertanyaan chat cepat, dan tugas pengkodean otonom yang berjalan beberapa jam, biayanya sama bagi pengguna. GitHub selama ini telah menanggung biaya pengguna yang menjalankan tugas berat, tetapi model ini sudah tidak berkelanjutan.

Sebelum kemunculan agen AI, biaya chat dan penyelesaian kira-kira sama, biaya bulanan masih bisa menutupi.

Setelah kemunculan agen, satu tugas dapat berjalan terus-menerus selama beberapa jam, mengubah seluruh basis kode, perbedaan biaya antara pengguna berat dan ringan dapat mencapai beberapa tingkat. Sistem biaya bulanan langsung runtuh di hadapan kesenjangan ini.

Begitu berita ini keluar, Reddit dan X ramai dengan protes.

Seorang pengembang dengan ID JBusu membagikan tangkapan layar tagihan, menyatakan langsung bahwa harga baru ini "hanya lelucon". Biaya sebelumnya 28,12 USD/bulan, menurut sistem baru harus membayar 746,01 USD. Dia telah memutuskan untuk berhenti berlangganan, "Dengan harga ini, saya sendiri menyewa server cloud masih lebih murah".

Pengguna lain menunjukkan tangkapan layar yang lebih ekstrem, biaya melonjak dari 50 USD menjadi 3000 USD. Dia berkata tidak menyangka harga bisa separah ini, "Masih ada yang terus berlangganan?"

Namun, ada juga pengguna lama Copilot yang membantah: Tagihan ekstrem ini kemungkinan besar dihasilkan oleh para vibe-coder (pengkode berdasarkan perasaan) yang tidak peduli membakar Token, belum tentu mewakili penggunaan normal.

Seorang pengguna lama berkomentar di bagian komentar: "Saya menggunakannya sepanjang hari, pada akhir bulan hampir tidak pernah melebihi batas, sulit dipercaya ini adalah perbedaan kompleksitas pekerjaan." Yang lain lebih langsung: "Ada orang yang ingin pengembangan mode YOLO sepenuhnya otomatis, membiarkan AI berjalan sembarangan. Pemborosan seperti ini dihilangkan justru baik bagi orang lain."

Satu hal yang harus jelas: GitHub tidak menghapus biaya bulanan, harga langganan dasar tidak berubah. Yang benar-benar berubah adalah penggunaan tambahan, tugas agen, pemanggilan model yang lebih mahal, mulai sekarang masuk ke penagihan berdasarkan penggunaan.

Yang paling terpukul adalah pengguna agen berat yang mengandalkan Copilot untuk menjalankan tugas berantai panjang.

Peringkat yang Dirusak oleh Rekan Sendiri

Kejatuhan sistem bulanan, di satu sisi karena platform mengubah aturan penagihan, di sisi lain, orang yang menggunakan AI sendiri juga membakar dengan keras.

Pada Mei, Business Insider melaporkan bahwa Amazon menonaktifkan peringkat penggunaan AI internal bernama KiroRank.

Laporan tersebut mengutip sumber yang mengetahui bahwa papan peringkat ini diam-diam menciptakan cara kerja yang aneh: beberapa karyawan untuk naik beberapa posisi di papan peringkat, akan membakar konsumsi Token yang sebenarnya tidak menyelesaikan masalah nyata, murni untuk peringkat.

Setelah masalah ini terungkap, Wakil Presiden Senior Amazon, Dave Treadwell, langsung berpidato kepada seluruh staf: "Jangan menggunakan AI hanya untuk menggunakan AI. Gunakan untuk menyelesaikan masalah pelanggan, menyelesaikan masalah bisnis, untuk berinovasi."

Meskipun hal ini agak konyol, tetapi sama sekali tidak mengejutkan. Ketika "membakar Token" bisa masuk peringkat, karyawan secara alami akan membakar Token.

Silicon Valley memberi nama khusus untuk fenomena ini: Token maxxing (membakar Token ekstrem), menganggap volume konsumsi sebagai produktivitas.

Laporan Axios juga menyebutkan, ada CTO yang menemukan karyawan menggunakan model AI untuk memeriksa cuaca, menulis email sehari-hari, hal-hal yang sangat sederhana, dipasangkan dengan model terkini termahal, tagihan dapat melonjak diam-diam.

KiroRank bukan bagian dari sistem penilaian resmi Amazon, melainkan alat informal yang dibuat secara spontan oleh karyawan. Tetapi ini dengan jelas mengekspos sebuah hukum manajemen klasik: Ketika KPI salah ditetapkan, orang akan menggunakan cara paling cerdas untuk mencari celah.

Menyamakan "berapa banyak digunakan" dengan "seberapa baik kinerjanya"—inilah akar kelembagaan pemborosan AI gelombang ini.

Orang yang Menghitung Token, Sudah Mulai Menghasilkan Uang

Sisi lain dari kecemasan tagihan Token, ada orang yang diam-diam menjadikannya bisnis.

Jalur pertama: Memberi makan AI dengan konteks.

Glean adalah perusahaan milik Arvind sendiri. Yang dilakukannya adalah asisten kerja AI perusahaan: Menyatukan pengetahuan yang tersebar di seluruh perusahaan, memungkinkan AI karyawan langsung mendapatkan konteks, tidak perlu lagi mencari-cari. AI mengurangi jalan memutar, Token yang dibakar secara alami berkurang.

Mekanisme ini membuat pendapatan tahunan Glean naik tiga kali lipat dalam 15 bulan, melewati 300 juta dolar, klien termasuk Databricks, Reddit, Samsung.

Jalur kedua: Membagi pekerjaan ke model yang tepat.

Perusahaan rintisan perutean model Factory AI melakukan hal ini: secara otomatis mengirimkan setiap tugas ke model yang paling sesuai, tugas sederhana menggunakan tingkat murah, tugas kompleks menggunakan tingkat teratas. Arvind juga pernah mengatakan: Jika perutean dilakukan dengan benar, dapat menghemat 10 kali lipat.

Kedua jalur ini bermuara pada tujuan yang sama: Biarkan AI bekerja, tetapi jangan biarkan membakar sembarangan.

Penelitian di lingkaran akademis juga sedang membangun fondasi untuk perubahan ini.

https://arxiv.org/pdf/2604.22750

Sebuah makalah arXiv pada April 2026, untuk pertama kalinya secara sistematis membongkar bagaimana tugas pengkodean agen benar-benar menghabiskan uang.

Kesimpulan satu: Konsumsi Token tugas agen dapat mencapai ribuan kali lipat dari penalaran kode biasa dan percakapan kode, penyebab utama tingginya biaya adalah Token masukan.

Kesimpulan dua: Tugas yang sama dijalankan beberapa kali, konsumsi Token dapat berbeda 30 kali lipat.

Kesimpulan tiga: Konsumsi Token yang lebih tinggi, tidak selalu menghasilkan akurasi yang lebih tinggi. Presisi sering kali memuncak pada biaya menengah—jika dibakar lebih lanjut, uang dihabiskan, efeknya justru jenuh.

Makalah ini juga menemukan bahwa model terkini bahkan tidak dapat memprediksi berapa banyak Token yang akan mereka bakar, secara umum meremehkan biaya sebenarnya.

Anda pikir dengan membayar lebih banyak, pekerjaan akan lebih baik. Kenyataannya adalah Uang dihabiskan, pekerjaan belum tentu lebih baik, anggaran bahkan tidak dapat diperkirakan dengan akurat.

Ketika Tagihan AI Mulai Menyamai Biaya Tenaga Kerja

"Ini pertama kalinya dalam ingatan saya, biaya teknologi mulai menyamai biaya tenaga kerja."

Pada 29 Mei, CEO Glean Arvind Jain mengatakan hal ini dalam wawancara dengan jurnalis CNBC Deirdre Bosa.

Observasi Wakil Presiden Deep Learning Terapan Nvidia, Bryan Catanzaro, juga membuktikan hal ini.

Dia menyebutkan dalam wawancara Axios: Bagi timnya, biaya komputasi telah jauh melebihi gaji karyawan.

Fenomena serupa sedang muncul di beberapa perusahaan: Dari Glean yang membuat AI perusahaan, hingga Nvidia yang menjual daya komputasi AI, hingga Uber yang menggunakan AI, semuanya sedang meninjau ulang perhitungan ini.

Menurut Arvind, dalam sejarah, teknologi hanyalah bagian kecil dari total biaya perusahaan, tetapi sekarang biaya AI sudah bisa mengejar gaji, anggaran AI tahunan banyak perusahaan biasanya habis dalam satu hingga dua bulan.

Setahun terakhir, tingkat penggunaan AI adalah metrik yang dipuja: menggunakan lebih banyak berarti maju, membakar Token berarti merangkul masa depan. Sekarang, banyak perusahaan mulai merenungkan kalimat sederhana itu: Apa yang didapat dari Token yang terbakar ini?

Masa jendela penggunaan bulanan gratis dan tak terbatas, justru sedang tertutup saat ini.

Selanjutnya, di hadapan semua pengembang adalah pertanyaan seperti ini: Bagaimana menghitung dengan cermat, membuat setiap Token memberikan nilai maksimal.

Pemenang sejati di masa depan, tidak diragukan lagi, adalah yang pertama kali belajar menghitung tagihan Token.

Referensi:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录

Preguntas relacionadas

QApa yang menyebabkan perusahaan membakar tagihan sebesar 5 miliar dolar dalam sebulan di Claude?

AManajemen perusahaan lupa menetapkan batas penggunaan saat memberikan akses akun Claude kepada karyawan, sehingga terjadi pembakaran token tanpa kendali.

QBagaimana perubahan model penagihan OpenAI dan GitHub Copilot memengaruhi pengguna?

AOpenAI dan GitHub Copilot beralih dari model langganan bulanan ke penagihan berdasarkan penggunaan token, yang menyebabkan biaya melonjak drastis bagi pengguna berat, terutama yang menggunakan agen AI untuk tugas panjang.

QApa yang dimaksud dengan 'Token maxxing' yang disebutkan dalam artikel?

A'Token maxxing' adalah istilah untuk perilaku membakar token secara berlebihan hanya untuk meningkatkan peringkat dalam sistem atau sekadar terlihat produktif, tanpa menghasilkan nilai yang sebenarnya.

QMenurut penelitian akademis, apa hubungan antara konsumsi token dan akurasi dalam tugas pengkodean agen AI?

APenelitian menunjukkan bahwa konsumsi token yang lebih tinggi tidak selalu menghasilkan akurasi yang lebih baik. Akurasi sering mencapai puncaknya pada biaya menengah, dan membakar token lebih banyak setelahnya tidak meningkatkan hasil secara signifikan.

QMengapa biaya AI mulai dibandingkan dengan biaya tenaga kerja di beberapa perusahaan?

ABiaya penggunaan AI (terutama untuk token dan komputasi) dalam beberapa kasus telah menyamai atau bahkan melampaui biaya gaji karyawan, mendorong perusahaan untuk mempertanyakan nilai dan efisiensi dari setiap token yang dibakar.

Lecturas Relacionadas

Los 43 minutos de Trump: la narrativa del hombre fuerte se descontrola y la guerra mediática se intensifica

**Resumen del artículo en español:** Tras más de una semana sin aparecer en público, el presidente Donald Trump celebró una conferencia de prensa de 43 minutos que se alejó de los temas centrales (su salud, la acción militar en Irán, las fracturas en su partido) y derivó en un espectáculo político errático y lleno de quejas. La intervención comenzó hablando extensamente sobre la renovación de un estanque reflejante, comparó el tamaño de sus mítines con los de Martin Luther King, atacó a ciudades estadounidenses y a sus adversarios políticos, y culminó con un ataque personal a una periodista de CNN, a quien criticó por "nunca sonreír" y tener "odio en los ojos". El artículo subraya dos dimensiones clave. Primero, revela un estado presidencial que parece fuera de control, defensivo y volátil, evidenciado por el abrupto final del acto y el rápido desalojo del lugar por su equipo. Segundo, analiza cambios institucionales: Trump firmó una orden ejecutiva que elimina protecciones laborales para miles de altos funcionarios federales, priorizando la lealtad política sobre la experiencia y la independencia. El texto amplía el análisis al panorama mediático, señalando cómo la presión política y los intereses comerciales están erosionando la independencia periodística, citando el caso de la destitución de un veterano periodista en la CBS. Argumenta que, ante la captura de los grandes medios, el periodismo independiente se vuelve crucial para mantener los hechos. El autor hace un llamado a apoyar económicamente a las voces independientes como forma de resistencia, enfatizando que el ataque de Trump a la prensa es un ataque al derecho del público a estar informado. El artículo concluye notando que, el mismo día de este episodio, la Cámara de Representantes (con el voto a favor de cuatro republicanos) aprobó una resolución para poner fin a la guerra en Irán, mostrando grietas en su partido y sugiriendo que su comportamiento extremo está empezando a alienar a sus propios aliados.

marsbitHace 1 hora(s)

Los 43 minutos de Trump: la narrativa del hombre fuerte se descontrola y la guerra mediática se intensifica

marsbitHace 1 hora(s)

El giro global de a16z: El capital riesgo se está convirtiendo en el "impulsor" de la alianza tecnológica estadounidense

En a16z, creemos que la mejor oportunidad que puede ofrecer una sociedad es dar a sus ciudadanos una posibilidad. Creemos firmemente que Estados Unidos y sus aliados lo hacen de manera más constante y exitosa que cualquier otro lugar del mundo. Hoy, con las naciones reconstruyendo, rearmándose y replanteando su participación en la competencia global, tenemos la oportunidad de transmitir ese regalo. Nuestra estrategia global evoluciona más allá de simplemente buscar proyectos en el extranjero. Nos estamos integrando en un marco más amplio de competencia tecnológica y cooperación entre aliados. La innovación ya no es solo una cuestión comercial, sino que es crucial para la seguridad nacional, la capacidad industrial y la competencia internacional. Anunciamos nuevos planes globales: establecer cooperación tecnológica con aliados en áreas clave como IA, robótica, defensa moderna, ciberseguridad y resiliencia de la cadena de suministro. Anne Neuberger, nueva socia responsable de asuntos globales, liderará esta labor, aportando su vasta experiencia gubernamental en seguridad y tecnologías emergentes. También ayudaremos a nuestras empresas en etapa de crecimiento a expandirse internacionalmente, aprovechando la poderosa red de contactos de a16z, desde líderes políticos hasta grandes compradores. Además, buscaremos nuevas asociaciones estratégicas en el extranjero, renombrando nuestro equipo de relaciones con inversores como Equipo de Socios Globales. Nuestro trabajo fundamental sigue siendo invertir en las mejores empresas tecnológicas donde sea que las encontremos, con más de 100 inversiones internacionales realizadas. Nuestra misión siempre ha sido ayudar a los fundadores a construir empresas excepcionales. Hoy, esa misión adquiere un nuevo significado: no solo ayudar a los fundadores, sino también a Estados Unidos y sus aliados. Estamos respondiendo a ese llamado.

marsbitHace 3 hora(s)

El giro global de a16z: El capital riesgo se está convirtiendo en el "impulsor" de la alianza tecnológica estadounidense

marsbitHace 3 hora(s)

Trading

Spot
Futuros

Artículos destacados

Cómo comprar BILL

¡Bienvenido a HTX.com! Hemos hecho que comprar Billions Network (BILL) sea simple y conveniente. Sigue nuestra guía paso a paso para iniciar tu viaje de criptos.Paso 1: crea tu cuenta HTXUtiliza tu correo electrónico o número de teléfono para registrarte y obtener una cuenta gratuita en HTX. Experimenta un proceso de registro sin complicaciones y desbloquea todas las funciones.Obtener mi cuentaPaso 2: ve a Comprar cripto y elige tu método de pagoTarjeta de crédito/débito: usa tu Visa o Mastercard para comprar Billions Network (BILL) al instante.Saldo: utiliza fondos del saldo de tu cuenta HTX para tradear sin problemas.Terceros: hemos agregado métodos de pago populares como Google Pay y Apple Pay para mejorar la comodidad.P2P: tradear directamente con otros usuarios en HTX.Over-the-Counter (OTC): ofrecemos servicios personalizados y tipos de cambio competitivos para los traders.Paso 3: guarda tu Billions Network (BILL)Después de comprar tu Billions Network (BILL), guárdalo en tu cuenta HTX. Alternativamente, puedes enviarlo a otro lugar mediante transferencia blockchain o utilizarlo para tradear otras criptomonedas.Paso 4: tradear Billions Network (BILL)Tradear fácilmente con Billions Network (BILL) en HTX's mercado spot. Simplemente accede a tu cuenta, selecciona tu par de trading, ejecuta tus trades y monitorea en tiempo real. Ofrecemos una experiencia fácil de usar tanto para principiantes como para traders experimentados.

226 Vistas totalesPublicado en 2026.05.07Actualizado en 2026.06.02

Cómo comprar BILL

Discusiones

Bienvenido a la comunidad de HTX. Aquí puedes mantenerte informado sobre los últimos desarrollos de la plataforma y acceder a análisis profesionales del mercado. A continuación se presentan las opiniones de los usuarios sobre el precio de BILL (BILL).

活动图片