Claude Borong 5 Miliar, Naik 60 Kali dalam Semalam, Tagihan Token Anda Masih Bertahan?

marsbit发布于2026-06-01更新于2026-06-01

文章摘要

Sebuah perusahaan dikabarkan menghabiskan tagihan $500 juta dalam sebulan di Claude karena lupa menetapkan batas penggunaan. Kasus kebocoran biaya AI lainnya termasuk pengguna Google Cloud yang ditagih $18.000 akibat penyalahgunaan API key, serta eksperiman OpenAI internal yang menghabiskan $1,3 juta untuk 760 juta permintaan dari 100 agen Codex. Pemicu utama lonjakan tagihan adalah peralihan model pembayaran AI dari langganan bulanan ke penggunaan berbasis token, seperti yang diterapkan OpenAI pada April dan GitHub Copilot mulai 1 Juni 2026. Perubahan ini membuat tugas berat seperti pengkodean oleh agen AI menjadi jauh lebih mahal, memicu keluhan pengguna karena biaya melonjak puluhan kali lipat. Di sisi lain, budaya "token maxxing" atau membakar token demi peringkat internal (seperti di Amazon) juga menyia-nyiakan sumber daya. Namun, bisnis seperti Glean dan Factory AI muncul dengan solusi mengoptimalkan konteks dan merutekan tugas ke model yang tepat untuk menghemat token. Penelitian menunjukkan konsumsi token oleh agen AI bisa ribuan kali lebih tinggi, namun biaya lebih tinggi tidak selalu menjamin akurasi lebih baik. CEO Glean Arvind Jain mencatat bahwa biaya AI kini mulai menyamai biaya tenaga kerja di beberapa perusahaan, menandai perlunya efisiensi. Intinya: era penggunaan AI tanpa batas berakhir. Kesuksesan di masa depan akan ditentukan oleh kemampuan mengelola dan mengoptimalkan setiap token dengan bijak.

Tagihan 500 Juta Dolar Terbakar dalam 1 Bulan!

Belakangan ini, komunitas teknologi dikejutkan oleh sebuah kesalahan besar. Menurut laporan Axios, sebuah perusahaan berhasil menghabiskan 500 juta dolar di Claude hanya dalam waktu 1 bulan!

Alasannya lucu sekaligus memprihatinkan: pihak manajemen lupa menetapkan batas penggunaan saat memberikan izin akses akun Claude kepada karyawan.

Sebenarnya, kasus tagihan AI meledak bukan hanya terjadi di perusahaan ini.

Pada April tahun ini, seorang pengguna Google Cloud menerima tagihan 18 ribu dolar dalam semalam, padahal anggarannya hanya 7 dolar, karena API key yang tersisa di layanan publiknya disalahgunakan.

Pengguna malang tersebut bernama Jesse Davies, seorang konsultan AI asal Australia dan pendiri Agentic Labs. Dia memasang dua lapis pengaman untuk akun Google Cloud-nya: peringatan anggaran 10 AUD (sekitar 7 USD) dan batas pengeluaran keras 1400 USD.

Menurut laporan Tom's Hardware, penyerang menemukan layanan Cloud Run yang dia rilis beberapa bulan lalu dari AI Studio, mengirim lebih dari 60 ribu permintaan. Kedua pengaman itu gagal menahan: perhitungan tagihan tertunda, ketika sistem bereaksi, jumlahnya sudah melonjak menjadi 18 ribu USD.

Pertengahan Mei, Peter Steinberger, pendiri proyek open-source OpenClaw, memposting tangkapan layar di X: Tagihan API OpenAI 1,3 juta dolar dalam 30 hari.

Timnya hanya tiga orang, tetapi mereka mengendalikan 100 agen Codex yang berjalan paralel: menghabiskan 603 miliar Token, menghasilkan 7,6 juta permintaan dalam 30 hari. Untungnya, 1,3 juta dolar itu tidak dia bayar sendiri.

Steinberger bergabung dengan OpenAI pada Februari tahun ini, dan 1,3 juta USD tersebut dianggap sebagai eksperimen internal:

Menguji sejauh apa pemrograman AI bisa mencapai batasnya jika biaya Token tidak dipertimbangkan. Dia menambahkan, ini adalah hasil dari mode "Fast Mode" Codex (penagihan gigi tinggi), setelah dimatikan biayanya sekitar 300 ribu USD.

Lebih awal, CTO Uber, Praveen Neppalli Naga, juga mengakui kepada The Information bahwa perusahaan telah menghabiskan anggaran Claude Code tahunan pada bulan April. COO mereka juga secara terbuka menyatakan bahwa biaya AI semakin "sulit dibenarkan".

500 juta, 1,3 juta, 18 ribu, meskipun jumlahnya berbeda beberapa tingkat, semuanya mengarah pada fakta yang sama:

Di era agen, kunci yang tidak terkendali, pasukan agen yang bekerja tanpa henti siang dan malam, akun yang lupa diberi batas: salah satunya dapat membuat tagihan Token Anda meledak dalam semalam.

Mengapa Tagihan AI Bisa Meledak?

Jawabannya terutama terletak pada perubahan cara penagihan.

Mulai April tahun ini, metode penagihan bulanan OpenAI mulai beralih ke penagihan berdasarkan penggunaan Token.

Pada 2 April, penagihan Codex berubah dari estimasi berdasarkan pesan menjadi penyesuaian berdasarkan penggunaan Token: Token masukan, masukan cache, dan keluaran dihitung terpisah. Pada 23 April, aturan ini diperluas ke semua paket Enterprise, Edu, Health, Gov: diskon tak terlihat dalam biaya bulanan dihapus.

GitHub juga segera mengikuti, baru saja mengumumkan secara resmi: Semua paket Copilot mulai 1 Juni 2026 akan beralih ke penagihan berdasarkan penggunaan. Logika permintaan lanjutan lama dihapus, diganti dengan kuota AI, diselesaikan berdasarkan konsumsi aktual Token masukan, keluaran, dan cache, sesuai dengan tarif API setiap model.

GitHub menjelaskan alasan melakukan hal ini:

Saat ini, pertanyaan chat cepat, dan tugas pengkodean otonom yang berjalan beberapa jam, biayanya sama bagi pengguna. GitHub selama ini telah menanggung biaya pengguna yang menjalankan tugas berat, tetapi model ini sudah tidak berkelanjutan.

Sebelum kemunculan agen AI, biaya chat dan penyelesaian kira-kira sama, biaya bulanan masih bisa menutupi.

Setelah kemunculan agen, satu tugas dapat berjalan terus-menerus selama beberapa jam, mengubah seluruh basis kode, perbedaan biaya antara pengguna berat dan ringan dapat mencapai beberapa tingkat. Sistem biaya bulanan langsung runtuh di hadapan kesenjangan ini.

Begitu berita ini keluar, Reddit dan X ramai dengan protes.

Seorang pengembang dengan ID JBusu membagikan tangkapan layar tagihan, menyatakan langsung bahwa harga baru ini "hanya lelucon". Biaya sebelumnya 28,12 USD/bulan, menurut sistem baru harus membayar 746,01 USD. Dia telah memutuskan untuk berhenti berlangganan, "Dengan harga ini, saya sendiri menyewa server cloud masih lebih murah".

Pengguna lain menunjukkan tangkapan layar yang lebih ekstrem, biaya melonjak dari 50 USD menjadi 3000 USD. Dia berkata tidak menyangka harga bisa separah ini, "Masih ada yang terus berlangganan?"

Namun, ada juga pengguna lama Copilot yang membantah: Tagihan ekstrem ini kemungkinan besar dihasilkan oleh para vibe-coder (pengkode berdasarkan perasaan) yang tidak peduli membakar Token, belum tentu mewakili penggunaan normal.

Seorang pengguna lama berkomentar di bagian komentar: "Saya menggunakannya sepanjang hari, pada akhir bulan hampir tidak pernah melebihi batas, sulit dipercaya ini adalah perbedaan kompleksitas pekerjaan." Yang lain lebih langsung: "Ada orang yang ingin pengembangan mode YOLO sepenuhnya otomatis, membiarkan AI berjalan sembarangan. Pemborosan seperti ini dihilangkan justru baik bagi orang lain."

Satu hal yang harus jelas: GitHub tidak menghapus biaya bulanan, harga langganan dasar tidak berubah. Yang benar-benar berubah adalah penggunaan tambahan, tugas agen, pemanggilan model yang lebih mahal, mulai sekarang masuk ke penagihan berdasarkan penggunaan.

Yang paling terpukul adalah pengguna agen berat yang mengandalkan Copilot untuk menjalankan tugas berantai panjang.

Peringkat yang Dirusak oleh Rekan Sendiri

Kejatuhan sistem bulanan, di satu sisi karena platform mengubah aturan penagihan, di sisi lain, orang yang menggunakan AI sendiri juga membakar dengan keras.

Pada Mei, Business Insider melaporkan bahwa Amazon menonaktifkan peringkat penggunaan AI internal bernama KiroRank.

Laporan tersebut mengutip sumber yang mengetahui bahwa papan peringkat ini diam-diam menciptakan cara kerja yang aneh: beberapa karyawan untuk naik beberapa posisi di papan peringkat, akan membakar konsumsi Token yang sebenarnya tidak menyelesaikan masalah nyata, murni untuk peringkat.

Setelah masalah ini terungkap, Wakil Presiden Senior Amazon, Dave Treadwell, langsung berpidato kepada seluruh staf: "Jangan menggunakan AI hanya untuk menggunakan AI. Gunakan untuk menyelesaikan masalah pelanggan, menyelesaikan masalah bisnis, untuk berinovasi."

Meskipun hal ini agak konyol, tetapi sama sekali tidak mengejutkan. Ketika "membakar Token" bisa masuk peringkat, karyawan secara alami akan membakar Token.

Silicon Valley memberi nama khusus untuk fenomena ini: Token maxxing (membakar Token ekstrem), menganggap volume konsumsi sebagai produktivitas.

Laporan Axios juga menyebutkan, ada CTO yang menemukan karyawan menggunakan model AI untuk memeriksa cuaca, menulis email sehari-hari, hal-hal yang sangat sederhana, dipasangkan dengan model terkini termahal, tagihan dapat melonjak diam-diam.

KiroRank bukan bagian dari sistem penilaian resmi Amazon, melainkan alat informal yang dibuat secara spontan oleh karyawan. Tetapi ini dengan jelas mengekspos sebuah hukum manajemen klasik: Ketika KPI salah ditetapkan, orang akan menggunakan cara paling cerdas untuk mencari celah.

Menyamakan "berapa banyak digunakan" dengan "seberapa baik kinerjanya"—inilah akar kelembagaan pemborosan AI gelombang ini.

Orang yang Menghitung Token, Sudah Mulai Menghasilkan Uang

Sisi lain dari kecemasan tagihan Token, ada orang yang diam-diam menjadikannya bisnis.

Jalur pertama: Memberi makan AI dengan konteks.

Glean adalah perusahaan milik Arvind sendiri. Yang dilakukannya adalah asisten kerja AI perusahaan: Menyatukan pengetahuan yang tersebar di seluruh perusahaan, memungkinkan AI karyawan langsung mendapatkan konteks, tidak perlu lagi mencari-cari. AI mengurangi jalan memutar, Token yang dibakar secara alami berkurang.

Mekanisme ini membuat pendapatan tahunan Glean naik tiga kali lipat dalam 15 bulan, melewati 300 juta dolar, klien termasuk Databricks, Reddit, Samsung.

Jalur kedua: Membagi pekerjaan ke model yang tepat.

Perusahaan rintisan perutean model Factory AI melakukan hal ini: secara otomatis mengirimkan setiap tugas ke model yang paling sesuai, tugas sederhana menggunakan tingkat murah, tugas kompleks menggunakan tingkat teratas. Arvind juga pernah mengatakan: Jika perutean dilakukan dengan benar, dapat menghemat 10 kali lipat.

Kedua jalur ini bermuara pada tujuan yang sama: Biarkan AI bekerja, tetapi jangan biarkan membakar sembarangan.

Penelitian di lingkaran akademis juga sedang membangun fondasi untuk perubahan ini.

https://arxiv.org/pdf/2604.22750

Sebuah makalah arXiv pada April 2026, untuk pertama kalinya secara sistematis membongkar bagaimana tugas pengkodean agen benar-benar menghabiskan uang.

Kesimpulan satu: Konsumsi Token tugas agen dapat mencapai ribuan kali lipat dari penalaran kode biasa dan percakapan kode, penyebab utama tingginya biaya adalah Token masukan.

Kesimpulan dua: Tugas yang sama dijalankan beberapa kali, konsumsi Token dapat berbeda 30 kali lipat.

Kesimpulan tiga: Konsumsi Token yang lebih tinggi, tidak selalu menghasilkan akurasi yang lebih tinggi. Presisi sering kali memuncak pada biaya menengah—jika dibakar lebih lanjut, uang dihabiskan, efeknya justru jenuh.

Makalah ini juga menemukan bahwa model terkini bahkan tidak dapat memprediksi berapa banyak Token yang akan mereka bakar, secara umum meremehkan biaya sebenarnya.

Anda pikir dengan membayar lebih banyak, pekerjaan akan lebih baik. Kenyataannya adalah Uang dihabiskan, pekerjaan belum tentu lebih baik, anggaran bahkan tidak dapat diperkirakan dengan akurat.

Ketika Tagihan AI Mulai Menyamai Biaya Tenaga Kerja

"Ini pertama kalinya dalam ingatan saya, biaya teknologi mulai menyamai biaya tenaga kerja."

Pada 29 Mei, CEO Glean Arvind Jain mengatakan hal ini dalam wawancara dengan jurnalis CNBC Deirdre Bosa.

Observasi Wakil Presiden Deep Learning Terapan Nvidia, Bryan Catanzaro, juga membuktikan hal ini.

Dia menyebutkan dalam wawancara Axios: Bagi timnya, biaya komputasi telah jauh melebihi gaji karyawan.

Fenomena serupa sedang muncul di beberapa perusahaan: Dari Glean yang membuat AI perusahaan, hingga Nvidia yang menjual daya komputasi AI, hingga Uber yang menggunakan AI, semuanya sedang meninjau ulang perhitungan ini.

Menurut Arvind, dalam sejarah, teknologi hanyalah bagian kecil dari total biaya perusahaan, tetapi sekarang biaya AI sudah bisa mengejar gaji, anggaran AI tahunan banyak perusahaan biasanya habis dalam satu hingga dua bulan.

Setahun terakhir, tingkat penggunaan AI adalah metrik yang dipuja: menggunakan lebih banyak berarti maju, membakar Token berarti merangkul masa depan. Sekarang, banyak perusahaan mulai merenungkan kalimat sederhana itu: Apa yang didapat dari Token yang terbakar ini?

Masa jendela penggunaan bulanan gratis dan tak terbatas, justru sedang tertutup saat ini.

Selanjutnya, di hadapan semua pengembang adalah pertanyaan seperti ini: Bagaimana menghitung dengan cermat, membuat setiap Token memberikan nilai maksimal.

Pemenang sejati di masa depan, tidak diragukan lagi, adalah yang pertama kali belajar menghitung tagihan Token.

Referensi:

https://x.com/dee_bosa/status/2060791500049613306%20

https://www.cnbc.com/2026/05/29/-tokens-or-humans-the-new-corporate-trade-off.html%20

https://www.axios.com/2026/05/28/ai-spending-roi-enterprise-costs%20

https://www.businessinsider.com/amazon-ai-leaderboard-tokenmaxxing-2026-5

Artikel ini berasal dari akun WeChat publik "新智元", penulis: ASI启示录

你可能也喜欢

特朗普的43分钟：强人叙事失控，媒体战升级

消失一周多后，美国总统特朗普重新公开露面，举行了一场43分钟的发布会。面对对其健康状况、伊朗军事行动及党内裂痕的质疑，他并未着力展示掌控力，反而使发布会偏离核心议题。他先花时间谈论国家广场倒影池改造，后又将自己集会人数与马丁·路德·金相比，并持续攻击记者、民主党人及多个美国城市，呈现焦躁且防御性强的形象。其间，他签署行政令，取消了约8000名高级联邦雇员的岗位保护，此举被指将削弱文官体系的专业性与独立性，使政府内部更强调对个人的忠诚。他对CNN记者的个人化攻击，以及文中提及的CBS等媒体面临的编辑独立危机，反映出政治权力与商业利益正对新闻业构成双重压力。文章认为，特朗普试图抹黑媒体以削弱公众对真相的信任。当主流媒体可能妥协时，独立记者和创作者成为维护公共事实的关键力量。文章最后指出，发布会当天，众议院有共和党人倒戈，通过了一项要求结束伊朗战争的决议，这显示特朗普的偏执与对“不忠”的无法容忍，正在使其失去部分党内保护，也构成了作者对美国制度韧性仍抱希望的依据。

marsbit34分钟前

marsbit34分钟前

Kalshi、MTS 与 a16z 的野望

本文探讨了预测市场在2025年成为投资热点的现象，并着重分析了其精神内核与风险投资机构a16z的新媒体战略之间的关联。文章梳理了预测市场理念的演变：从哈耶克关于市场作为信息协调机制的理论，到Robin Hanson设计的经济激励机制，再到“Futarchy”治理乌托邦的设想。然而，作者指出，这些传统讨论在a16z关注该领域后才被赋予新的意义。 a16z于2025年投资了预测市场平台Kalshi，并将其估值推高至220亿美元。其核心理念在于，预测市场为用户提供了对抗后现代疏离感的“在场感”。通过真金白银的下注，用户从被动观察者转变为能介入和影响事件的“超级观察者”，从而获得对事件真实性与重要性的解释权。这使其成为a16z构建新媒体帝国的关键拼图。文章以媒体公司MTS为例，说明a16z所倡导的“新媒体”是一种全频段、高强度的信息发布模式，旨在“接管时间线”。而Kalshi的独特价值在于，其市场交易数据凭借真实资金流动，具备了看似客观的权威性和强大的现实扭曲力场，能够影响公众认知与判断。这种能力正是其获得高估值的深层原因。

marsbit2小时前

marsbit2小时前

突发：OpenAI芯片元老加入Anthropic

OpenAI自研芯片团队早期核心成员Clive Chan宣布离职，并已正式加入竞争对手Anthropic。Clive Chan是OpenAI硬件团队的“002号员工”，全程参与了公司自研芯片项目从组建到推进的过程。他在声明中高度评价了OpenAI芯片团队的人才实力，但表示自己渴望“重新攀登一座新山”，因此选择加入Anthropic，并对Anthropic团队的人才、价值观和野心印象深刻。关于OpenAI的自研芯片进展，Clive Chan未透露更多细节，但提及了OpenAI与博通在2025年10月公布的合作计划。根据该计划，双方将共同建设总规模达10GW的AI加速器系统，首批机架预计在2026年下半年开始交付。 Clive Chan毕业于滑铁卢大学，曾先后在谷歌、SpaceX、特斯拉等公司从事AI基础设施相关工作，于2024年1月加入OpenAI。此次跳槽后，Anthropic内部员工表示了欢迎，而网友则调侃这像“离开皇马加盟巴萨”。近期，OpenAI与Anthropic之间人才流动频繁，此前OpenAI联合创始成员Andrej Karpathy也已加盟Anthropic。随着Anthropic近期完成巨额融资，估值逼近万亿美元，其与OpenAI在人才和资源上的竞争将持续受到关注。

marsbit2小时前

marsbit2小时前

a16z 全球化转向：VC 正在成为美国科技联盟的「推手」

a16z（Andreessen Horowitz）发布公告，宣布其全球化战略发生重要转向：不再局限于海外寻找项目和投资，而是将自身定位融入更大的技术竞争与国际盟友合作框架中。面对AI、机器人、国防科技等成为国家竞争焦点的领域，创业公司面临复杂的国际监管、产业政策和地缘关系。a16z通过设立东京办公室、任命Anne Neuberger负责全球事务、将投资者关系团队升级为全球合作伙伴团队等举措，主动应对这一变化。公告明确将a16z的全球网络与“美国及其盟友”的技术领导力绑定，标志着技术创新已进入国家安全和国际竞争语境。未来，风投的角色不仅是提供资本和增长建议，更要帮助创始人对接关键市场、政府机构和战略资源，理解多国政策环境。a16z旨在成为连接创业公司、国家能力、产业资源和全球资本的组织者，支持盟友国家在关键创新领域的合作，并助力投资组合公司进行全球扩张。这一布局体现了硅谷资本对全球科技竞争新格局的主动站位。

marsbit2小时前

marsbit2小时前

解读Agent商业、支付与基础设施的真相

作者基于一年来为Agent经济构建基础设施的经验，指出当前Agent商业尚未形成真实、规模化的市场需求，初创公司面临结构性挑战。文章分析了四个关键场景： 1. **Agent对商户**：目前电商体验中，聊天界面在视觉比价购物上逊于传统界面，商户接入多出于防御性“优化”心态。对话式商业在如外卖等高頻、低决策场景有潜力，但受限于平台开放性和成本。 2. **Agent对API**：开发者现有支付方式（如预付）已能处理低频、小额的API调用成本问题。真正的机会在于服务长尾、小众的供应商市场，但规模有限。 3. **Agent对Agent**：这是长期的愿景，涉及机器间的自动交易与结算，需求真实但当前市场几乎为零，需要专用的基础设施。 4. **Agent对金融**：这是唯一存在现成需求和付费客户的领域。将AI嵌入金融工作流是自然演进，但竞争激烈，老牌机构优势明显。文章认为，行业巨头因资金充足和战略防御而持续投入，但对初创公司而言，真正的机会并非单纯构建支付层。支付只是更宏大问题——**Agent与人类的协同工作、验证与结算**——的一部分。未来，解决协同问题的公司将主导市场，而非支付服务商。作者团队已转向一个存在真实需求、快速增长且未被充分服务的领域。

marsbit2小时前

marsbit2小时前

交易

现货

合约

Claude Borong 5 Miliar, Naik 60 Kali dalam Semalam, Tagihan Token Anda Masih Bertahan?

文章摘要

Mengapa Tagihan AI Bisa Meledak?

Peringkat yang Dirusak oleh Rekan Sendiri

Orang yang Menghitung Token, Sudah Mulai Menghasilkan Uang

Ketika Tagihan AI Mulai Menyamai Biaya Tenaga Kerja

相关问答

你可能也喜欢

特朗普的43分钟：强人叙事失控，媒体战升级

Kalshi、MTS 与 a16z 的野望

突发：OpenAI芯片元老加入Anthropic

a16z 全球化转向：VC 正在成为美国科技联盟的「推手」

解读Agent商业、支付与基础设施的真相

交易

热门文章

如何购买BILL

相关讨论

热门问答

热门分类

热门标签