Belakangan ini, sebuah istilah baru memicu diskusi luas: "Tokenpocalypse" (Kiamat Token).
Penyebabnya adalah restrukturisasi harga yang dilakukan Microsoft terhadap GitHub Copilot. Mulai 1 Juni, Copilot sepenuhnya beralih ke model penagihan berbasis token, dengan pengali perbedaan biaya token antar model yang sangat besar, harga per token beberapa model 60 kali lipat lebih mahal dari model lainnya.
Dan model-model lanjutan yang diakui pengguna sebagai "benar-benar bagus" itu, justru yang mengalami kenaikan harga paling tajam.
Seiring persiapan perusahaan-perusahaan AI terkemuka seperti Anthropic, OpenAI untuk go public, perusahaan AI akan menghadapi tekanan profitabilitas yang lebih ketat, yang mungkin memaksa lebih banyak vendor untuk ikut menaikkan harga.
Biaya penggunaan AI selamanya menjadi masalah yang tak terhindarkan dalam ekspansi produktivitas perusahaan. Tren "tokenmaxxing" yang populer beberapa waktu lalu, dengan motivasi saling mengadu volume penggunaan Token karyawan, akan mencapai ujung jalan dengan semakin dekatnya Kiamat Token.
"Seluruh tren tokenmaxxxing, dari bangkit, memuncak, hingga dijauhi, total hanya enam bulan."
Dilema Perusahaan
Seorang pengembang dari perusahaan besar ini menggambarkan dilema yang absurd: perusahaan sejak lama mewajibkan karyawan menggunakan alat AI, jika penggunaan token sedikit akan dipanggil untuk berbicara. Namun dengan penetapan harga baru, penggunaan token yang berlebihan juga akan dipanggil untuk berbicara.
Yang lebih parah, tim Copilot sejauh ini belum dapat meluncurkan fitur "batas token tingkat karyawan". Ini berarti dalam model penagihan baru, satu karyawan saja berpotensi menghabiskan seluruh anggaran token bulanan perusahaan dalam sehari.
"Pekerjaan saya bukan lagi menggunakan perangkat lunak untuk memecahkan masalah bisnis," tulis pengembang ini, "Pekerjaan saya telah berubah menjadi memecahkan masalah penggunaan token."
Keluhan di bagian komentar bahkan lebih menarik. Seorang pengguna menyimpulkan: "Kebijakan perusahaan menjadi: 'Gunakan AI untuk segala hal, tapi hati-hati jangan pakai terlalu banyak, karena jika LLM menghabiskan terlalu banyak token kamu akan dinonaktifkan, lalu kamu akan ditegur karena tidak menggunakan AI selama sisa bulan ini.'"
Perusahaan yang terlalu menekankan produktivitas AI, mungkin juga ibarat pedang bermata dua.
Seorang kepala informasi dari firma hukum besar bahkan "pamer" dalam seminar AI: setelah sistem AI mereka mati, para pengacara pada dasarnya berhenti bekerja, karena sudah tidak bisa lepas dari AI.
"Seseorang yang dilatih bertahun-tahun, dengan bebas mengakui bahwa tanpa kotak chat AI dia tidak bisa bekerja? Saya akan merasa malu dan mulai merenungkan karier saya sendiri."
Peristiwa Anggaran Berlebih Uber: Potret Industri
Sekarang sebagian besar model AI memiliki paket pemakaian, masalah perusahaan dalam mengendalikan anggaran menjadi semakin parah dengan tren token yang secara bertahap ditagih berdasarkan pemakaian.
Uber menempuh garis lengkap dalam satu setengah bulan: pertama menemukan "Anggaran AI habis jauh lebih cepat dari perkiraan", lalu dengan tergesa-gesa menetapkan batas penggunaan dan pembatasan karyawan.
"Bayangkan, perusahaan yang menggunakan AI sebanyak Uber saja bisa mentok secepat ini," dibahas dalam podcast TechCrunch, "Masalahnya adalah: dapatkah laboratorium AI menurunkan biaya hingga sepadan dengan kesediaan membayar klien?"
Sebuah fakta menarik: Saat ChatGPT Plus pertama kali dipatok $20/bulan, tidak ada pertimbangan strategis apa pun, "hanya asal menyebut angka". Seluruh industri sampai sekarang masih menanggung konsekuensi dari titik awal ini.
"Pekerjaanmu Tidak Akan Digantikan AI, Tapi Anggaranmu Mungkin"
Di Reddit ada lebih banyak detail yang menarik. Seseorang membuat dasbor pemantauan biaya AWS Bedrock di perusahaan, menampilkan pengeluaran setiap model, setiap token (termasuk token cache) secara real-time ke CloudWatch, "agar pengembang dan keuangan sama-sama melihat uang terbakar". Reaksi di kolom komentar adalah: "Selamat, kamu baru saja memberi mereka indikator KPI baru."
Perusahaan besar lain sudah mengalami pengetatan serupa: setelah kuota AI habis, semua orang dipaksa turun ke GPT-4.2, bahkan integrasi VSCode pun hilang.
Seorang pengamat di luar industri teknologi mengungkapkan isi hati banyak orang: "Energi mental dan jam kerja aktual yang dihabiskan seluruh urusan ini sudah begitu banyak hingga memengaruhi penyelesaian pekerjaan yang benar-benar dapat menghasilkan uang bagi perusahaan."
Saat seluruh industri masih terbuai dalam narasi "AI akan menggantikan segalanya", sebuah masalah yang lebih realistis telah mengemuka: tagihan daya komputasi, pada akhirnya harus ada yang membayar. Dan "Kiamat Token" mungkin hanyalah awal dari penyelesaian akun ini.












