Ketika perang harga Token benar-benar dimulai, dari apa industri AI menghasilkan uang? Seluruh logika valuasi komersialisasi AI telah tiba pada momen yang perlu ditulis ulang. Masa persaingan "harga-kinerja" dan "kelangkaan" mungkin telah tiba. Bagi OpenAI, "situasi semakin memburuk", analisis menunjukkan "begitu OpenAI menurun, kemungkinan besar akan menyeret Nvidia, Oracle, Coreweave, dan lainnya ke bawah."
Narasi komersialisasi AI generatif sedang menghadapi introspeksi diri terdalam dalam tiga tahun terakhir. Dari menukar subsidi dengan pengguna, langganan paket bulanan yang menyembunyikan biaya, hingga tagihan berdasarkan Token yang memicu krisis tagihan perusahaan, industri AI menyelesaikan lompatan tiga tahap komersialisasi dalam waktu tiga tahun — dan perang harga potensial mungkin mengembalikan seluruh logika monetisasi ke titik nol.
Menurut laporan Wall Street Journal, OpenAI sedang mempertimbangkan untuk menurunkan biaya Token yang dibebankan kepada pengguna secara signifikan, untuk merebut klien perusahaan dari pesaing Anthropic. Menurut sumber yang mengetahui, langkah ini sebagian adalah untuk "merebut inisiatif", karena OpenAI memperkirakan Anthropic juga akan mengambil tindakan penurunan harga serupa. CEO OpenAI Sam Altman baru-baru ini dalam sebuah acara mengakui bahwa biaya penggunaan AI telah menjadi "masalah besar", dan mengatakan akan "membantu orang mendapatkan nilai lebih dengan pengeluaran yang lebih sedikit".
Waktu berita ini sangat sensitif. OpenAI telah mengajukan aplikasi IPO secara diam-diam minggu ini, dan Anthropic juga berada dalam hitungan mundur menuju penawaran umum perdana. Sementara itu, Bloomberg Silicon Data LLM Token Expenditure Index telah turun selama 7 hari perdagangan berturut-turut, mencetak rekor penurunan beruntun terpanjang sejak Januari tahun ini, mencerminkan kecemasan mendalam pasar terhadap keberlanjutan tagihan AI. Laporan tersebut secara tegas menyatakan, perang harga akan langsung menggerogoti margin keuntungan kedua perusahaan — dan kedua perusahaan saat ini telah merugi miliaran dolar karena komputasi besar yang dibutuhkan sistem AI.
Inti diskusi ini tidak lagi hanya sebuah keputusan penurunan harga, tetapi pertanyaan yang lebih mendasar: Ketika narasi "semakin banyak Token dikonsumsi semakin baik" sampai pada akhirnya, siapa yang akan menceritakan kisah komersialisasi berikutnya industri AI, dan bagaimana caranya.
01
Tiga Tahap Awal: Dari Paket Bulanan & Subsidi ke Tagihan Token
Komersialisasi AI generatif telah mengalami evolusi tiga tahap yang jelas dalam waktu singkat tiga tahun.
Tahap pertama, langganan paket bulanan dan tahunan menetapkan nada dasar industri. Pada Februari 2023, OpenAI meluncurkan ChatGPT Plus dengan biaya bulanan $19.99, memelopori pembayaran B2C untuk model besar; Baidu, Alibaba, Tencent kemudian mengikuti, langganan dengan biaya tetap bulanan menjadi standar model bisnis awal.
Tahap kedua, perang subsidi meledak sepenuhnya. Untuk meningkatkan ARR (Pendapatan Berulang Tahunan) yang merupakan jangkar inti valuasi pendanaan, berbagai vendor beralih ke subsidi besar-besaran: Google memberikan Gemini Advanced gratis selama 15 bulan untuk siswa, OpenAI meluncurkan keanggotaan Team dengan biaya $1 di bulan pertama, Douyin Doubao masuk dengan harga "99.3% lebih rendah dari harga industri", Baidu mengumumkan model inti gratis. Esensi subsidi adalah menukar kerugian dengan pertumbuhan — dilaporkan, Microsoft dalam model langganan GitHub Copilot rata-rata rugi lebih dari $20 per pengguna per bulan, beberapa pengguna berat rugi hingga $80 per bulan.
Tahap ketiga, adalah peralihan paksa ke penagihan berdasarkan pemakaian. Pada 1 Juni 2026, Microsoft mengumumkan semua paket GitHub Copilot secara resmi beralih ke penagihan berdasarkan penggunaan Token, biaya bulanan $19 langsung dikonversi menjadi kuota Token dengan nilai setara. Perubahan ini membawa biaya nyata yang lama tersembunyi oleh sistem langganan ke atas meja — menurut perhitungan pengguna komunitas Reddit, satu sesi pemrograman agen cerdas dapat mengonsumsi $30 hingga $40, paket bulanan tunggal habis hanya dalam sekali penggunaan.
02
Tagihan Tak Terkendali: Ketika Token Lebih Mahal Dari Manusia
Penerapan penagihan Token berdasarkan pemakaian, memperlihatkan wajah sebenarnya dari pengeluaran AI perusahaan.
Angka tagihan di sisi perusahaan mencengangkan. Chief Operating Officer Uber Andrew Macdonald pada Mei 2026 menyatakan secara publik, antara pertumbuhan konsumsi Token dan peningkatan substansial produk, "garis itu belum ada", dan secara khusus menciptakan istilah: "tokenmaxxing" (Pemaksimalan Token), menggambarkan karyawan yang melakukan tugas tanpa nilai hanya untuk meningkatkan penggunaan.
Data yang lebih langsung adalah: Uber hanya dalam empat bulan pertama 2026 telah menghabiskan anggaran Token tahunan; Salesforce memperkirakan biaya yang dibayarkan ke Anthropic untuk setahun penuh akan mencapai sekitar $3 miliar.
Dokumentasi pengembang Anthropic sendiri menunjukkan, biaya rata-rata pengembang yang menggunakan Claude Code sekitar $13 per hari kerja, 90% pengguna memiliki biaya harian di bawah $30 — jika dihitung, sebuah tim pengembang 10 orang hanya biaya Token setahun mungkin melebihi $75.600.
Rasio input-output juga mengkhawatirkan. Platform data perusahaan Entelligence.AI setelah mengumpulkan data dari 2444 perusahaan menemukan, dari setiap $1 yang diinvestasikan untuk biaya Token AI, hanya 18 sen yang menghasilkan nilai nyata yang menjangkau pengguna; 44 sen digunakan untuk memperbaiki Bug yang diperkenalkan AI itu sendiri, 27 sen mengalir ke pekerjaan ulang, 11 sen dikonsumsi oleh friksi peninjauan.
Menghadapi tagihan yang tak terkendali, sisi perusahaan telah mulai mengontrol secara proaktif. Amazon menghentikan peringkat penggunaan AI internal, meminta karyawan "jangan menggunakan AI hanya untuk menggunakan AI"; Microsoft berencana untuk secara bertahap menghentikan langganan Claude Code untuk karyawan di beberapa departemen produk kunci. Goldman Sachs mencatat, pengeluaran sebagian perusahaan untuk Token AI telah mencapai 10% dari total biaya tenaga kerja karyawan mereka, dan proporsi ini mungkin meningkat lebih lanjut dalam beberapa kuartal mendatang. Ini bukan hilangnya permintaan, tetapi era boros pengeluaran AI menuju akhir.
03
Adegan Keempat: Perang Harga Dimulai, OpenAI Pertimbangkan Penurunan Harga Besar-besaran
Justru dalam konteks seperti inilah, sumbu perang harga dinyalakan.
Menurut laporan Wall Street Journal, pertimbangan penurunan harga Altman langsung dipicu oleh tekanan mengejar Anthropic. Pendapatan Anthropic baru-baru ini tumbuh pesat, alat pemrograman Claude Code-nya menjadi populer di kalangan insinyur perangkat lunak, perusahaan rintisan yang didirikan lima tahun ini bahkan valuasinya untuk pertama kalinya melampaui OpenAI.
Namun, harga perang harga ini akan sangat berat. Jika harga turun secara signifikan, akan semakin mempersempit ruang margin keuntungan kedua perusahaan yang sudah negatif, dan ruang yang disediakan oleh lanskap kompetisi sangat terbatas.
Dan risiko mendasar yang telah lama diidentifikasi investor adalah, produk OpenAI dan Anthropic memiliki substitusi yang tinggi, klien dapat dengan mudah beralih dari satu ke yang lain — ini berarti penurunan harga meskipun mempertahankan klien dalam jangka pendek, tidak dapat benar-benar membangun parit pertahanan, hanya menunda kehilangan pangsa pasar.
Dilema ini juga ditransmisikan ke luar melalui siklus keuangan antara raksasa komputasi awan dan lab AI.
Menurut dokumen pengungkapan perusahaan yang disusun oleh The Information, OpenAI dan Anthropic bersama-sama menyumbang lebih dari separuh dari sekitar $2 triliun komitmen layanan awan masa depan Microsoft, Oracle, Google, dan Amazon. Jika penurunan harga memicu revisi ekspektasi pendapatan ke bawah, rantai transmisi ini akan tertekan dua arah.
Ahli neurosains dan kecerdasan buatan Amerika Gary Marcus mengatakan: "Ini semakin mengekspos kerapuhan OpenAI, dan juga menunjukkan betapa serius kesulitan yang dihadapinya. Begitu OpenAI menurun, kemungkinan besar akan menyeret Nvidia, Oracle, Coreweave, dan perusahaan lain ke bawah. Situasi sedang memburuk dengan cepat."
Perbedaan pandangan bullish dan bearish berhadap-hadapan secara terbuka di Wall Street. Analis TMT JPMorgan Mark Schilsky berpikir, kecemasan tagihan saat ini hanyalah "rintangan minimal menuju pengeluaran yang lebih tinggi": jika harga rata-rata per juta Token turun, tetapi tingkat penetrasi pembayaran AI perusahaan AS terus meningkat, secara matematis total penggunaan Token pasti meningkat tajam; ditambah lagi AI agenik (agentic AI) mendorong konsumsi Token per tugas tunggal hingga beberapa kali lipat dari mode tanya jawab tradisional, total pengeluaran jangka panjang diperkirakan akan jauh lebih tinggi dari level saat ini.
Analis semikonduktor Goldman Sachs Jim Covello memegang posisi yang lebih pesimis, berpikir kemakmuran rantai industri saat ini hampir mengarahkan semua nilai ke perusahaan semikonduktor, fenomena ini "tidak pernah terjadi sebelumnya dalam sejarah dan tidak berkelanjutan", begitu perusahaan menghadapi harga nyata berdasarkan penagihan pemakaian, aliran modal yang mendukung pembelian GPU dan pelatihan model akan menghadapi pembalikan.
04
Adegan Kelima: Kisah Berikutnya dari Ekonomi Token?
Setelah perang harga, bab berikutnya komersialisasi industri AI belum tertulis, tetapi garis besarnya mulai muncul.
Laporan Citadel Securities menyediakan kerangka arah: Penagihan berlapis dan penetapan harga berdasarkan kelangkaan. Logika intinya adalah, AI terdepan yang intensif inferensi tidak akan hilang, tetapi akan semakin terkonsentrasi di tangan segelintir perusahaan besar yang mampu menanggung biaya komputasi; bagi perusahaan yang lebih luas, model yang lebih sederhana mungkin merupakan jalur yang lebih produktif sebelum kendala fisik mereda. Ini berarti penggunaan AI akan menuju stratifikasi — tugas bernilai tinggi dan kompleks terus menggunakan model terdepan, tugas sehari-hari, tugas batch beralih ke model murah atau model lokal.
JPMorgan memegang penilaian yang relatif optimis: meskipun harga per unit Token turun, adopsi AI agen (agentic AI) akan melipatgandakan konsumsi Token per tugas — data yang ada menunjukkan, setelah proses bisnis diagenkan, konsumsi Token per tugas bisa menjadi 3,5 kali lipat dari aslinya — total skala pengeluaran masih diharapkan terus berkembang, kecemasan tagihan saat ini mungkin hanya "rintangan minimal menuju pengeluaran yang lebih tinggi".
Chief Revenue Officer Nebius Marc Boroditsky mengajukan konsep "valuemaxxing", menganjurkan industri beralih dari mengejar maksimalisasi konsumsi Token, ke membuat setiap Token benar-benar menghasilkan nilai. Arah ini secara bertahap menjadi konsensus industri — tetapi implementasi bisnis nyata, masih membutuhkan lab AI menemukan satu set sistem harga yang dapat mencerminkan biaya nyata, dan juga dapat diterima oleh klien perusahaan, dan ini adalah proposisi inti yang belum terselesaikan dalam semua perdebatan saat ini.
Namun, dalam perang harga ini, variabel yang paling terabaikan mungkin adalah model China.
Menurut data Juni platform manajemen pengeluaran perusahaan Amerika Ramp, DeepSeek telah menduduki puncak pertumbuhan langganan perangkat lunak perusahaan Amerika. Chief Economist Ramp Ara Kharazian secara khusus menekankan, ini bukan penerapan lokal model sumber terbuka, "perusahaan menggunakan DeepSeek secara langsung untuk mengirim dan menerima data", adalah penggunaan koneksi langsung dengan pembayaran nyata — dia mengakui "tidak menyangka perusahaan Amerika akan menggunakan DeepSeek". Menurut perhitungan pihak ketiga, harga rata-rata API DeepSeek V4-Pro sekitar sepersepuluh dari GPT-5.5, sekitar sepersebelas dari Claude Opus 4.7.
Dua harimau OpenAI dan Anthropic saling berperang, yang pada akhirnya diuntungkan, mungkin adalah pemain yang telah lama menuliskan "harga terjangkau" dalam gennya, dan tidak perlu mempertanggungjawabkan margin keuntungan kepada investor IPO. Ini mungkin bukan akhir yang paling disukai dari perang harga ini, tetapi semakin menjadi realitas yang sulit diabaikan.
Artikel ini berasal dari akun WeChat "硬AI", penulis: Xu Chao










