Oleh | Kuadran Silikon
Ketika pengguna tidak lagi bingung apakah harus meng-upgrade paket data setiap bulan, mungkin mereka akan mulai bingung membeli berapa banyak layanan Token setiap bulan.
Token akan segera dikemas dan dijual oleh operator sebagai layanan standar, seperti kuota data, broadband, dan SMS.
Baru-baru ini, tiga operator besar di Tiongkok secara berturut-turut meluncurkan produk paket Token: menawarkan skema Token berlangganan bulanan untuk pengguna individu, serta paket daya komputasi berjenjang untuk pengembang dan klien korporat. Mereka mengumumkan telah mengintegrasikan puluhan hingga ratusan model besar ke dalam platform mereka, dengan skema "beli per bulan, panggilan multi-model, pembayaran via tagihan pulsa".
China Telecom telah meluncurkan paket Token versi individu dan korporat, dengan biaya bulanan mulai dari 9,9 yuan, untuk penggunaan 10 juta Token. Operator regional seperti Shanghai Mobile dan Shanghai Telecom meluncurkan model pembayaran berbasis poin kuota atau Token umum, di mana Shanghai Mobile menawarkan 400 ribu Token seharga 1 yuan.
Dengan operator mulai menjual layanan Token, biaya bagi pengguna untuk berpindah model besar akan turun drastis. Bagi perusahaan model besar, ini berarti "loyalitas pengguna" akan melemah, dan hanya dengan menjadi "lebih kompetitif" mereka dapat mempertahankan pasar.
Di masa depan, vendor model besar seperti Bean (Dou Bao), Qianwen, DeepSeek, tidak hanya harus bersaing dalam hal "harga" dan "kualitas Token per unit konsumsi energi", tetapi bahkan harus bersaing menuju "kemampuan solusi aplikasi AI yang bernilai lebih tinggi".
01 Apa Itu Layanan Token?
Untuk memahami layanan Token, pertama pahami apa itu Token.
Komputer tidak dapat langsung mengenali teks, hanya kode 0 dan 1. Jadi, setiap kata, karakter, suara, atau tanda baca yang kita masukkan akan dikonversi menjadi kode 0 dan 1 melalui mekanisme pengkodean tertentu.
Dalam konteks model besar, prosesnya juga dimulai dengan mengenali kode numerik, di mana jumlah bit untuk setiap karakter yang dikonversi sedikit berbeda.
Token adalah unit komputasi terkecil yang diproses oleh model besar. Input pengguna, memori konteks, dan output model, semuanya dihitung dalam Token. Semakin kompleks pemanggilan model, semakin panjang konteksnya, semakin dalam rantai eksekusi Agen, maka konsumsi Token semakin tinggi.
Biasanya: Dalam bahasa Inggris, satu Token kira-kira setara dengan 4 huruf; dalam bahasa Mandarin, karena informasi dalam karakter Han lebih padat, satu karakter Han, satu tanda baca, atau satu frasa seringkali sesuai dengan 1 sampai 2 Token.
Karena proses berpikir dan output model besar dilakukan Token per Token, industri kemudian menjual dan menyelesaikan biaya pemanggilan serta kuota penggunaan model besar dalam bentuk "per juta Token (Per Million Tokens)" atau "poin kuota".
Saat ini perusahaan model besar menerapkan tarif berjenjang untuk Token. Pengguna biasa yang menggunakan model besar seperti Bean, Qianwen dalam mode biasa, gratis; sedangkan untuk penggunaan intensif tingkat perusahaan, mereka dapat membeli paket API bulanan atau layanan pengukuran dengan jenjang yang berbeda.
Sejak tahun lalu, operator mulai membuka "supermarket daya komputasi" untuk model besar. Vendor model adalah "pedagang yang bergabung", operator menarik "biaya platform + biaya komputasi + biaya kanal". Yang dibeli pengguna bukan "model operator", melainkan: di platform telekomunikasi, menggunakan daya komputasi telekomunikasi, memanggil model besar apa pun, dibayar per Token.
Pada Juli 2025, China Mobile meluncurkan platform layanan model MoMA (Mobile Model Access); April, China Telecom meluncurkan platform operasi layanan TokenHub Xingchen; Mei, platform layanan Token "China Unicom Xingluo" diluncurkan. Platform-platform ini mengintegrasikan semua model besar utama seperti Baidu, Alibaba, ByteDance, DeepSeek, dengan API terpadu, otorisasi terpadu, dan penagihan terpadu.
Platform operator mengadaptasi berbagai model besar secara internal, pengguna hanya perlu mengganti nama model (Model ID) untuk beralih dengan mulus.
02 Mengapa Operator Menjual Token?
Ledakan layanan Token bukanlah kebetulan.
Pertama, perubahan model penagihan. Di era komputasi awan tradisional, pengguna terbiasa membayar untuk "waktu sewa server" atau "bandwidth tetap" (yaitu pembayaran daya komputasi di lapisan IaaS), membeli kecepatan bandwidth dan waktu. Namun, dengan perkembangan model besar, kemampuan yang disediakan oleh model besar yang berbeda, dan perbedaan biaya yang dikonsumsi oleh tugas yang berbeda, sangat besar. Misalnya, model yang lebih kuat, Token tunggalnya lebih mahal; konteks yang lebih panjang, konsumsi Token lebih banyak; kompleksitas inferensi yang lebih tinggi, biaya aktualnya lebih tinggi. Pembayaran per Token dapat menyelaraskan "tingkat kecerdasan yang dikonsumsi pengguna" dengan "biaya komputasi yang dikeluarkan vendor".
Kedua, menurunkan hambatan teknis dan "biaya trial and error". Pengembangan dan penyebaran model besar membutuhkan investasi puluhan juta hingga miliaran dolar AS. Bagi sebagian besar usaha kecil dan menengah serta pengembang individu, membangun model sendiri tidak realistis. Layanan Token memotong dan membungkus kemampuan "Kecerdasan Buatan Umum (AGI)", pengembang tidak perlu mempedulikan ada puluhan ribu GPU di lapisan dasar yang membakar listrik, mereka hanya perlu memanggil API sesuai kebutuhan dan membayar biaya Token.
Terakhir, kebutuhan mendesak yang dibawa oleh ledakan lapisan aplikasi. Memasuki tahun 2026, ledakan skenario lapisan aplikasi seperti AI Agent (agen cerdas), pemrograman berbantuan AI, dan pembuatan konten multimodal. Aplikasi-aplikasi ini dalam operasi sehari-hari memerlukan interaksi "input-output" yang sering dengan model besar di lapisan dasar. Sebuah alat penulisan kode AI otomatis mungkin mengkonsumsi jutaan Token dalam semalam. Interaksi frekuensi tinggi dan volume besar ini memaksa pasar untuk menyediakan layanan paket Token yang lebih standar, stabil, dan kompetitif secara harga.
Dua puluh tahun terakhir, model bisnis operator telah mengalami tiga kali perubahan unit pengukuran inti.
Fase pertama adalah era suara, operator menjual menit; fase kedua adalah era internet seluler, menjual GB data; dan memasuki era AI, operator mulai mencoba menjual Token.
Token sedang mengalami proses evolusi yang mirip dengan data. Awalnya, hanya indikator teknis; kemudian menjadi unit penagihan; akhirnya berkembang menjadi komoditas standar.
Keikutsertaan operator menandakan Token telah mulai keluar dari ranah teknis dan memasuki sistem konsumsi.
Beberapa tahun ke depan, cara pengguna membeli kemampuan AI mungkin berubah secara fundamental: pengguna individu membeli "Paket Bulanan AI", perusahaan membeli "Kolam Sumber Daya Token", broadband rumah dilengkapi dengan kuota AI, jalur khusus pemerintah dan perusahaan terintegrasi dengan layanan Agen. Token akan menjadi sumber daya dasar seperti listrik, air, dan data.
Namun, ini tidak berarti operator akan menggantikan vendor model besar.
03 Bagaimana Cara Membeli Token yang Tepat?
Apakah layanan Token lebih tepat dibeli langsung dari vendor model besar asli atau dari platform operator? Saat ini, apa kelebihan dan kekurangan dari kedua model bisnis ini?
Pertama adalah model vendor model asli, yaitu pembayaran per juta Token. OpenAI, Anthropic, DeepSeek, Qianwen, dan vendor lainnya umumnya menggunakan sistem ini. Pengguna membayar untuk Token input dan Token output secara terpisah. Vendor seperti Qianwen mungkin menggunakan bentuk pembelian di awal bulan dan penyelesaian di akhir bulan.
Kedua adalah langganan bulanan kuota Token dari operator. Misalnya, Shanghai Telecom meluncurkan paket 9,9 yuan untuk 10 juta Token, kelebihan kuota akan ditagih tambahan, dan berencana menggabungkan hak Token ke dalam ruang digital keluarga "Keluarga Indah", mendukung pembayaran satu kali melalui tagihan pulsa.
Model "harga tunggal untuk semua" atau "gabungan dengan tagihan pulsa" ini memungkinkan pengguna Tiongkok membeli daya komputasi model besar seperti membeli paket data.
Pasar luar negeri didominasi oleh penetapan harga berjenjang API dari perusahaan model besar asli, sedangkan pasar domestik mendorong layanan Token ke era "paket" yang mirip dengan paket telepon seluler.
Saat ini, kedua model penagihan memiliki keunggulannya masing-masing, karena dilihat dari segmen pengguna paket Token, terutama terbagi menjadi tiga tipe.
Pertama adalah pengembang independen dan penggemar teknologi (Geeks). Mereka menggunakan antarmuka API yang disediakan oleh berbagai vendor untuk membangun aplikasi AI yang dipersonalisasi, seperti alat produktivitas, plugin terjemahan otomatis, basis pengetahuan pribadi, dll.
Kedua adalah usaha kecil dan menengah, perusahaan rintisan, dan pengembang perangkat lunak independen (ISV) sisi B, ini adalah kelompok inti paling utama dari layanan Token. Baik membeli Token untuk pemrograman bagi karyawan perusahaan, mengembangkan AI Agent untuk industri tertentu, atau menyematkan fungsi bantuan AI dalam sistem ERP dan CRM perusahaan yang ada, usaha kecil dan menengah perlu berlangganan "Paket Token Tim" dari vendor awan atau operator.
Ketiga adalah pekerja kantoran dan keluarga biasa yang "sangat bergantung pada AI". Mereka dalam skenario rumah tangga perlu menggunakan AI dengan frekuensi tinggi untuk penulisan konten, penulisan kode, atau memerlukan AI untuk membimbing pekerjaan rumah anak.
Bagi usaha kecil dan menengah serta perusahaan rintisan, dari sudut pandang ekonomi teknologi, model pembayaran Token murni dari model besar asli lebih ilmiah.
Sedangkan model paket operator memiliki dua keunggulan. Di satu sisi, pengembang independen tidak perlu terikat pada satu model besar tertentu, mereka dapat memilih berbagai model besar secara mandiri melalui platform operator. Di sisi lain, layanan Token mungkin akan lebih cepat menuju konsumsi massal. Karena kebanyakan orang tahu apa artinya 100GB data, tetapi tidak dapat merasakan berapa banyak yang diwakili oleh 10 juta Token.
Operator menggunakan langganan bulanan, pada dasarnya adalah menurunkan hambatan kognitif. Pengguna tidak perlu memahami Token, mereka hanya perlu mulai dari paket biasa 9,9 yuan/10 juta Token untuk memahami kebutuhan mereka sendiri.
Dengan operator mulai menjual layanan Token, "Bean (Dou Bao) dan sejenisnya" akan segera mulai bersaing ketat di tiga tingkat.
Dari "bersaing parameter" ke "bersaing rasio efisiensi energi": Bagi perusahaan model besar, mereka tidak dapat terus-menerus mengejar parameter besar dan konsumsi energi besar model besar secara membabi buta, melainkan harus mengalihkan energi ke kemampuan yang dapat menggunakan energi lebih kecil dan menghasilkan Token berkualitas lebih tinggi, seperti penyulingan model (Distillation), kuantisasi (Quantization), serta percepatan inferensi (Inference Optimization).
Persaingan harga akan semakin intens. Setelah operator mengagregasi ratusan model, biaya penggantian bagi pengguna akan turun. Jika model A menaikkan harga, dapat diganti dengan model B melalui platform. Ketika perbedaan kemampuan model tidak signifikan, harga akan menjadi faktor kompetisi inti.
Pusat keuntungan perusahaan model besar akan bergeser. Hanya menjual API memberikan keuntungan terbatas, titik profit di masa depan mungkin bergeser ke Agen, aplikasi industri, dan solusi perusahaan. Model itu sendiri secara bertahap menjadi infrastruktur, sedangkan lapisan aplikasi menjadi pusat nilai.
Mungkin, "pasar dua sisi" sedang terbentuk: operator mengontrol pintu masuk, vendor model mengontrol kemampuan.






