Pada akhir 2025, laporan penggunaan tahunan yang dirilis oleh platform agregasi model AI terbesar di dunia, OpenRouter, menunjukkan bahwa dalam komposisi penggunanya, 47% berasal dari Amerika Serikat, dan pengembang China menyumbang 6%. Selain itu, konten panggilan di platform didominasi oleh bahasa Inggris sebesar 83%, sedangkan bahasa China kurang dari 5%.
Namun, hingga minggu 3 April 2026, dari sepuluh model peringkat teratas berdasarkan volume panggilan di platform, 6 di antaranya berasal dari China. Berdasarkan volume panggilan dari tinggi ke rendah, yaitu: Xiaomi MiMo-V2-Pro, Step星辰 Step 3.5 Flash, MiniMax M2.7, DeepSeek V3.2, Zhipu GLM 5 Turbo, dan MiniMax M2.5. Di antara mereka, Xiaomi MiMo-V2-Pro menempati posisi pertama di seluruh platform dengan 4,82 triliun Token.
Faktanya, sejak minggu 9 hingga 15 Februari 2026, ketika volume panggilan model China untuk pertama kalinya melampaui Amerika Serikat, keunggulan model China telah bertahan hampir dua bulan.
Platform OpenRouter menghimpun lebih dari 400 model AI, mencakup lebih dari 60 pemasok, dan data volume panggilannya dianggap sebagai salah satu jendela untuk mengamati preferensi pilihan model pengembang global. Pengembang dapat beralih antar model kapan saja melalui API Key yang sama (kunci yang digunakan untuk verifikasi identitas dan memanggil layanan).
Pendiri bersama serta COO OpenRouter, Chris Clark, pada Februari 2026 secara terbuka menyatakan bahwa model open-source China memiliki proporsi yang "tidak proporsional tinggi" dalam alur kerja Agent (agen cerdas) yang dijalankan oleh perusahaan Amerika Serikat. Secara bersamaan, diskusi di komunitas pengembang tentang alokasi tugas antar model dan optimasi biaya juga semakin meningkat.
Ada pandangan yang menganalogikan fenomena ini dengan industri manufaktur China 30 tahun yang lalu: saat itu China masuk ke dalam rantai industri elektronik global dengan keunggulan biaya pada bagian perakitan, melahirkan perusahaan perakitan seperti Foxconn dan Luxshare Precision; kini, model besar China juga masuk ke dalam rantai industri AI global dengan keunggulan harga pada bagian eksekusi. Ada juga pandangan yang menyebut model besar China sebagai "Foxconn di era AI".
Peran apa yang dimainkan oleh model besar China dalam rantai industri AI? Seberapa tinggi nilai kandungan dari peran tersebut?
Keunggulan Harga
Wartawan Economic Observer, setelah mengurutkan harga API resmi dari berbagai produsen hingga akhir Maret 2026, menemukan bahwa terdapat perbedaan harga yang sangat besar antara model besar utama China dan Amerika Serikat.
Sebagai contoh, untuk harga input, di antara model China, DeepSeek V3.2 adalah $0,28 per juta Token, MiniMax M2.5 adalah $0,3, MoonDark Kimi K2.5 adalah $0,42. Di antara model Amerika Serikat, Anthropic Claude Opus 4.6 adalah $5, OpenAI GPT-5.4 adalah $2,50. Harga input model utama Amerika Serikat sekitar 10 hingga 20 kali lipat dari model utama China.
Perbedaan harga output bahkan lebih mencolok. Untuk model China, DeepSeek V3.2 adalah $0,42 per juta Token, MiniMax M2.5 adalah $1,1, MoonDark Kimi K2.5 adalah $2,2. Untuk model Amerika Serikat, OpenAI GPT-5.4 adalah $15, Claude Opus 4.6 adalah $25. Perbedaan harga output antara model utama China dan Amerika Serikat sekitar 7 hingga 60 kali lipat.
Perbedaan harga ini telah ada sebelumnya dan tidak memicu migrasi pengguna secara besar-besaran karena alasan sederhana: kebanyakan orang menggunakan AI terutama untuk obrolan, konsumsi Token rendah, sehingga perbedaan harga dampaknya sangat kecil.
Namun, awal tahun 2026, kemunculan seekor "lobster" mengubah semua ini. Alat open-source OpenClaw (disebut komunitas pengembang sebagai "lobster") menjadi populer dengan cepat sekitar Februari 2026, tak lama setelah diluncurkan langsung menduduki peringkat pertama aplikasi OpenRouter, mengonsumsi lebih dari 600 miliar Token per minggu. "Lobster" termasuk aplikasi agen cerdas, berbeda dengan mode obrolan "tanya-jawab" sebelumnya, ia memungkinkan AI menjalankan tugas-tugas seperti pemrograman, pengujian, manajemen file, secara mandiri di komputer tanpa intervensi manual bertahap.
Dalam mode kerja ini, konsumsi Token tidak berada pada tingkat yang sama dengan skenario obrolan.
Misalnya, sebuah tugas pemrograman mungkin memerlukan puluhan putaran siklus "tulis kode—jalankan—error—modifikasi—jalankan lagi", setiap putaran adalah satu kali panggilan model lengkap. Agar agen cerdas mengingat operasi sebelumnya, setiap panggilan juga perlu memanggil riwayat percakapan.
Beberapa pengembang di platform media sosial menyatakan bahwa konteks sesi OpenClaw yang aktif mudah membengkak hingga lebih dari 230 ribu Token. Jika menggunakan API Claude sepenuhnya, biaya bulanan mungkin antara $800 hingga $1500. Beberapa pengguna juga mengatakan bahwa sebuah tugas otomatisasi yang dikonfigurasi dengan tidak tepat dapat menghabiskan $200 dalam satu hari.
Aplikasi agen cerdas yang diwakili oleh OpenClaw mendorong peningkatan konsumsi Token seluruh platform. Misalnya, pada minggu 3 hingga 9 Maret 2025, total volume panggilan mingguan sepuluh model teratas OpenRouter adalah 1,24 triliun Token. Hingga minggu 16 hingga 22 Februari 2026, hanya volume panggilan mingguan sepuluh model teratas saja yang melebihi 8,7 triliun Token, meningkat hampir 7 kali lipat. Proporsi tugas pemrograman dalam konsumsi Token platform juga naik dari 11% pada awal 2025 menjadi lebih dari 50% pada akhir 2025.
Ketika konsumsi Token per tugas meningkat dari ribuan menjadi ratusan ribu, perbedaan harga antara model China dan Amerika Serikat berubah dari biaya yang dapat diabaikan menjadi perbedaan signifikan ratusan bahkan ribuan dolar per bulan.
Sekitar 19 Februari 2026, perusahaan model besar Amerika Serikat Anthropic memperbarui syarat layanan, melarang pengguna menghubungkan kredensial akun berlangganan Claude ke alat pihak ketiga seperti OpenClaw, dan mewajibkan pembayaran berdasarkan penggunaan melalui API. Kemudian Google juga memberlakukan pembatasan serupa. Untuk aplikasi agen cerdas yang perlu memanggil API secara频繁 setiap hari, faktor harga dalam pemilihan model menjadi masalah yang tidak bisa dihindari, mendorong pengembang ke jalur pembayaran berdasarkan penggunaan.
Dalam skenario inti agen cerdas, yaitu pemrograman, kemampuan model China dan Amerika Serikat sudah cukup dekat.
SWE-Bench Verified adalah evaluasi publik kemampuan pemrograman yang dikelola oleh tim peneliti Princeton University, caranya adalah meminta model AI memperbaiki masalah kode nyata di GitHub (platform hosting kode open-source terbesar di dunia). Menurut data dari peringkat publik evaluasi ini, model China MiniMax M2.5 yang dirilis pada 13 Februari 2026 mencapai 80,2%, model Amerika Serikat Claude Opus 4.6 yang dirilis pada 5 Februari adalah 80,8%, perbedaan keduanya hanya 0,6 poin persentase.
Dalam kondisi kemampuan yang mirip tetapi harga sangat berbeda, pilihan pengembang dengan cepat tercermin dalam data.
Pada minggu 9 hingga 15 Februari 2026, volume panggilan Token model China mencapai 4,12 triliun, untuk pertama kalinya melampaui model Amerika Serikat yang 2,94 triliun. Minggu berikutnya, volume panggilan model China naik menjadi 5,16 triliun, meningkat 127% dalam tiga minggu. Volume panggilan model Amerika Serikat pada periode yang sama turun menjadi 2,7 triliun.
Mengapa model besar China bisa jauh lebih murah daripada model besar Amerika Serikat?
Pan Helin, Anggota Komite Ahli Ekonomi Komunikasi Informasi Kementerian Industri dan Teknologi Informasi, mengatakan kepada Economic Observer bahwa alasannya terutama dua: pertama, infrastruktur komputasi China skalanya besar, tingkat penggunaan ulang tinggi, dan penawaran harganya rendah; kedua, dalam kluster komputasi China terdapat banyak komputasi yang dibangun sendiri, biaya perolehannya lebih rendah daripada di luar negeri.
Selain itu, rute teknologi juga mempengaruhi biaya. Beberapa orang dalam industri mengatakan kepada reporter bahwa saat ini model besar China mainstream umumnya mengadopsi arsitektur MoE, juga dikenal sebagai "model ahli campuran". Secara sederhana, meskipun total parameter model MoE sangat besar, setiap kali dijalankan hanya mengaktifkan sebagian kecil parameter untuk menangani tugas, bukan semua parameter, ini secara signifikan mengurangi jumlah komputasi yang diperlukan untuk setiap inferensi.
Jalur yang Berbeda
Rekan dari lembaga ventura Silicon Valley a16z, Martin Casado, pada akhir 2025 menyatakan bahwa di antara perusahaan rintisan AI yang menggunakan tumpukan teknologi open-source, sekitar 80% perusahaan menggunakan model China. Dia kemudian menambahkan penjelasan di platform media sosial bahwa ini bukan berarti 80% perusahaan rintisan AI Amerika Serikat menggunakan model China, tetapi di antara perusahaan-perusahaan yang memilih rute teknologi open-source (menyumbang sekitar 20% hingga 30% dari total perusahaan rintisan AI Amerika Serikat), sekitar 80% menggunakan model China.
Wartawan memperhatikan bahwa di GitHub telah muncul beberapa alat open-source yang membantu pengembang mengoptimalkan biaya antar model yang berbeda. Pemikirannya大多是 adalah mengklasifikasikan tugas berdasarkan tingkat kesulitan, tugas sederhana ditangani oleh model China gratis atau murah, tugas kompleks baru memanggil model Amerika Serikat yang mahal.
Salah satu proyek bernama ClawRouter dalam dokumentasinya memberikan data perbandingan, menunjukkan bahwa setelah mengadopsi cara kombinasi ini, biaya rata-rata turun dari $25 per juta Token menjadi sekitar $2. Produk Anthropic, ClaudeCode, dalam dokumentasi resminya juga menggunakan desain berlapis serupa, secara default menggunakan model termurah untuk menangani tugas sehari-hari.
Prasyarat模式 ini dapat成立 adalah kemampuan model China dalam tugas eksekusi sudah cukup. Dalam hal pemrograman, data SWE-Bench yang disebutkan sebelumnya sudah menjelaskan hal ini. Di luar pemrograman, seberapa besar perbedaan kemampuan keseluruhan antara model besar China dan Amerika Serikat?
LMSYS Chatbot Arena saat ini adalah salah satu platform evaluasi model AI yang diakui secara global, caranya adalah meminta pengguna manusia mencoba dua model secara bersamaan tanpa mengetahui nama model, kemudian memilih yang lebih baik, setara dengan uji blind tasting antara AI.
Dalam peringkat komprehensifnya hingga 25 Maret 2026, lima besar semuanya adalah model perusahaan Amerika Serikat, model China peringkat tertinggi adalah DeepSeek V3.2 Speciale di posisi keenam. Dalam kategori Hard Prompts yang khusus menguji kemampuan penalaran kompleks (prompt berkesulitan tinggi, khusus digunakan untuk menguji kemampuan model menangani tugas penalaran kompleks dan logika multi-langkah), perbedaan model China dan Amerika Serikat lebih jelas,梯队 pertama masih terutama model Amerika Serikat.
Kemampuan pemrograman mendekati, penalaran kompleks masih ada perbedaan, ini adalah manifestasi dari kemampuan diferensiasi antara model besar China dan Amerika Serikat saat ini, dan juga dasar成立 untuk praktik "panggilan berlapis" ini.
Namun, berbeda dengan 30 tahun yang lalu terkunci sebagai vendor pabrik perakitan dengan margin keuntungan rendah, produsen model besar China tidak terus menerus menurunkan harga.
Faktanya, sejak 2024, industri model besar China pernah mengalami perang harga: pada Mei 2024, model besar Doubao dari ByteDung火山引擎 memicu "perang harga" dengan harga 0,0008 yuan per ribu Token, disusul oleh Alibaba Cloud dan Baidu Intelligent Cloud. Selama hampir satu tahun setelahnya, industri mengalami tahapan penurunan harga Token lebih dari 90%, margin laba komputasi inferensi beberapa produsen一度 negatif.
Strategi produsen saat itu adalah menukar kerugian dengan skala, membiasakan kebiasaan panggilan pengguna. Namun, setelah OpenClaw menjadi populer pada Februari 2026, laju pertumbuhan konsumsi Token jauh melampaui预期, pasokan komputasi semakin ketat.
Zhipu最先 bereaksi, pada 12 Februari 2026 merilis model baru GLM-5 dengan menaikkan harga API, pada 16 Maret merilis GLM-5-Turbo dan menaikkan harga lagi, total kenaikan dua putaran 83%.
CEO Zhipu, Zhang Peng, dalam konferensi kinerja tahunan 2025 menyatakan, harga panggilan API meningkat 83% pada kuartal pertama 2026, volume panggilan tumbuh 400%. Menurut laporan tahunan, pendapatan tahunan Zhipu 2025 adalah 724,3 juta yuan, meningkat 132% year-on-year, pendapatan berulang tahunan platform MaaS (Model as a Service) sekitar 1,7 miliar yuan, tumbuh 60 kali lipat dalam 12 bulan.
Bukan hanya Zhipu yang memilih menaikkan harga. Pada 13 Maret 2026, Tencent Cloud menyesuaikan harga seri model besar Hunyuan, beberapa model naik lebih dari 460%. Pada 18 Maret, Alibaba Cloud dan Baidu Intelligent Cloud pada hari yang sama mengumumkan penyesuaian harga, produk terkait komputasi AI naik antara 5% hingga 34%, harga baru berlaku pada 18 April.
Wakil Presiden Senior Sugon, Li Bin, dalam wawancara dengan Economic Observer menyatakan, indikator evaluasi sistem komputasi sedang berubah, sebelumnya mengukur sebuah sistem adalah melihat berapa banyak komputasinya, sekarang adalah melihat seberapa ekonomisnya menghasilkan Token.
Dari kolektif menurunkan harga hingga kolektif menaikkan harga, perubahan hanya membutuhkan waktu kurang dari dua tahun.
Pada Maret 2026, Kepala Badan Data Nasional China, Liu Liehong, dalam Forum Pengembangan China mengumumkan sejumlah angka: panggilan Token harian China telah突破 140 triliun, meningkat lebih dari 1000 kali lipat dibandingkan dua tahun yang lalu.
Dalam konferensi GTC bulan yang sama, pendiri Nvidia, Jensen Huang, menyatakan bahwa Token akan menjadi komoditas inti paling penting di dunia digital di masa depan.
Menurut Pan Helin, daya saing model besar China sangat kuat, bukan mengejar ketertinggalan, tetapi memimpin, terutama di ujung aplikasi AI. Namun dia juga menyatakan, China masih memiliki ruang untuk peningkatan dalam inovasi orisinalitas, arsitektur inti dalam sistem AI saat ini, dari jaringan saraf tiruan hingga mekanisme perhatian, semuanya diajukan pertama kali di luar negeri, kemudian diikuti dan diiterasi di dalam negeri. Langkah selanjutnya model besar China perlu terus memperkuat di ujung aplikasi sambil melakukan inovasi orisinal dalam algoritma dasar.
Industri perakitan elektronik konsumen 30 tahun yang lalu memiliki satu karakteristik, margin keuntungan link perakitan ditekan erat oleh pemilik merek di hulu, banyak pabrik perakitan teratas hingga saat ini margin laba kotor tidak melebihi 10%. Keunggulan biaya membawa pesanan, tetapi tidak membawa hak penentuan harga.
Saat ini, situasi model besar China terlihat agak mirip dengan industri perakitan elektronik konsumen saat itu, tetapi dalam hal hak penentuan harga似乎 agak berbeda. Misalnya, setelah Zhipu menaikkan harga 83%, volume panggilan tumbuh 400%. Alibaba Cloud, Baidu Intelligent Cloud, Tencent Cloud pada Maret 2026 kolektif menaikkan harga komputasi AI dan layanan model, permintaan tidak menyusut, volume panggilan terus tumbuh.
Dalam evaluasi pemrograman SWE-Bench, perbedaan model China teratas dan model Amerika Serikat teratas telah menyempit menjadi kurang dari 1 poin persentase. Perbedaan dalam penalaran kompleks masih ada, tetapi perbedaan ini juga menyempit dengan cepat.
Kali ini, jalur pengembangan produsen model besar China似乎 berbeda.
Artikel ini dari akun resmi WeChat "Economic Observer", penulis: Zheng Chenye







