ByteDance Volcano Engine Ark Coding Plan baru-baru ini secara resmi meluncurkan GLM-5.1, dengan pernyataan resmi "selaras dengan kemampuan penuh pabrik asli, tanpa batas pembelian". Sebelumnya, Coding Plan Volcano hanya memiliki model yang lebih lama seperti GLM-4.7. Pembaruan ini tidak hanya memperkenalkan GLM-5.1, tetapi juga mengintegrasikan berbagai model besar domestik terbaru seperti Minimax M2.7, Kimi k2.6, DeepSeek-V3.2, dan lainnya.
Ini berarti, pengembang hanya perlu satu biaya langganan untuk dapat memanggil beberapa model utama sekaligus. Dari umpan balik pasar, "mode paket" ini sangat mengurangi biaya percobaan dan kesalahan bagi pengembang. Saat ini, harga paket Lite adalah sekitar 40 yuan per bulan, dan harga paket Pro adalah 200 yuan per bulan, membuat banyak pengembang bersedia "membeli dulu untuk mengamankan tempat".
GLM-5.1 dari Zhipu AI sendiri, dalam pembaruan awal April 2026, telah menunjukkan kemampuan rekayasa yang mengesankan. Dalam dua video resmi yang dirilis oleh Zhipu, "Membangun Desktop Linux dari Nol dalam 8 Jam" dan "655 iterasi, meningkatkan throughput kueri database vektor menjadi 6,9 kali lipat dari versi resmi awal", telah memperbarui imajinasi publik tentang "eksekusi efektif 8 jam" dari model besar.
Wartawan Menyelidiki Komunitas Pengembang, Mayoritas Pengguna Menyatakan "Tidak Tahan Lama"
Wartawan memasuki grup komunikasi pengembang Ark Coding dan menemukan bahwa selain postingan yang berbagi pengalaman, banyak pengguna yang memberikan umpan balik tentang kenyataan yang tidak sesuai. Dengan melihat beberapa halaman komunitas komunikasi, sangat banyak postingan yang mengeluh dan meminta pengembalian dana, dengan banyak netizen berteriak "merasa ditipu".
Kontroversi utamanya ada dua:
Pertama adalah tentang penggunaan batas yang terlalu cepat. Seorang pengguna bernama "Hakimi" memposting bahwa "hanya beberapa putaran percakapan untuk satu tugas, batas 5 jam hampir habis". Ada juga pengguna lain yang mempublikasikan "alasan pemicu batas 5 jam" karena akunnya terus-menerus menggunakan window geser dalam 5 jam berturut-turut, dengan jumlah permintaan aktual melebihi 6004 kali, melebihi batas sistem.
Kedua adalah penurunan pengalaman karena tekanan penjadwalan daya komputasi. Banyak pengguna melaporkan mengalami error 429 (terlalu banyak permintaan), serta "penundaan karakter pertama lebih dari 1 menit adalah hal biasa" pada jam sibuk. Seorang pengguna直言: "Pemicu batas 5 jam terlalu sering, tidak bisa digunakan untuk pengembangan yang serius."
Pada saat yang sama, di balik harga rendah Coding Plan 40 yuan per bulan, juga tersembunyi "arus bawah" tentang "satu permintaan panggilan" yang mengarah ke koefisien pengurangan yang berbeda dalam paket. Misalnya, seorang pengguna memposting gambar "perbedaan koefisien pengurangan panggilan model yang berbeda" di grup komunikasi pengembang. Misalnya, koefisien pengurangan untuk seri Doubao dan seri Qwen adalah 1 kali, seri DeepSeek adalah 2 kali, sedangkan seri MiniMax-M2.7, Kimi-K2.6, dan GLM-5.1 adalah 5 kali.
Ini juga mencerminkan bahwa membangun "supermarket model" tidak semudah yang dibayangkan. Pengembang tertarik oleh "nilai untuk uang", tetapi kekurangan yang terlihat di awal dalam hal penjadwalan daya komputasi juga membuat banyak pengembang memilih untuk mundur setelah mencoba. Ini juga mengungkapkan masa-masa sulit awal dari "mode paket". Dengan membanjirnya pengguna, kapasitas dukungan platform komputasi menghadapi tantangan. Bagaimana menemukan titik keseimbangan yang berkelanjutan antara daya tarik harga rendah dan kualitas layanan akan menjadi proposisi jangka panjang yang perlu dipecahkan oleh Volcano Engine dan para pengikutnya.
Vendor Cloud Beralih Kolektif ke "Supermarket Model", Stratifikasi Mulai Terlihat
Pembaruan "integratif" dari Volcano Engine Coding Plan ini juga bukan peristiwa yang terisolasi.
Sejak awal 2026, vendor cloud utama seperti Alibaba Cloud, Baidu Intelligent Cloud, dan Tencent Cloud telah mempromosikan tata letak integrasi multi-model. Misalnya, Alibaba Cloud sebagai pelopor industri, lebih awal meluncurkan paket langganan multi-model "Bailian Coding Plan". Saat ini mendukung seri Qwen serta model seperti kimi-k2.5, glm-5, MiniMax-M2.5. Saat ini harga Pro adalah 200 yuan per bulan, paket Lite telah berhenti dijual baru sejak 20 Maret, dan akan berhenti memperpanjang dan meningkatkan mulai 13 April.
Layanan langganan Tencent Cloud Big Model Coding Plan diperbarui secara keseluruhan pada Maret 2026, mendukung berbagai model terbaru seperti Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan secara resmi meluncurkan layanan langganan pengkodean AI Coding Plan pada Februari 2026, juga merupakan salah satu vendor cloud yang lebih awal meluncurkan layanan semacam ini di dalam negeri.
Mode "supermarket model" bukanlah pilihan satu perusahaan, tetapi sedang menjadi jalur yang diperebutkan oleh vendor cloud. Namun, menyobek kulit luar strategi agregasi vendor cloud, siapa yang dapat menyediakan layanan yang lebih stabil, aturan kuota yang lebih transparan, mekanisme toleransi kesalahan yang lebih fleksibel, siapa yang dapat memperluas lebih banyak kemampuan layanan tingkat perusahaan di luar pemrograman, dan apakah tingkat perpanjangan dapat mengikuti, semuanya menjadi inti persaingan baru.
Secara internasional, platform layanan agregasi model Amazon Bedrock dan Microsoft Azure, meskipun berbeda skenario dengan mode langganan Coding domestik, termasuk dalam tren integrasi yang sama.
Secara keseluruhan, persaingan industri juga beralih dari "perbandingan kemampuan model tunggal" ke "kemampuan integrasi platform + kemampuan layanan ekosistem", dan konsentrasi industri akan meningkat dengan cepat.
Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, mengatakan kepada reporter bahwa meskipun diferensiasi industri sedang berakselerasi, penilaian periode integrasi mungkin agak prematur. "Lebih tepatnya, ini adalah penyempurnaan dan iterasi dari divisi kerja rantai industri. Perusahaan model fokus pada algoritma, vendor cloud fokus pada pengiriman rekayasa, masing-masing memanfaatkan keunggulan utama mereka." Dia percaya, terlepas dari apakah vendor cloud lain mengikuti, pola persaingan akan berevolusi dari bertarung sendiri ke diferensiasi niche ekologis.
Tekanan "Pipelinisasi" Perusahaan Model Besar Semakin Meningkat?
Yang dimaksud dengan "pipelinisasi" bukan berarti perusahaan model menghilang, tetapi kehilangan harga premium produk, hak koneksi pengguna, dan hak suara, dengan keuntungan berpindah ke pihak platform komputasi, menjadi peran "yang didominasi".
Di bawah gelombang agregasi vendor cloud, "pipelinisasi" juga sedang menjadi pedang Damocles yang menggantung di atas kepala perusahaan model besar independen. Dalam permainan tanpa suara ini, pemain utama seperti Zhipu AI, Moonlight (Kimi), MiniMax, dll., tidak memilih untuk berkompromi secara pasif, tetapi tumbuh dari gen mereka masing-masing, memberikan jalur terobosan yang berbeda.
CEO Zhipu AI Zhang Peng dalam dialog terbuka pada 8 April, dengan jelas menyatakan bahwa tujuan akhir Zhipu bukanlah menjadi "alat panggilan yang dapat diganti sembarangan", tetapi membangun agen otonom penuh (Autonomous Agent). Posisi ini mencoba untuk meningkatkan Zhipu dari "pemasok model" menjadi "pelaksana tugas", sehingga melewati perangkap harga rendah pipa API murni.
Moonlight (Kimi) mengadopsi strategi "tata letak terdesentralisasi + mendalami teks panjang". Secara bersamaan terhubung ke beberapa platform cloud utama seperti Volcano Engine, Alibaba Cloud, dll., mencapai pasokan daya komputasi multi-sumber, tidak terikat oleh saluran tunggal, menjamin stabilitas layanan dan pengendalian biaya. Kimi K2.6 yang diluncurkan pada April 2026 mengadopsi arsitektur Mixed Expert (MoE), dengan window konteks standar mencapai 256K token.
MiniMax memusatkan sumber daya inti pada bidang vertikal seperti penciptaan konten, layanan pelanggan cerdas, pendidikan, layanan perusahaan, hiburan sosial, terutama fokus pada skenario seperti AI game, digital human, interaksi multimodal, menciptakan "kemampuan kustomisasi yang sulit digantikan oleh platform cloud".
Akankah integrasi platform oleh raksasa teknologi mempercepat "pipelinisasi" perusahaan model? Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, percaya bahwa perlu membedakan perspektif jangka panjang dan pendek.
"Dalam jangka pendek, saluran distribusi dikuasai oleh platform, hak penentuan harga sebagian diserahkan, transfer keuntungan perusahaan model ke pihak pintu masuk adalah hukum bisnis. Tetapi dalam jangka panjang, model umum mudah menjadi homogen, model pembelajaran mendalam untuk skenario vertikal seperti keuangan, perawatan kesehatan, hukum, hambatan profesional bukanlah sesuatu yang dapat dihapus hanya dengan agregasi terpusat." Katanya.
Dalam menanggapi risiko platformisasi, juga dapat merujuk pada strategi OpenAI dan Anthropic, di satu sisi memperkuat saluran yang langsung menghadapi pengguna akhir, seperti operasi independen ChatGPT dan Claude pada dasarnya adalah membangun koneksi pengguna yang melewati platform. Di sisi lain, kecepatan iterasi teknologi dan kesadaran merek pengguna adalah dua parit efektif, sehingga perusahaan model perlu mempertimbangkan investasi penelitian dan pengembangan serta tata letak produk.
Akhir dari permainan "pipelinisasi dan platformisasi" ini mungkin bukan tentang siapa yang memakan siapa, tetapi kejelasan divisi kerja lebih lanjut. Vendor cloud menjadi pipa, perusahaan model melakukan teknologi, kedua belah pihak secara bertahap menemukan batas survival mereka masing-masing dalam permainan.
Siapa yang memakan siapa, pada tahap ini, masih jauh dari akhir cerita.
Artikel ini dari akun resmi WeChat "Science and Technology Innovation Board Daily", penulis: Wang Nai














