"Supermarket Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Bersaing dalam Integrasi

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Ringkasan: "Toko Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Berkompetisi dalam Integrasi ByteDance's Volcano Engine baru saja meluncurkan GLM-5.1 dalam "Coding Plan", menawarkan akses ke berbagai model AI terbaru seperti Minimax M2.7, Kimi k2.6, dan DeepSeek-V3.2. Dengan biaya berlangganan mulai dari 40 yuan per bulan, skema "paket bundel" ini bertujuan mengurangi biaya eksperimen bagi pengembang. Namun, banyak pengguna melaporkan masalah seperti batas penggunaan yang terlalu cepat habis (contohnya, 5 jam untuk 6000+ permintaan) dan penurunan kinerja selama jam sibuk, termasuk error 429 dan delay respons. Selain itu, terdapat perbedaan "koefisien pemotongan" untuk setiap model, yang memengaruhi nilai paket. Peristiwa ini mencerminkan tren industri di mana penyedia cloud seperti Alibaba Cloud, Tencent Cloud, dan Baidu Intelligent Cloud juga beralih ke model "toko model" serupa. Persaingan bergeser dari kemampuan model tunggal ke kemampuan integrasi platform dan layanan ekosistem. Analis memperdebatkan apakah perusahaan model AI independen seperti Zhipu AI, Moonlight (Kimi), dan MiniMax akan menghadapi "pipa-isasi" (kehilangan kendali atas harga dan koneksi pengguna). Namun, perusahaan-perusahaan ini merespons dengan strategi seperti pengembangan agen otonom, fokus pada teks panjang, atau pendalaman di vertical tertentu. Masa depan akan ditentukan oleh keseimbangan antara platform cloud dan spesialisasi model.

ByteDance Volcano Engine Ark Coding Plan baru-baru ini secara resmi meluncurkan GLM-5.1, dengan pernyataan resmi "selaras dengan kemampuan penuh pabrik asli, tanpa batas pembelian". Sebelumnya, Coding Plan Volcano hanya memiliki model yang lebih lama seperti GLM-4.7. Pembaruan ini tidak hanya memperkenalkan GLM-5.1, tetapi juga mengintegrasikan berbagai model besar domestik terbaru seperti Minimax M2.7, Kimi k2.6, DeepSeek-V3.2, dan lainnya.

Ini berarti, pengembang hanya perlu satu biaya langganan untuk dapat memanggil beberapa model utama sekaligus. Dari umpan balik pasar, "mode paket" ini sangat mengurangi biaya percobaan dan kesalahan bagi pengembang. Saat ini, harga paket Lite adalah sekitar 40 yuan per bulan, dan harga paket Pro adalah 200 yuan per bulan, membuat banyak pengembang bersedia "membeli dulu untuk mengamankan tempat".

GLM-5.1 dari Zhipu AI sendiri, dalam pembaruan awal April 2026, telah menunjukkan kemampuan rekayasa yang mengesankan. Dalam dua video resmi yang dirilis oleh Zhipu, "Membangun Desktop Linux dari Nol dalam 8 Jam" dan "655 iterasi, meningkatkan throughput kueri database vektor menjadi 6,9 kali lipat dari versi resmi awal", telah memperbarui imajinasi publik tentang "eksekusi efektif 8 jam" dari model besar.

Wartawan Menyelidiki Komunitas Pengembang, Mayoritas Pengguna Menyatakan "Tidak Tahan Lama"

Wartawan memasuki grup komunikasi pengembang Ark Coding dan menemukan bahwa selain postingan yang berbagi pengalaman, banyak pengguna yang memberikan umpan balik tentang kenyataan yang tidak sesuai. Dengan melihat beberapa halaman komunitas komunikasi, sangat banyak postingan yang mengeluh dan meminta pengembalian dana, dengan banyak netizen berteriak "merasa ditipu".

Kontroversi utamanya ada dua:

Pertama adalah tentang penggunaan batas yang terlalu cepat. Seorang pengguna bernama "Hakimi" memposting bahwa "hanya beberapa putaran percakapan untuk satu tugas, batas 5 jam hampir habis". Ada juga pengguna lain yang mempublikasikan "alasan pemicu batas 5 jam" karena akunnya terus-menerus menggunakan window geser dalam 5 jam berturut-turut, dengan jumlah permintaan aktual melebihi 6004 kali, melebihi batas sistem.

Kedua adalah penurunan pengalaman karena tekanan penjadwalan daya komputasi. Banyak pengguna melaporkan mengalami error 429 (terlalu banyak permintaan), serta "penundaan karakter pertama lebih dari 1 menit adalah hal biasa" pada jam sibuk. Seorang pengguna直言: "Pemicu batas 5 jam terlalu sering, tidak bisa digunakan untuk pengembangan yang serius."

Pada saat yang sama, di balik harga rendah Coding Plan 40 yuan per bulan, juga tersembunyi "arus bawah" tentang "satu permintaan panggilan" yang mengarah ke koefisien pengurangan yang berbeda dalam paket. Misalnya, seorang pengguna memposting gambar "perbedaan koefisien pengurangan panggilan model yang berbeda" di grup komunikasi pengembang. Misalnya, koefisien pengurangan untuk seri Doubao dan seri Qwen adalah 1 kali, seri DeepSeek adalah 2 kali, sedangkan seri MiniMax-M2.7, Kimi-K2.6, dan GLM-5.1 adalah 5 kali.

Ini juga mencerminkan bahwa membangun "supermarket model" tidak semudah yang dibayangkan. Pengembang tertarik oleh "nilai untuk uang", tetapi kekurangan yang terlihat di awal dalam hal penjadwalan daya komputasi juga membuat banyak pengembang memilih untuk mundur setelah mencoba. Ini juga mengungkapkan masa-masa sulit awal dari "mode paket". Dengan membanjirnya pengguna, kapasitas dukungan platform komputasi menghadapi tantangan. Bagaimana menemukan titik keseimbangan yang berkelanjutan antara daya tarik harga rendah dan kualitas layanan akan menjadi proposisi jangka panjang yang perlu dipecahkan oleh Volcano Engine dan para pengikutnya.

Vendor Cloud Beralih Kolektif ke "Supermarket Model", Stratifikasi Mulai Terlihat

Pembaruan "integratif" dari Volcano Engine Coding Plan ini juga bukan peristiwa yang terisolasi.

Sejak awal 2026, vendor cloud utama seperti Alibaba Cloud, Baidu Intelligent Cloud, dan Tencent Cloud telah mempromosikan tata letak integrasi multi-model. Misalnya, Alibaba Cloud sebagai pelopor industri, lebih awal meluncurkan paket langganan multi-model "Bailian Coding Plan". Saat ini mendukung seri Qwen serta model seperti kimi-k2.5, glm-5, MiniMax-M2.5. Saat ini harga Pro adalah 200 yuan per bulan, paket Lite telah berhenti dijual baru sejak 20 Maret, dan akan berhenti memperpanjang dan meningkatkan mulai 13 April.

Layanan langganan Tencent Cloud Big Model Coding Plan diperbarui secara keseluruhan pada Maret 2026, mendukung berbagai model terbaru seperti Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan secara resmi meluncurkan layanan langganan pengkodean AI Coding Plan pada Februari 2026, juga merupakan salah satu vendor cloud yang lebih awal meluncurkan layanan semacam ini di dalam negeri.

Mode "supermarket model" bukanlah pilihan satu perusahaan, tetapi sedang menjadi jalur yang diperebutkan oleh vendor cloud. Namun, menyobek kulit luar strategi agregasi vendor cloud, siapa yang dapat menyediakan layanan yang lebih stabil, aturan kuota yang lebih transparan, mekanisme toleransi kesalahan yang lebih fleksibel, siapa yang dapat memperluas lebih banyak kemampuan layanan tingkat perusahaan di luar pemrograman, dan apakah tingkat perpanjangan dapat mengikuti, semuanya menjadi inti persaingan baru.

Secara internasional, platform layanan agregasi model Amazon Bedrock dan Microsoft Azure, meskipun berbeda skenario dengan mode langganan Coding domestik, termasuk dalam tren integrasi yang sama.

Secara keseluruhan, persaingan industri juga beralih dari "perbandingan kemampuan model tunggal" ke "kemampuan integrasi platform + kemampuan layanan ekosistem", dan konsentrasi industri akan meningkat dengan cepat.

Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, mengatakan kepada reporter bahwa meskipun diferensiasi industri sedang berakselerasi, penilaian periode integrasi mungkin agak prematur. "Lebih tepatnya, ini adalah penyempurnaan dan iterasi dari divisi kerja rantai industri. Perusahaan model fokus pada algoritma, vendor cloud fokus pada pengiriman rekayasa, masing-masing memanfaatkan keunggulan utama mereka." Dia percaya, terlepas dari apakah vendor cloud lain mengikuti, pola persaingan akan berevolusi dari bertarung sendiri ke diferensiasi niche ekologis.

Tekanan "Pipelinisasi" Perusahaan Model Besar Semakin Meningkat?

Yang dimaksud dengan "pipelinisasi" bukan berarti perusahaan model menghilang, tetapi kehilangan harga premium produk, hak koneksi pengguna, dan hak suara, dengan keuntungan berpindah ke pihak platform komputasi, menjadi peran "yang didominasi".

Di bawah gelombang agregasi vendor cloud, "pipelinisasi" juga sedang menjadi pedang Damocles yang menggantung di atas kepala perusahaan model besar independen. Dalam permainan tanpa suara ini, pemain utama seperti Zhipu AI, Moonlight (Kimi), MiniMax, dll., tidak memilih untuk berkompromi secara pasif, tetapi tumbuh dari gen mereka masing-masing, memberikan jalur terobosan yang berbeda.

CEO Zhipu AI Zhang Peng dalam dialog terbuka pada 8 April, dengan jelas menyatakan bahwa tujuan akhir Zhipu bukanlah menjadi "alat panggilan yang dapat diganti sembarangan", tetapi membangun agen otonom penuh (Autonomous Agent). Posisi ini mencoba untuk meningkatkan Zhipu dari "pemasok model" menjadi "pelaksana tugas", sehingga melewati perangkap harga rendah pipa API murni.

Moonlight (Kimi) mengadopsi strategi "tata letak terdesentralisasi + mendalami teks panjang". Secara bersamaan terhubung ke beberapa platform cloud utama seperti Volcano Engine, Alibaba Cloud, dll., mencapai pasokan daya komputasi multi-sumber, tidak terikat oleh saluran tunggal, menjamin stabilitas layanan dan pengendalian biaya. Kimi K2.6 yang diluncurkan pada April 2026 mengadopsi arsitektur Mixed Expert (MoE), dengan window konteks standar mencapai 256K token.

MiniMax memusatkan sumber daya inti pada bidang vertikal seperti penciptaan konten, layanan pelanggan cerdas, pendidikan, layanan perusahaan, hiburan sosial, terutama fokus pada skenario seperti AI game, digital human, interaksi multimodal, menciptakan "kemampuan kustomisasi yang sulit digantikan oleh platform cloud".

Akankah integrasi platform oleh raksasa teknologi mempercepat "pipelinisasi" perusahaan model? Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, percaya bahwa perlu membedakan perspektif jangka panjang dan pendek.

"Dalam jangka pendek, saluran distribusi dikuasai oleh platform, hak penentuan harga sebagian diserahkan, transfer keuntungan perusahaan model ke pihak pintu masuk adalah hukum bisnis. Tetapi dalam jangka panjang, model umum mudah menjadi homogen, model pembelajaran mendalam untuk skenario vertikal seperti keuangan, perawatan kesehatan, hukum, hambatan profesional bukanlah sesuatu yang dapat dihapus hanya dengan agregasi terpusat." Katanya.

Dalam menanggapi risiko platformisasi, juga dapat merujuk pada strategi OpenAI dan Anthropic, di satu sisi memperkuat saluran yang langsung menghadapi pengguna akhir, seperti operasi independen ChatGPT dan Claude pada dasarnya adalah membangun koneksi pengguna yang melewati platform. Di sisi lain, kecepatan iterasi teknologi dan kesadaran merek pengguna adalah dua parit efektif, sehingga perusahaan model perlu mempertimbangkan investasi penelitian dan pengembangan serta tata letak produk.

Akhir dari permainan "pipelinisasi dan platformisasi" ini mungkin bukan tentang siapa yang memakan siapa, tetapi kejelasan divisi kerja lebih lanjut. Vendor cloud menjadi pipa, perusahaan model melakukan teknologi, kedua belah pihak secara bertahap menemukan batas survival mereka masing-masing dalam permainan.

Siapa yang memakan siapa, pada tahap ini, masih jauh dari akhir cerita.

Artikel ini dari akun resmi WeChat "Science and Technology Innovation Board Daily", penulis: Wang Nai

热门币种推荐

相关问答

QApa yang ditawarkan oleh ByteDance Volcano Engine Ark Coding Plan dengan peluncuran GLM-5.1?

AByteDance Volcano Engine Ark Coding Plan menawarkan akses ke model GLM-5.1 dengan kemampuan yang setara dengan versi asli, tanpa batasan pembelian. Layanan ini juga mengintegrasikan model AI terbaru lainnya seperti Minimax M2.7, Kimi k2.6, dan DeepSeek-V3.2, memungkinkan pengembang menggunakannya dengan satu langganan.

QApa keluhan utama pengguna terhadap layanan Coding Plan berdasarkan artikel?

APengguna melaporkan dua keluhan utama: batas penggunaan 5 jam yang terlalu cepat habis (beberapa tugas menghabiskan kuota dalam beberapa putaran percakapan) dan penurunan pengalaman akibat tekanan pada penjadwalan komputasi, seperti error 429 (terlalu banyak permintaan) dan penundaan respons hingga lebih dari 1 menit selama jam sibuk.

QBagaimana perusahaan cloud besar seperti Alibaba dan Tencent merespons tren 'model supermarket'?

APerusahaan cloud besar seperti Alibaba Cloud, Tencent Cloud, dan Baidu Intelligent Cloud juga mengadopsi model integrasi multi-model. Misalnya, Alibaba meluncurkan 'Bailian Coding Plan', Tencent menghadirkan layanan langganan model AI, dan Baidu meluncurkan 'Qianfan AI Coding Plan', semua menawarkan akses ke berbagai model AI dalam satu paket.

QApa strategi yang digunakan perusahaan model AI independen seperti Zhipu AI untuk menghindari 'pipa-isasi'?

AZhipu AI berfokus pada pengembangan agen otonom penuh (Autonomous Agent) untuk menjadi pelaksana tugas, bukan sekadar penyedia model. Moonlight (Kimi) menggunakan strategi distribusi multi-platform dan pendalaman teks panjang, sementara MiniMax mengkhususkan diri pada layanan tersier seperti konten kreatif dan interaksi multimodal.

QApa pandangan analis tentang dampak jangka panjang integrasi platform cloud pada perusahaan model AI?

AAnalis percaya bahwa dalam jangka pendek, integrasi platform dapat mengurangi margin keuntungan perusahaan model AI karena kehilangan kendali atas distribusi dan penetapan harga. Namun, dalam jangka panjang, model khusus untuk sektor vertikal (seperti keuangan atau kesehatan) akan tetap memiliki nilai karena keahlian mendalam yang tidak mudah digantikan oleh platform umum.

你可能也喜欢

从 Corning 到 Ciena,AI 光通信链条里的 10 倍股机会

该文章聚焦于AI数据中心升级带来的光通信产业链投资机会。核心观点是,随着数据传输从800G向1.6T、3.2T演进,铜缆因发热、功耗等物理极限面临瓶颈,向光通信转型成为必然。文章认为,最大的投资机会往往在于整个产业链中不可或缺的供应商,而非单一的明星芯片公司。 文章梳理了产业链关键环节及代表公司: 1. **玻璃与光纤层**:**康宁(Corning)** 是核心供应商,其最新光纤技术能成倍提升数据承载能力,已获得Meta、亚马逊等科技巨头的长期大额订单,并展现出强劲的利润增长弹性。 2. **互连层**:**安费诺(Amphenol)** 通过并购成为重要的高速连接器与线缆供应商,受益于AI数据中心建设,增长迅速且估值相对合理。**Credo Technology** 则专注于连接芯片,在铜缆与光通信之间架起桥梁,增长快但客户集中度高风险高。 3. **系统层**:**Ciena** 是相干光学系统领导者,其技术能让现有光纤承载更大数据量,无需重新铺设,已获得大量云服务商订单,积压订单创纪录。 4. **上游材料与测试层**:**AXT** 是光激光器关键材料磷化铟晶圆的稀缺供应商,但面临中国出口许可等风险。**VEO Solutions** 提供光通信设备必需的测试工具,是产业链中的“卖铲人”,业务随AI基建加速而爆发。 文章最后提到,若不想逐个选股,可关注新出现的纯光子主题ETF(代码FOTO),但其规模尚小,需谨慎研究。总结而言,光通信是AI数据洪流下的确定性方向,投资机会将沿整条产业链扩散。

marsbit51分钟前

从 Corning 到 Ciena,AI 光通信链条里的 10 倍股机会

marsbit51分钟前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.6k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片