"Supermarket Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Bersaing dalam Integrasi

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Ringkasan: "Toko Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Berkompetisi dalam Integrasi ByteDance's Volcano Engine baru saja meluncurkan GLM-5.1 dalam "Coding Plan", menawarkan akses ke berbagai model AI terbaru seperti Minimax M2.7, Kimi k2.6, dan DeepSeek-V3.2. Dengan biaya berlangganan mulai dari 40 yuan per bulan, skema "paket bundel" ini bertujuan mengurangi biaya eksperimen bagi pengembang. Namun, banyak pengguna melaporkan masalah seperti batas penggunaan yang terlalu cepat habis (contohnya, 5 jam untuk 6000+ permintaan) dan penurunan kinerja selama jam sibuk, termasuk error 429 dan delay respons. Selain itu, terdapat perbedaan "koefisien pemotongan" untuk setiap model, yang memengaruhi nilai paket. Peristiwa ini mencerminkan tren industri di mana penyedia cloud seperti Alibaba Cloud, Tencent Cloud, dan Baidu Intelligent Cloud juga beralih ke model "toko model" serupa. Persaingan bergeser dari kemampuan model tunggal ke kemampuan integrasi platform dan layanan ekosistem. Analis memperdebatkan apakah perusahaan model AI independen seperti Zhipu AI, Moonlight (Kimi), dan MiniMax akan menghadapi "pipa-isasi" (kehilangan kendali atas harga dan koneksi pengguna). Namun, perusahaan-perusahaan ini merespons dengan strategi seperti pengembangan agen otonom, fokus pada teks panjang, atau pendalaman di vertical tertentu. Masa depan akan ditentukan oleh keseimbangan antara platform cloud dan spesialisasi model.

ByteDance Volcano Engine Ark Coding Plan baru-baru ini secara resmi meluncurkan GLM-5.1, dengan pernyataan resmi "selaras dengan kemampuan penuh pabrik asli, tanpa batas pembelian". Sebelumnya, Coding Plan Volcano hanya memiliki model yang lebih lama seperti GLM-4.7. Pembaruan ini tidak hanya memperkenalkan GLM-5.1, tetapi juga mengintegrasikan berbagai model besar domestik terbaru seperti Minimax M2.7, Kimi k2.6, DeepSeek-V3.2, dan lainnya.

Ini berarti, pengembang hanya perlu satu biaya langganan untuk dapat memanggil beberapa model utama sekaligus. Dari umpan balik pasar, "mode paket" ini sangat mengurangi biaya percobaan dan kesalahan bagi pengembang. Saat ini, harga paket Lite adalah sekitar 40 yuan per bulan, dan harga paket Pro adalah 200 yuan per bulan, membuat banyak pengembang bersedia "membeli dulu untuk mengamankan tempat".

GLM-5.1 dari Zhipu AI sendiri, dalam pembaruan awal April 2026, telah menunjukkan kemampuan rekayasa yang mengesankan. Dalam dua video resmi yang dirilis oleh Zhipu, "Membangun Desktop Linux dari Nol dalam 8 Jam" dan "655 iterasi, meningkatkan throughput kueri database vektor menjadi 6,9 kali lipat dari versi resmi awal", telah memperbarui imajinasi publik tentang "eksekusi efektif 8 jam" dari model besar.

Wartawan Menyelidiki Komunitas Pengembang, Mayoritas Pengguna Menyatakan "Tidak Tahan Lama"

Wartawan memasuki grup komunikasi pengembang Ark Coding dan menemukan bahwa selain postingan yang berbagi pengalaman, banyak pengguna yang memberikan umpan balik tentang kenyataan yang tidak sesuai. Dengan melihat beberapa halaman komunitas komunikasi, sangat banyak postingan yang mengeluh dan meminta pengembalian dana, dengan banyak netizen berteriak "merasa ditipu".

Kontroversi utamanya ada dua:

Pertama adalah tentang penggunaan batas yang terlalu cepat. Seorang pengguna bernama "Hakimi" memposting bahwa "hanya beberapa putaran percakapan untuk satu tugas, batas 5 jam hampir habis". Ada juga pengguna lain yang mempublikasikan "alasan pemicu batas 5 jam" karena akunnya terus-menerus menggunakan window geser dalam 5 jam berturut-turut, dengan jumlah permintaan aktual melebihi 6004 kali, melebihi batas sistem.

Kedua adalah penurunan pengalaman karena tekanan penjadwalan daya komputasi. Banyak pengguna melaporkan mengalami error 429 (terlalu banyak permintaan), serta "penundaan karakter pertama lebih dari 1 menit adalah hal biasa" pada jam sibuk. Seorang pengguna直言: "Pemicu batas 5 jam terlalu sering, tidak bisa digunakan untuk pengembangan yang serius."

Pada saat yang sama, di balik harga rendah Coding Plan 40 yuan per bulan, juga tersembunyi "arus bawah" tentang "satu permintaan panggilan" yang mengarah ke koefisien pengurangan yang berbeda dalam paket. Misalnya, seorang pengguna memposting gambar "perbedaan koefisien pengurangan panggilan model yang berbeda" di grup komunikasi pengembang. Misalnya, koefisien pengurangan untuk seri Doubao dan seri Qwen adalah 1 kali, seri DeepSeek adalah 2 kali, sedangkan seri MiniMax-M2.7, Kimi-K2.6, dan GLM-5.1 adalah 5 kali.

Ini juga mencerminkan bahwa membangun "supermarket model" tidak semudah yang dibayangkan. Pengembang tertarik oleh "nilai untuk uang", tetapi kekurangan yang terlihat di awal dalam hal penjadwalan daya komputasi juga membuat banyak pengembang memilih untuk mundur setelah mencoba. Ini juga mengungkapkan masa-masa sulit awal dari "mode paket". Dengan membanjirnya pengguna, kapasitas dukungan platform komputasi menghadapi tantangan. Bagaimana menemukan titik keseimbangan yang berkelanjutan antara daya tarik harga rendah dan kualitas layanan akan menjadi proposisi jangka panjang yang perlu dipecahkan oleh Volcano Engine dan para pengikutnya.

Vendor Cloud Beralih Kolektif ke "Supermarket Model", Stratifikasi Mulai Terlihat

Pembaruan "integratif" dari Volcano Engine Coding Plan ini juga bukan peristiwa yang terisolasi.

Sejak awal 2026, vendor cloud utama seperti Alibaba Cloud, Baidu Intelligent Cloud, dan Tencent Cloud telah mempromosikan tata letak integrasi multi-model. Misalnya, Alibaba Cloud sebagai pelopor industri, lebih awal meluncurkan paket langganan multi-model "Bailian Coding Plan". Saat ini mendukung seri Qwen serta model seperti kimi-k2.5, glm-5, MiniMax-M2.5. Saat ini harga Pro adalah 200 yuan per bulan, paket Lite telah berhenti dijual baru sejak 20 Maret, dan akan berhenti memperpanjang dan meningkatkan mulai 13 April.

Layanan langganan Tencent Cloud Big Model Coding Plan diperbarui secara keseluruhan pada Maret 2026, mendukung berbagai model terbaru seperti Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan secara resmi meluncurkan layanan langganan pengkodean AI Coding Plan pada Februari 2026, juga merupakan salah satu vendor cloud yang lebih awal meluncurkan layanan semacam ini di dalam negeri.

Mode "supermarket model" bukanlah pilihan satu perusahaan, tetapi sedang menjadi jalur yang diperebutkan oleh vendor cloud. Namun, menyobek kulit luar strategi agregasi vendor cloud, siapa yang dapat menyediakan layanan yang lebih stabil, aturan kuota yang lebih transparan, mekanisme toleransi kesalahan yang lebih fleksibel, siapa yang dapat memperluas lebih banyak kemampuan layanan tingkat perusahaan di luar pemrograman, dan apakah tingkat perpanjangan dapat mengikuti, semuanya menjadi inti persaingan baru.

Secara internasional, platform layanan agregasi model Amazon Bedrock dan Microsoft Azure, meskipun berbeda skenario dengan mode langganan Coding domestik, termasuk dalam tren integrasi yang sama.

Secara keseluruhan, persaingan industri juga beralih dari "perbandingan kemampuan model tunggal" ke "kemampuan integrasi platform + kemampuan layanan ekosistem", dan konsentrasi industri akan meningkat dengan cepat.

Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, mengatakan kepada reporter bahwa meskipun diferensiasi industri sedang berakselerasi, penilaian periode integrasi mungkin agak prematur. "Lebih tepatnya, ini adalah penyempurnaan dan iterasi dari divisi kerja rantai industri. Perusahaan model fokus pada algoritma, vendor cloud fokus pada pengiriman rekayasa, masing-masing memanfaatkan keunggulan utama mereka." Dia percaya, terlepas dari apakah vendor cloud lain mengikuti, pola persaingan akan berevolusi dari bertarung sendiri ke diferensiasi niche ekologis.

Tekanan "Pipelinisasi" Perusahaan Model Besar Semakin Meningkat?

Yang dimaksud dengan "pipelinisasi" bukan berarti perusahaan model menghilang, tetapi kehilangan harga premium produk, hak koneksi pengguna, dan hak suara, dengan keuntungan berpindah ke pihak platform komputasi, menjadi peran "yang didominasi".

Di bawah gelombang agregasi vendor cloud, "pipelinisasi" juga sedang menjadi pedang Damocles yang menggantung di atas kepala perusahaan model besar independen. Dalam permainan tanpa suara ini, pemain utama seperti Zhipu AI, Moonlight (Kimi), MiniMax, dll., tidak memilih untuk berkompromi secara pasif, tetapi tumbuh dari gen mereka masing-masing, memberikan jalur terobosan yang berbeda.

CEO Zhipu AI Zhang Peng dalam dialog terbuka pada 8 April, dengan jelas menyatakan bahwa tujuan akhir Zhipu bukanlah menjadi "alat panggilan yang dapat diganti sembarangan", tetapi membangun agen otonom penuh (Autonomous Agent). Posisi ini mencoba untuk meningkatkan Zhipu dari "pemasok model" menjadi "pelaksana tugas", sehingga melewati perangkap harga rendah pipa API murni.

Moonlight (Kimi) mengadopsi strategi "tata letak terdesentralisasi + mendalami teks panjang". Secara bersamaan terhubung ke beberapa platform cloud utama seperti Volcano Engine, Alibaba Cloud, dll., mencapai pasokan daya komputasi multi-sumber, tidak terikat oleh saluran tunggal, menjamin stabilitas layanan dan pengendalian biaya. Kimi K2.6 yang diluncurkan pada April 2026 mengadopsi arsitektur Mixed Expert (MoE), dengan window konteks standar mencapai 256K token.

MiniMax memusatkan sumber daya inti pada bidang vertikal seperti penciptaan konten, layanan pelanggan cerdas, pendidikan, layanan perusahaan, hiburan sosial, terutama fokus pada skenario seperti AI game, digital human, interaksi multimodal, menciptakan "kemampuan kustomisasi yang sulit digantikan oleh platform cloud".

Akankah integrasi platform oleh raksasa teknologi mempercepat "pipelinisasi" perusahaan model? Kepala Analis Konfigurasi Aset Guoxin Securities, Wang Kai, percaya bahwa perlu membedakan perspektif jangka panjang dan pendek.

"Dalam jangka pendek, saluran distribusi dikuasai oleh platform, hak penentuan harga sebagian diserahkan, transfer keuntungan perusahaan model ke pihak pintu masuk adalah hukum bisnis. Tetapi dalam jangka panjang, model umum mudah menjadi homogen, model pembelajaran mendalam untuk skenario vertikal seperti keuangan, perawatan kesehatan, hukum, hambatan profesional bukanlah sesuatu yang dapat dihapus hanya dengan agregasi terpusat." Katanya.

Dalam menanggapi risiko platformisasi, juga dapat merujuk pada strategi OpenAI dan Anthropic, di satu sisi memperkuat saluran yang langsung menghadapi pengguna akhir, seperti operasi independen ChatGPT dan Claude pada dasarnya adalah membangun koneksi pengguna yang melewati platform. Di sisi lain, kecepatan iterasi teknologi dan kesadaran merek pengguna adalah dua parit efektif, sehingga perusahaan model perlu mempertimbangkan investasi penelitian dan pengembangan serta tata letak produk.

Akhir dari permainan "pipelinisasi dan platformisasi" ini mungkin bukan tentang siapa yang memakan siapa, tetapi kejelasan divisi kerja lebih lanjut. Vendor cloud menjadi pipa, perusahaan model melakukan teknologi, kedua belah pihak secara bertahap menemukan batas survival mereka masing-masing dalam permainan.

Siapa yang memakan siapa, pada tahap ini, masih jauh dari akhir cerita.

Artikel ini dari akun resmi WeChat "Science and Technology Innovation Board Daily", penulis: Wang Nai

你可能也喜欢

60天窗口压低油价，为什么市场反而跌了？

6月23日，国际油价延续跌势。此前市场因担忧霍尔木兹海峡航运中断而推高的风险溢价，正随着两艘油轮恢复通行而减弱。这被视为供应紧张最坏情形暂未发生的信号。同时，美伊临时安排为伊朗石油销售提供了约60天的窗口，进一步缓解了短期供应担忧。然而，这一安排被视为谈判缓冲期而非最终协议，其临时性限制了油价的下跌空间。市场态度谨慎，因中东地缘政治风险并未根除。美伊互信不足，任何关于航运受阻或谈判破裂的消息都可能迅速推高油价。此外，美国战略石油储备处于历史低位，削弱了其应对潜在供应冲击的缓冲能力。综上，当前油价回落主要源于短期供应恐慌降温，但由于长期风险仍在，市场并未将此次下跌视为风险彻底出清。

marsbit3分钟前

marsbit3分钟前

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

6月22日，SK海力士盘中市值达208万亿韩元，26年来首次超越三星电子，成为韩国股市市值第一。该股今年累计涨幅已超340%，其强势表现主要得益于AI浪潮下的存储芯片需求，尤其是其在HBM（高带宽存储器）市场占据主导地位。韩华投资证券将SK海力士目标价大幅上调至430万韩元，为韩国券商最高目标价。核心逻辑是，长期供货协议（LTA）和稳定的HBM需求已从根本上改变了存储芯片行业的盈利波动性，公司正转型为能够持续产生高利润的企业。多家券商近期也集体上调目标价，认为存储行业估值逻辑正在发生范式转变。业绩方面，SK海力士2026财年一季度营收首次突破50万亿韩元，营业利润率高达72%，创行业纪录。HBM是核心驱动力，目前全球供需紧张局面预计将持续。尽管6月23日股价从盘前高点回落，部分市场观点认为市值反超可能存在短期过热，但仍有高回报投资者将回调视为加仓机会。市场正在给予直接受益于AI基础设施建设的公司更高估值溢价。

marsbit22分钟前

marsbit22分钟前

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

英伟达B200芯片的云端租赁价格近期显著下跌，从5月底的6.11美元/小时降至4.22美元/小时，三周内跌幅约30%。这反映出AI算力短缺的叙事可能正在动摇，供应增加与竞争加剧是主要原因。与此同时，半导体市场出现分化：以美光、闪迪为代表的内存芯片公司股价飙升，而英伟达股价同期略有下跌。市场逻辑正在转变：GPU供应趋于宽松，但AI模型对高带宽内存（HBM）和存储的需求暴增，使内存成为新的产业瓶颈。内存合约价格上半年涨幅超过100%，连苹果公司都表示难以承受成本压力。高盛交易主管指出，若算力租赁价格持续走低，将动摇整个AI硬件链的估值基础，利润可能从卖芯片的上游（如英伟达）向掌握使用量变现的下游转移。另一方面，长期协议市场依然火热，如Google与SpaceX签订了价值300亿美元的GPU租赁大单，表明大客户仍在锁定长期算力。但这类合同也包含提前终止条款，显示了买方的谨慎。综合来看，AI产业的价值链和利润分配正在发生变化。投资者的关注点需从“算力稀缺”转向产业链中定价权的转移，内存芯片厂商目前似乎占据了更有利的位置。美光即将发布的财报将成为验证这一趋势的关键。

marsbit31分钟前

marsbit31分钟前

从 Corning 到 Ciena，AI 光通信链条里的 10 倍股机会

该文章聚焦于AI数据中心升级带来的光通信产业链投资机会。核心观点是，随着数据传输从800G向1.6T、3.2T演进，铜缆因发热、功耗等物理极限面临瓶颈，向光通信转型成为必然。文章认为，最大的投资机会往往在于整个产业链中不可或缺的供应商，而非单一的明星芯片公司。文章梳理了产业链关键环节及代表公司： 1. **玻璃与光纤层**：**康宁（Corning）** 是核心供应商，其最新光纤技术能成倍提升数据承载能力，已获得Meta、亚马逊等科技巨头的长期大额订单，并展现出强劲的利润增长弹性。 2. **互连层**：**安费诺（Amphenol）** 通过并购成为重要的高速连接器与线缆供应商，受益于AI数据中心建设，增长迅速且估值相对合理。**Credo Technology** 则专注于连接芯片，在铜缆与光通信之间架起桥梁，增长快但客户集中度高风险高。 3. **系统层**：**Ciena** 是相干光学系统领导者，其技术能让现有光纤承载更大数据量，无需重新铺设，已获得大量云服务商订单，积压订单创纪录。 4. **上游材料与测试层**：**AXT** 是光激光器关键材料磷化铟晶圆的稀缺供应商，但面临中国出口许可等风险。**VEO Solutions** 提供光通信设备必需的测试工具，是产业链中的“卖铲人”，业务随AI基建加速而爆发。文章最后提到，若不想逐个选股，可关注新出现的纯光子主题ETF（代码FOTO），但其规模尚小，需谨慎研究。总结而言，光通信是AI数据洪流下的确定性方向，投资机会将沿整条产业链扩散。

marsbit51分钟前

marsbit51分钟前

一个芯片公司发布AIDC储能认证标准，英伟达凭什么？算力重构供电逻辑，谁在抢跑谁被挡在门外？

英伟达近期发布了《储能系统自我认证指南》，为AI数据中心（AIDC）的储能系统设立了一套严格的认证标准。该标准重点关注储能变流器（PCS），提出了10项硬性技术指标和12项实测仿真要求，包括动态响应、遥测频率和控制透明度等，并将测量精度卡在电压±0.2%、电流±0.2%。这意味着储能行业以往拼产能和成本的竞争模式在此标准下失效，转而强调系统的快速控制与软硬件协同能力。随着AI算力激增，数据中心功耗呈现阶跃式暴涨，传统供电方案已无法满足需求，储能成为AIDC顶层设计的关键。英伟达此举实质是重新定义数据中心供电逻辑。标准中要求厂商提交过往PCS交付记录及24个月内实现10倍扩产的可执行计划，这直接将许多中小厂商挡在门外。AIDC储能认证涉及多维度测试，周期长、成本高，门槛显著提升。目前，西门子等巨头已联合Fluence等合作伙伴抢跑市场布局。尽管未来AIDC将催生数百GWh的储能需求，但新标准画定了新的起跑线。能否跨过这道门槛，取决于厂商的控制算法、交付能力和扩产实力，而非简单的电池容量堆砌。游戏规则已变，行业格局面临重塑。

marsbit1小时前

一个芯片公司发布AIDC储能认证标准，英伟达凭什么？算力重构供电逻辑，谁在抢跑谁被挡在门外？

marsbit1小时前

交易

现货

合约

"Supermarket Model" Semakin Banyak: ByteDance, Alibaba, dan Tencent Bersaing dalam Integrasi

文章摘要

Wartawan Menyelidiki Komunitas Pengembang, Mayoritas Pengguna Menyatakan "Tidak Tahan Lama"

Vendor Cloud Beralih Kolektif ke "Supermarket Model", Stratifikasi Mulai Terlihat

Tekanan "Pipelinisasi" Perusahaan Model Besar Semakin Meningkat?

热门币种推荐

相关问答

你可能也喜欢

60天窗口压低油价，为什么市场反而跌了？

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

从 Corning 到 Ciena，AI 光通信链条里的 10 倍股机会

一个芯片公司发布AIDC储能认证标准，英伟达凭什么？算力重构供电逻辑，谁在抢跑谁被挡在门外？

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签