“模型超市”越开越多:字节、阿里、腾讯竞相整合

marsbit發佈於 2026-04-24更新於 2026-04-24

文章摘要

近日,字节跳动火山引擎推出“方舟Coding Plan”,正式上线GLM-5.1,并集成Minimax、Kimi、DeepSeek等多款国产大模型,以每月40元或200元的套餐价格提供多模型调用服务,降低开发者试错成本。然而,用户反馈显示存在使用额度消耗过快、算力调度不足导致的响应延迟和错误等问题,影响实际开发体验。 阿里云、腾讯云、百度智能云等厂商也纷纷推出类似“模型超市”服务,行业竞争从单一模型能力转向平台整合与生态服务能力。这一趋势引发了对独立模型公司“管道化”风险的讨论,即模型厂商可能丧失定价权和用户连接能力。智谱、月之暗面、MiniMax等公司正通过发展自治智能体、分散布局、深耕垂直场景等方式寻求突破。 分析师认为,短期来看平台方可能占据更多话语权,但垂直领域的模型壁垒仍难以被完全替代。未来行业或走向更清晰的分工协作,而非简单吞并。

字节跳动火山引擎方舟Coding Plan近日正式上线 GLM-5.1,官方表示“对齐原厂满血能力,不限购”。在此之前,火山的Coding Plan长期仅有GLM-4.7等较老模型。此次更新不仅引入了GLM-5.1,同时集成了Minimax M2.7、Kimi k2.6、DeepSeek-V3.2等多款最新国产大模型。

这意味着,开发者只需一份订阅费,即可同时调用多家头部模型。从市场反馈来看,这种“打包模式”极大地降低了开发者的试错成本。目前Lite套餐价格在每月40元,Pro套餐价格在每月200元,让不少开发者愿意“先买个占坑”。

智谱GLM-5.1本身在2026年4月初的一次更新中,已经展现出令人印象深刻的工程能力。在智谱发布的两个官方视频中,“8小时从零构建Linux桌面”、“655轮迭代,将向量数据库的查询吞吐提升到初始正式版本的6.9倍”,重新刷新了大众对于大模型“8小时有效执行”的想象。

记者实探开发者社区 多数用户表示“不耐用”

记者进入一个方舟Coding开发者交流群中,发现用户在分享体验感受的帖子之外,大量用户反馈了实际体验的落差。刷几页交流社区就会发现,投诉、申请售后退钱的帖子非常多,有不少网友直呼“感觉被骗”。

争议主要有两点:

一个是关于限额使用过快的问题。一位名为“哈基米”的用户发帖称“一个任务几轮对话 5小时限制就快用完了”,还有另一位网友发布了自己“5小时限额触发的原因”是因为账号在连续5小时内连续滑动窗口,实际请求数已超过6004次,超过了系统限额。

二是算力调度承压导致的体验下降。大量用户反映遇到429错误(请求过多),以及高峰期“首字延迟1分钟以上是常态”。有用户直言:“5小时限额触发太频繁,没法用来做正经开发。”

与此同时,在Coding Plan每月40元的低价背后,也隐藏着套餐内关于“一次调用请求”引向不同抵扣系数的"暗流"。比如一位用户在开发者交流群发布了“调用不同模型抵扣系数差异”的图片。比如豆包全系列、Qwen系列抵扣系数是1次,DeepSeek系列是2次,MiniMax-M2.7、Kimi-K2.6、GLM-5.1系列是5次。

这也反映出,“模型超市”的搭建并没有想象中容易,开发者被“性价比”吸引而来,但初期暴露出的算力调度等方面的短板,也让很多开发者尝试之后选择却步。这也暴露了“打包模式”初期的阵痛。随着用户的涌入,算力平台的承载能力面临挑战。如何在低价吸引与服务质量之间找到可持续的平衡点,将是火山引擎及跟进者需要解决的长期命题。

云厂商集体转向“模型超市” 分层固化初现

火山引擎Coding Plan的这次“整合式”更新,也并非孤立事件。

自2026年初以来,阿里云、百度智能云、腾讯云等主流云厂商均在推进多模型整合布局。比如阿里云作为行业先行者,较早推出多模型订阅套餐“百炼Coding Plan”。目前支持千问系列和kimi-k2.5、glm-5、MiniMax-M2.5等模型。目前Pro价格为每月200元,Lite 套餐自3月20日起已停止新购,4月13日起停止续费与升级。

腾讯云大模型Coding Plan订阅服务于2026年3月全面上新,支持 Tencent HY 2.0 Instruct、GLM-5、Kimi-K2.5、MiniMax-M2.5 等多个最新模型。百度千帆于2026年2月正式推出AI编码订阅服务Coding Plan,也是国内较早推出此类服务的云厂商之一。

“模型超市”模式,并非一家之选,而正在成为云厂商竞相布局的赛道。但撕开云厂商聚合策略的外衣,谁能提供更稳定的服务、更透明的额度规则、更灵活的容灾机制,谁能在编程之外,延展出更多企业级服务能力,续费率能不能跟得上,都成为新的竞争核心。

国际上,亚马逊 Bedrock、微软 Azure的模型聚合服务平台,与国内Coding订阅模式场景不同,但同属整合趋势。

整体来看,行业竞争也从“单一模型能力比拼”转向“平台整合能力+生态服务能力”的比拼,行业集中度将快速提升。

国信证券首席资产配置分析师王开告诉记者,虽然行业分化在加速,但整合期的判断可能为时稍早。“更准确地说,这是产业链分工的细化和迭代。模型厂商聚焦算法,云厂商聚焦工程交付,各自发挥主业优势。”他认为,无论其他云厂商是否跟进,竞争格局都将从单打独斗向生态位分化演变。

大模型公司 “管道化” 压力加剧?

所谓“管道化”,并非指模型公司消失,而是指其丧失产品溢价、用户连接权与话语权,利润向算力平台方转移,成为“被支配”的角色。

云厂商的聚合浪潮之下,“管道化”也正在成为悬在独立大模型公司头顶的达摩克利斯之剑。这场无声的博弈中,智谱AI、月之暗面(Kimi)、MiniMax等头部玩家,并未选择被动妥协,而是从基因中各自生长,给出了不同的突围路径。

智谱AI CEO张鹏在4月8日的公开对话中,他明确表示,智谱的终极目标从来不是成为一款“可被随意替换的调用工具”,而是构建全自治智能体(Autonomous Agent)。这一定位试图让智谱从“模型供应商”升级为“任务执行者”,从而绕过纯API管道的低价陷阱。

月之暗面(Kimi)则采取“分散布局+深耕长文本”的策略。同步接入火山引擎、阿里云等多家主流云平台,实现算力多源供给、不被单一渠道绑定,保障服务稳定性与成本可控。2026年4月推出的Kimi K2.6 采用混合专家(MoE)架构,标准上下文窗口达256K tokens。

MiniMax则将将核心资源投入到内容创作、智能客服、教育、企业服务、娱乐社交等垂直领域,尤其在游戏AI、数字人、多模态交互等场景重点布局,打造“云平台难以替代的定制化能力”。

大厂的平台整合会加速模型公司被“管道化”吗?国信证券首席资产配置分析师王开认为,需区分长短期视角。

“短期看,分发渠道被平台掌控、定价权部分让渡,模型厂商利润向入口方转移是商业规律。但长期而言,通用模型易同质化,金融、医疗、法律等垂直场景的深度学习模型,专业壁垒不是集中聚合就能抹平的。”他认为。

在应对被平台化风险方面,还可以参考OpenAI和Anthropic的策略,一方面强化直面终端用户的渠道,比如ChatGPT与Claude的独立运营本质是在建立绕过平台的用户连接。另一方面技术迭代速度与用户品牌认知是两条有效护城河,因此模型公司需要兼顾研发投入与产品化布局。

这场“管道化与平台化”的博弈终局,可能不是谁吃掉谁,而是分工的进一步清晰。云厂商做管道,模型公司做技术,双方在博弈中逐渐找到各自的生存边界。

至于谁吃掉谁,在目前这个阶段,还远未到故事的结局。

本文来自微信公众号“科创板日报”,作者:王耐

相關問答

Q字节跳动火山引擎方舟Coding Plan最近上线了哪些新模型?

A字节跳动火山引擎方舟Coding Plan近日正式上线了GLM-5.1,并同时集成了Minimax M2.7、Kimi k2.6、DeepSeek-V3.2等多款最新国产大模型。

Q开发者对火山引擎Coding Plan的主要投诉有哪些?

A开发者主要投诉两点:一是限额使用过快,一个任务几轮对话就可能耗尽5小时限额;二是算力调度承压导致体验下降,如频繁遇到429错误(请求过多)和高峰期首字延迟1分钟以上。

Q除了字节跳动,还有哪些云厂商在推进“模型超市”模式?

A除了字节跳动,阿里云、百度智能云、腾讯云等主流云厂商也在推进多模型整合布局。例如阿里云的“百炼Coding Plan”、腾讯云的大模型Coding订阅服务以及百度千帆的AI编码订阅服务。

Q智谱AI、月之暗面(Kimi)和MiniMax如何应对“管道化”风险?

A智谱AI通过构建全自治智能体(Autonomous Agent)升级为“任务执行者”;月之暗面(Kimi)采取分散布局和深耕长文本策略,接入多家云平台;MiniMax则聚焦垂直领域如内容创作、智能客服等,打造定制化能力。

Q国信证券首席资产配置分析师王开如何看待“模型超市”对行业的影响?

A王开认为,短期看模型厂商利润会向平台方转移,但长期而言,垂直领域的专业模型壁垒难以被平台聚合抹平。行业将从单打独斗向生态位分化演变,最终可能是分工进一步清晰,而非一方吃掉另一方。

你可能也喜歡

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

814 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.7k 人學過發佈於 2025.01.15更新於 2026.06.02

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片