“模型超市”越开越多:字节、阿里、腾讯竞相整合

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

近日,字节跳动火山引擎推出“方舟Coding Plan”,正式上线GLM-5.1,并集成Minimax、Kimi、DeepSeek等多款国产大模型,以每月40元或200元的套餐价格提供多模型调用服务,降低开发者试错成本。然而,用户反馈显示存在使用额度消耗过快、算力调度不足导致的响应延迟和错误等问题,影响实际开发体验。 阿里云、腾讯云、百度智能云等厂商也纷纷推出类似“模型超市”服务,行业竞争从单一模型能力转向平台整合与生态服务能力。这一趋势引发了对独立模型公司“管道化”风险的讨论,即模型厂商可能丧失定价权和用户连接能力。智谱、月之暗面、MiniMax等公司正通过发展自治智能体、分散布局、深耕垂直场景等方式寻求突破。 分析师认为,短期来看平台方可能占据更多话语权,但垂直领域的模型壁垒仍难以被完全替代。未来行业或走向更清晰的分工协作,而非简单吞并。

字节跳动火山引擎方舟Coding Plan近日正式上线 GLM-5.1,官方表示“对齐原厂满血能力,不限购”。在此之前,火山的Coding Plan长期仅有GLM-4.7等较老模型。此次更新不仅引入了GLM-5.1,同时集成了Minimax M2.7、Kimi k2.6、DeepSeek-V3.2等多款最新国产大模型。

这意味着,开发者只需一份订阅费,即可同时调用多家头部模型。从市场反馈来看,这种“打包模式”极大地降低了开发者的试错成本。目前Lite套餐价格在每月40元,Pro套餐价格在每月200元,让不少开发者愿意“先买个占坑”。

智谱GLM-5.1本身在2026年4月初的一次更新中,已经展现出令人印象深刻的工程能力。在智谱发布的两个官方视频中,“8小时从零构建Linux桌面”、“655轮迭代,将向量数据库的查询吞吐提升到初始正式版本的6.9倍”,重新刷新了大众对于大模型“8小时有效执行”的想象。

记者实探开发者社区 多数用户表示“不耐用”

记者进入一个方舟Coding开发者交流群中,发现用户在分享体验感受的帖子之外,大量用户反馈了实际体验的落差。刷几页交流社区就会发现,投诉、申请售后退钱的帖子非常多,有不少网友直呼“感觉被骗”。

争议主要有两点:

一个是关于限额使用过快的问题。一位名为“哈基米”的用户发帖称“一个任务几轮对话 5小时限制就快用完了”,还有另一位网友发布了自己“5小时限额触发的原因”是因为账号在连续5小时内连续滑动窗口,实际请求数已超过6004次,超过了系统限额。

二是算力调度承压导致的体验下降。大量用户反映遇到429错误(请求过多),以及高峰期“首字延迟1分钟以上是常态”。有用户直言:“5小时限额触发太频繁,没法用来做正经开发。”

与此同时,在Coding Plan每月40元的低价背后,也隐藏着套餐内关于“一次调用请求”引向不同抵扣系数的"暗流"。比如一位用户在开发者交流群发布了“调用不同模型抵扣系数差异”的图片。比如豆包全系列、Qwen系列抵扣系数是1次,DeepSeek系列是2次,MiniMax-M2.7、Kimi-K2.6、GLM-5.1系列是5次。

这也反映出,“模型超市”的搭建并没有想象中容易,开发者被“性价比”吸引而来,但初期暴露出的算力调度等方面的短板,也让很多开发者尝试之后选择却步。这也暴露了“打包模式”初期的阵痛。随着用户的涌入,算力平台的承载能力面临挑战。如何在低价吸引与服务质量之间找到可持续的平衡点,将是火山引擎及跟进者需要解决的长期命题。

云厂商集体转向“模型超市” 分层固化初现

火山引擎Coding Plan的这次“整合式”更新,也并非孤立事件。

自2026年初以来,阿里云、百度智能云、腾讯云等主流云厂商均在推进多模型整合布局。比如阿里云作为行业先行者,较早推出多模型订阅套餐“百炼Coding Plan”。目前支持千问系列和kimi-k2.5、glm-5、MiniMax-M2.5等模型。目前Pro价格为每月200元,Lite 套餐自3月20日起已停止新购,4月13日起停止续费与升级。

腾讯云大模型Coding Plan订阅服务于2026年3月全面上新,支持 Tencent HY 2.0 Instruct、GLM-5、Kimi-K2.5、MiniMax-M2.5 等多个最新模型。百度千帆于2026年2月正式推出AI编码订阅服务Coding Plan,也是国内较早推出此类服务的云厂商之一。

“模型超市”模式,并非一家之选,而正在成为云厂商竞相布局的赛道。但撕开云厂商聚合策略的外衣,谁能提供更稳定的服务、更透明的额度规则、更灵活的容灾机制,谁能在编程之外,延展出更多企业级服务能力,续费率能不能跟得上,都成为新的竞争核心。

国际上,亚马逊 Bedrock、微软 Azure的模型聚合服务平台,与国内Coding订阅模式场景不同,但同属整合趋势。

整体来看,行业竞争也从“单一模型能力比拼”转向“平台整合能力+生态服务能力”的比拼,行业集中度将快速提升。

国信证券首席资产配置分析师王开告诉记者,虽然行业分化在加速,但整合期的判断可能为时稍早。“更准确地说,这是产业链分工的细化和迭代。模型厂商聚焦算法,云厂商聚焦工程交付,各自发挥主业优势。”他认为,无论其他云厂商是否跟进,竞争格局都将从单打独斗向生态位分化演变。

大模型公司 “管道化” 压力加剧?

所谓“管道化”,并非指模型公司消失,而是指其丧失产品溢价、用户连接权与话语权,利润向算力平台方转移,成为“被支配”的角色。

云厂商的聚合浪潮之下,“管道化”也正在成为悬在独立大模型公司头顶的达摩克利斯之剑。这场无声的博弈中,智谱AI、月之暗面(Kimi)、MiniMax等头部玩家,并未选择被动妥协,而是从基因中各自生长,给出了不同的突围路径。

智谱AI CEO张鹏在4月8日的公开对话中,他明确表示,智谱的终极目标从来不是成为一款“可被随意替换的调用工具”,而是构建全自治智能体(Autonomous Agent)。这一定位试图让智谱从“模型供应商”升级为“任务执行者”,从而绕过纯API管道的低价陷阱。

月之暗面(Kimi)则采取“分散布局+深耕长文本”的策略。同步接入火山引擎、阿里云等多家主流云平台,实现算力多源供给、不被单一渠道绑定,保障服务稳定性与成本可控。2026年4月推出的Kimi K2.6 采用混合专家(MoE)架构,标准上下文窗口达256K tokens。

MiniMax则将将核心资源投入到内容创作、智能客服、教育、企业服务、娱乐社交等垂直领域,尤其在游戏AI、数字人、多模态交互等场景重点布局,打造“云平台难以替代的定制化能力”。

大厂的平台整合会加速模型公司被“管道化”吗?国信证券首席资产配置分析师王开认为,需区分长短期视角。

“短期看,分发渠道被平台掌控、定价权部分让渡,模型厂商利润向入口方转移是商业规律。但长期而言,通用模型易同质化,金融、医疗、法律等垂直场景的深度学习模型,专业壁垒不是集中聚合就能抹平的。”他认为。

在应对被平台化风险方面,还可以参考OpenAI和Anthropic的策略,一方面强化直面终端用户的渠道,比如ChatGPT与Claude的独立运营本质是在建立绕过平台的用户连接。另一方面技术迭代速度与用户品牌认知是两条有效护城河,因此模型公司需要兼顾研发投入与产品化布局。

这场“管道化与平台化”的博弈终局,可能不是谁吃掉谁,而是分工的进一步清晰。云厂商做管道,模型公司做技术,双方在博弈中逐渐找到各自的生存边界。

至于谁吃掉谁,在目前这个阶段,还远未到故事的结局。

本文来自微信公众号“科创板日报”,作者:王耐

相关问答

Q字节跳动火山引擎方舟Coding Plan最近上线了哪些新模型?

A字节跳动火山引擎方舟Coding Plan近日正式上线了GLM-5.1,并同时集成了Minimax M2.7、Kimi k2.6、DeepSeek-V3.2等多款最新国产大模型。

Q开发者对火山引擎Coding Plan的主要投诉有哪些?

A开发者主要投诉两点:一是限额使用过快,一个任务几轮对话就可能耗尽5小时限额;二是算力调度承压导致体验下降,如频繁遇到429错误(请求过多)和高峰期首字延迟1分钟以上。

Q除了字节跳动,还有哪些云厂商在推进“模型超市”模式?

A除了字节跳动,阿里云、百度智能云、腾讯云等主流云厂商也在推进多模型整合布局。例如阿里云的“百炼Coding Plan”、腾讯云的大模型Coding订阅服务以及百度千帆的AI编码订阅服务。

Q智谱AI、月之暗面(Kimi)和MiniMax如何应对“管道化”风险?

A智谱AI通过构建全自治智能体(Autonomous Agent)升级为“任务执行者”;月之暗面(Kimi)采取分散布局和深耕长文本策略,接入多家云平台;MiniMax则聚焦垂直领域如内容创作、智能客服等,打造定制化能力。

Q国信证券首席资产配置分析师王开如何看待“模型超市”对行业的影响?

A王开认为,短期看模型厂商利润会向平台方转移,但长期而言,垂直领域的专业模型壁垒难以被平台聚合抹平。行业将从单打独斗向生态位分化演变,最终可能是分工进一步清晰,而非一方吃掉另一方。

你可能也喜欢

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

近日,腾讯、阿里、字节三大互联网巨头几乎同时加码AI智能体(Agent)布局,争夺AI时代的入口主导权。核心在于,谁掌握了Agent,谁就掌握了未来的流量分发权。 **阿里**采取“双子星”策略:千问App正演变为超级Agent,深度接入淘宝、支付宝等生态业务,实现从搜索到交易的全流程操作,并已向外部品牌开放接入;夸克则定位为AI旗舰应用,致力于成为“AI超级框”。在B端,阿里推出企业智能体平台“悟空”,探索“一人AI公司”模式。 **字节**凭借“豆包”App已获超3亿月活,并通过“扣子”平台构建开发者生态,支持多智能体协同。其战略是软硬一体,将豆包能力延伸至AI手机、智能眼镜等硬件,旨在让AI入口无处不在。 **腾讯**的杀手锏藏于微信。正在内测的微信AI智能体可通过右滑直接调用数百万小程序完成任务,将微信生态转化为“服务操作系统”。腾讯试图将AI深度融入现有国民应用,而非另造新入口。 三家的竞争折射出商业逻辑的深刻变化:流量分配权正从“用户自主点击”转向“Agent代为决策”。商业模式从争夺用户时长的“注意力经济”,转向以结果和效率为核心的“意图经济”。未来,服务提供者不仅比拼品牌,更需比拼其接入AI生态的能力。 这标志着从PC网页、移动App到AI Agent的又一次入口更迭,新一轮行业洗牌已然开始。

marsbit49分钟前

Agent接管流量分发权,腾讯、字节、阿里在抢什么?

marsbit49分钟前

从封杀豆包到拥抱荣耀,微信为什么突然“变脸”?

从严防死守到主动合作,微信对手机AI助手的态度在近期发生了180度转变。过去一年,微信曾封杀字节跳动豆包手机、限制OPPO“AI一键闪记”等功能,坚决反对第三方通过模拟点击操控微信。如今,微信却与华为、荣耀、小米等多家厂商合作,推出A2A(智能体到智能体)助手能力,允许用户通过系统AI助手直接发送微信消息、拨打语音电话。 这一转变源于腾讯在AI竞争中的焦虑。其AI应用“元宝”月活远低于竞争对手,而微信坐拥14亿月活和小程序生态,成为腾讯在AI时代的关键底牌。微信正内测AI智能体,旨在通过自然语言调用小程序服务,但需要打通手机系统这一首要AI入口。A2A合作让手机厂商的智能体作为“接线员”,将用户指令转交微信执行,腾讯借此既保住了生态控制权,又接入了系统级流量。 与之前被封杀的GUI(图形界面模拟操作)路线不同,A2A采用双重授权机制,通过标准化接口调用,微信在其中占据主导。手机厂商之所以愿意合作,是因为GUI强攻路线已被证明行不通,而A2A为其保留了在系统级AI场景中的发展空间,并有助于在激烈的行业竞争中快速提升AI整合能力。尽管存在数据隐私担忧,但A2A被视为比模拟点击更安全合规的路径。 这场合作本质是双方在AI入口争夺中的阶段性妥协:腾讯需要手机入口为微信AI引流,手机厂商则需要突破跨应用调用的合规瓶颈。长远看,腾讯试图将微信打造为AI“服务操作系统”,而手机厂商则希望用户深度依赖系统自带助手,双方生态战略的博弈将持续。AI时代的入口之争,已随着用户一句“帮我发微信”悄然展开。

marsbit2小时前

从封杀豆包到拥抱荣耀,微信为什么突然“变脸”?

marsbit2小时前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.5k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片