Cada vez más 'supermercados de modelos': ByteDance, Alibaba y Tencent compiten por integrar

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Resumen: Las principales plataformas en la nube de China, como ByteDance Volcano Engine, Alibaba Cloud y Tencent Cloud, están compitiendo por integrar múltiples modelos de IA en sus servicios de suscripción tipo "supermercado de modelos". Recientemente, Volcano Engine actualizó su plan "Coding Plan" con nuevos modelos como GLM-5.1, Minimax M2.7, Kimi k2.6 y DeepSeek-V3.2, permitiendo a los desarrolladores acceder a varios modelos con una sola suscripción a precios desde 40 CNY/mes. Sin embargo, usuarios reportan problemas como límites de uso demasiado estrictos (5 horas que se agotan rápidamente), errores 429 por sobrecarga del sistema, alta latencia y coeficientes de deducción variables según el modelo utilizado. La tendencia hacia la agregación de modelos está llevando a preocupaciones sobre la "canalización" de los proveedores de modelos independientes, aunque empresas como Zhipu AI, Moonlight (Kimi) y MiniMax están desarrollando estrategias para diferenciarse mediante agentes autónomos, capacidades de texto largo y especialización vertical. Los analistas sugieren que, aunque a corto plazo las plataformas pueden ganar poder de negociación, a largo plazo los modelos especializados mantendrán su valor en nichos específicos.

ByteDance Volcano Engine Ark Coding Plan lanzó oficialmente recientemente GLM-5.1, indicando oficialmente que "se alinea con las capacidades completas del fabricante original, sin límites de compra". Antes de esto, el Coding Plan de Volcano durante mucho tiempo solo tenía modelos más antiguos como GLM-4.7. Esta actualización no solo introdujo GLM-5.1, sino que también integró múltiples modelos de inteligencia artificial nacionales de última generación como Minimax M2.7, Kimi k2.6 y DeepSeek-V3.2.

Esto significa que los desarrolladores, con una sola suscripción, pueden acceder simultáneamente a múltiples modelos líderes. Según la retroalimentación del mercado, este "modelo de paquete" reduce enormemente los costos de prueba y error para los desarrolladores. Actualmente, el precio del paquete Lite es de 40 yuanes mensuales y el paquete Pro de 200 yuanes mensuales, lo que hace que muchos desarrolladores estén dispuestos a "comprar uno para asegurar su lugar".

El propio GLM-5.1 de Zhipu AI, en una actualización a principios de abril de 2026, ya mostró capacidades de ingeniería impresionantes. En dos videos oficiales publicados por Zhipu, "construir un escritorio de Linux desde cero en 8 horas" y "655 iteraciones, aumentando el rendimiento de consulta de la base de datos vectorial a 6.9 veces la versión inicial", renovaron la imaginación del público sobre la "ejecución efectiva en 8 horas" de los grandes modelos.

Periodista explora comunidad de desarrolladores: la mayoría de los usuarios indican que "no es duradero"

Al entrar en un grupo de comunicación de desarrolladores de Ark Coding, el periodista descubrió que, además de publicaciones compartiendo experiencias, muchos usuarios reportaron una brecha en la experiencia real. Al revisar unas páginas de la comunidad de intercambio, se encuentran numerosas publicaciones de quejas y solicitudes de reembolso, con muchos netizens exclamando directamente "me siento estafado".

Las controversias son principalmente dos:

Una es sobre el agotamiento rápido de la cuota. Un usuario llamado "Hakimi" publicó: "unas pocas rondas de diálogo en una tarea y la limitación de 5 horas casi se agota". Otro netizen publicó que la "razón para activar la limitación de 5 horas" fue porque la cuenta tuvo una ventana deslizante continua durante 5 horas, con un número real de solicitudes que excedió las 6004, superando el límite del sistema.

La segunda es la degradación de la experiencia debido a la presión en la programación de la capacidad de cálculo. Muchos usuarios informaron encontrar el error 429 (demasiadas solicitudes) y, en horas pico, "un retraso del primer carácter de más de un minuto es normal". Un usuario直言: "La activación de la limitación de 5 horas es demasiado frecuente, no se puede usar para un desarrollo serio."

Al mismo tiempo, detrás del bajo precio mensual de 40 yuanes del Coding Plan, también se esconde una "corriente oculta" sobre "una solicitud de llamada" que conduce a diferentes coeficientes de deducción en el paquete. Por ejemplo, un usuario publicó en el grupo de intercambio de desarrolladores una imagen de las "diferencias en los coeficientes de deducción al llamar a diferentes modelos". Por ejemplo, la serie completa de Doubao y la serie Qwen tienen un coeficiente de deducción de 1 vez, la serie DeepSeek de 2 veces, y las series MiniMax-M2.7, Kimi-K2.6 y GLM-5.1 de 5 veces.

Esto también refleja que la construcción de un "supermercado de modelos" no es tan fácil como se imaginaba. Los desarrolladores son atraídos por la "relación costo-beneficio", pero las deficiencias expuestas inicialmente en áreas como la programación de capacidad de cálculo hacen que muchos desarrolladores, después de probarlo, opten por detenerse. Esto también expone los dolores de crecimiento iniciales del "modelo de paquete". Con la afluencia de usuarios, la capacidad de carga de la plataforma de computación enfrenta desafíos. Cómo encontrar un punto de equilibrio sostenible entre la atracción de precios bajos y la calidad del servicio será una propuesta a largo plazo que Volcano Engine y sus seguidores necesitarán resolver.

Proveedores de nube se vuelven colectivamente hacia "supermercados de modelos": comienza a aparecer una estratificación sólida

Esta actualización "integrativa" del Coding Plan de Volcano Engine tampoco es un evento aislado.

Desde principios de 2026, los principales proveedores de nube como Alibaba Cloud, Baidu Intelligent Cloud y Tencent Cloud han estado avanzando en layouts de integración de múltiples modelos. Por ejemplo, Alibaba Cloud, como pionero en la industria, lanzó antes el paquete de suscripción multi-modelo "Bailian Coding Plan". Actualmente admite series como Qianwen, kimi-k2.5, glm-5, MiniMax-M2.5, etc. Actualmente, el precio Pro es de 200 yuanes mensuales, y el paquete Lite dejó de estar disponible para nuevas compras a partir del 20 de marzo, y dejará de renovarse y actualizarse a partir del 13 de abril.

El servicio de suscripción Tencent Cloud Large Model Coding Plan se lanzó completamente en marzo de 2026, admitiendo múltiples modelos最新 como Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan lanzó oficialmente el servicio de suscripción de codificación AI Coding Plan en febrero de 2026, siendo también uno de los primeros proveedores de nube en lanzar este tipo de servicio en China.

El modelo de "supermercado de modelos" no es una elección de una sola empresa, sino que se está convirtiendo en una pista en la que compiten los proveedores de nube. Pero al desgarrar la estrategia de agregación de los proveedores de nube, quién puede proporcionar un servicio más estable, reglas de cuota más transparentes, mecanismos de tolerancia a fallos más flexibles, quién puede extender más capacidades de servicio a nivel empresarial más allá de la programación, y si la tasa de renovación puede seguir el ritmo, se convierten en nuevos núcleos de competencia.

A nivel internacional, las plataformas de servicio de agregación de modelos Amazon Bedrock y Microsoft Azure, aunque difieren en escenarios del modo de suscripción Coding nacional, pertenecen a la misma tendencia de integración.

En general, la competencia de la industria también está pasando de la "comparación de capacidades de un solo modelo" a la "capacidad de integración de plataformas + capacidad de servicio ecológico", y la concentración de la industria aumentará rápidamente.

Wang Kai, analista jefe de asignación de activos de Guoxin Securities, dijo al periodista que, aunque la diferenciación de la industria se está acelerando, puede ser un poco pronto juzgar el período de integración. "Más precisamente, esto es una refinación e iteración de la división laboral de la cadena industrial. Los fabricantes de modelos se enfocan en algoritmos, los proveedores de nube se enfocan en la entrega de ingeniería, cada uno aprovechando sus ventajas principales". Considera que, independientemente de si otros proveedores de nube siguen el ejemplo, el panorama competitivo evolucionará de luchas individuales a una diferenciación de nicho ecológico.

¿Se intensifica la presión de "canalización" para las empresas de grandes modelos?

La llamada "canalización" no se refiere a la desaparición de las empresas de modelos, sino a la pérdida de su prima de producto, derecho de conexión con el usuario y poder de discourse, transfiriéndose las ganancias a la parte de la plataforma de computación, convirtiéndose en un papel "dominado".

Bajo la ola de agregación de los proveedores de nube, la "canalización" también se está convirtiendo en la espada de Damocles que pende sobre la cabeza de las empresas independientes de grandes modelos. En este juego silencioso, jugadores líderes como Zhipu AI, Moonlight (Kimi), MiniMax, etc., no han optado por comprometerse pasivamente, sino que han crecido desde sus genes, dando diferentes caminos de突围.

Zhang Peng, CEO de Zhipu AI, en un diálogo público el 8 de abril, dejó claro que el objetivo final de Zhipu nunca es convertirse en una "herramienta de llamada reemplazable a voluntad", sino construir un agente inteligente totalmente autónomo (Autonomous Agent). Este posicionamiento intenta hacer que Zhipu actualice de "proveedor de modelos" a "ejecutor de tareas", evitando así la trampa de precios bajos de la API pura.

Moonlight (Kimi) adopta una estrategia de "disposición dispersa + profundización en texto largo". Se conecta simultáneamente a múltiples plataformas principales en la nube como Volcano Engine y Alibaba Cloud, logrando un suministro de capacidad de cálculo multi-fuente, sin estar vinculado a un solo canal, garantizando la estabilidad del servicio y el control de costos. Kimi K2.6, lanzado en abril de 2026, adopta una arquitectura Mixture of Experts (MoE), con una ventana de contexto estándar de 256K tokens.

MiniMax concentra sus recursos centrales en campos verticales como la creación de contenido, servicio al cliente inteligente, educación, servicios empresariales, entretenimiento social, etc., especialmente en escenarios como IA para juegos, humanos digitales, interacción multimodal, etc., creando "capacidades personalizadas difíciles de reemplazar por la plataforma en la nube".

¿La integración de plataformas de los grandes fabricantes acelerará la "canalización" de las empresas de modelos? Wang Kai, analista jefe de asignación de activos de Guoxin Securities, cree que es necesario distinguir entre perspectivas a corto y largo plazo.

"A corto plazo, es una ley comercial que los canales de distribución estén controlados por la plataforma, se ceda parcialmente el poder de fijación de precios y las ganancias de los fabricantes de modelos se transfieran a la parte de entrada. Pero a largo plazo, los modelos generales son fáciles de homogeneizar, y los modelos de aprendizaje profundo en escenarios verticales como finanzas, atención médica, derecho, etc., tienen barreras profesionales que la agregación centralizada no puede eliminar." Considera.

Para hacer frente al riesgo de ser platformizado, también se puede hacer referencia a las estrategias de OpenAI y Anthropic. Por un lado, fortalecer los canales que se enfrentan directamente a los usuarios finales, por ejemplo, la operación independiente de ChatGPT y Claude esencialmente establece una conexión de usuario que evita la plataforma. Por otro lado, la velocidad de iteración tecnológica y el reconocimiento de la marca del usuario son dos barreras efectivas, por lo que las empresas de modelos necesitan equilibrar la inversión en I+D y el layout de productización.

El final del juego de esta "canalización versus platformización" podría no ser quién se come a quién, sino una mayor clarificación de la división laboral. Los proveedores de nube hacen la canalización, las empresas de modelos hacen la tecnología, y ambas partes encuentran gradualmente sus límites de supervivencia en el juego.

En cuanto a quién se come a quién, en esta etapa, aún está lejos del final de la historia.

Este artículo proviene del WeChat public account "科创板日报", autor: Wang Nai

你可能也喜欢

工党领袖换人，压抑已久的英国加密市场要翻身了？

英国工党领袖基尔·斯塔默宣布辞去首相职务，党魁竞选随之启动。前大曼彻斯特市长安迪·伯纳姆成为接任的热门人选，加密行业对其抱有期待，希望他能缓和工党对数字资产的强硬态度，并将该行业塑造为经济增长动力。目前，英国金融行为监管局（FCA）正推进一套全面的加密监管框架，计划于2027年10月正式生效。新规要求相关企业必须获取专项经营授权。尽管领导层更迭可能调整政策优先级或更换官员，但监管框架的核心已通过立法确立，整体方向发生根本逆转的可能性较小。行业希望新政府能推动出台比例适度的资本要求、简化的授权流程，并对质押、借贷等业务给予明确监管界定，同时更切实地贯彻经济增长导向的监管使命。市场预测平台显示伯纳姆接任概率极高，传统金融市场对此反应平静。行业呼吁英国政界和监管机构更积极地接纳加密领域，以利用其深厚的金融科技底蕴抢占全球先机。

Foresight News11分钟前

Foresight News11分钟前

美元硬刚日本干预红线，Carry Trade还会崩盘吗？

6月23日，美元指数维持在101上方，美元兑日元一度逼近161.96的关键位置。若突破该点位，日元将跌至1986年12月以来最低水平。美元走强主要受美联储政策预期转鹰推动，市场对年内加息的押注升温，短端美债收益率高企。日元持续承压的核心在于美日利差扩大。日本财务省已就汇率波动发出警告，市场警惕当局可能干预汇市，但单次干预难以扭转由利差主导的趋势。同时，油价因地缘局势反复波动，若持续反弹可能加剧通胀担忧，进一步支撑美元利率预期。当前市场焦点集中在美联储加息前景、日本干预汇市的可能以及油价走势对通胀的影响上。美元指数能否突破前高、日元会否触及数十年低位以及日本会否实际行动，将决定强美元行情能否延续。

marsbit15分钟前

marsbit15分钟前

60天窗口压低油价，为什么市场反而跌了？

6月23日，国际油价延续跌势。此前市场因担忧霍尔木兹海峡航运中断而推高的风险溢价，正随着两艘油轮恢复通行而减弱。这被视为供应紧张最坏情形暂未发生的信号。同时，美伊临时安排为伊朗石油销售提供了约60天的窗口，进一步缓解了短期供应担忧。然而，这一安排被视为谈判缓冲期而非最终协议，其临时性限制了油价的下跌空间。市场态度谨慎，因中东地缘政治风险并未根除。美伊互信不足，任何关于航运受阻或谈判破裂的消息都可能迅速推高油价。此外，美国战略石油储备处于历史低位，削弱了其应对潜在供应冲击的缓冲能力。综上，当前油价回落主要源于短期供应恐慌降温，但由于长期风险仍在，市场并未将此次下跌视为风险彻底出清。

marsbit26分钟前

marsbit26分钟前

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

6月22日，SK海力士盘中市值达208万亿韩元，26年来首次超越三星电子，成为韩国股市市值第一。该股今年累计涨幅已超340%，其强势表现主要得益于AI浪潮下的存储芯片需求，尤其是其在HBM（高带宽存储器）市场占据主导地位。韩华投资证券将SK海力士目标价大幅上调至430万韩元，为韩国券商最高目标价。核心逻辑是，长期供货协议（LTA）和稳定的HBM需求已从根本上改变了存储芯片行业的盈利波动性，公司正转型为能够持续产生高利润的企业。多家券商近期也集体上调目标价，认为存储行业估值逻辑正在发生范式转变。业绩方面，SK海力士2026财年一季度营收首次突破50万亿韩元，营业利润率高达72%，创行业纪录。HBM是核心驱动力，目前全球供需紧张局面预计将持续。尽管6月23日股价从盘前高点回落，部分市场观点认为市值反超可能存在短期过热，但仍有高回报投资者将回调视为加仓机会。市场正在给予直接受益于AI基础设施建设的公司更高估值溢价。

marsbit44分钟前

marsbit44分钟前

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

英伟达B200芯片的云端租赁价格近期显著下跌，从5月底的6.11美元/小时降至4.22美元/小时，三周内跌幅约30%。这反映出AI算力短缺的叙事可能正在动摇，供应增加与竞争加剧是主要原因。与此同时，半导体市场出现分化：以美光、闪迪为代表的内存芯片公司股价飙升，而英伟达股价同期略有下跌。市场逻辑正在转变：GPU供应趋于宽松，但AI模型对高带宽内存（HBM）和存储的需求暴增，使内存成为新的产业瓶颈。内存合约价格上半年涨幅超过100%，连苹果公司都表示难以承受成本压力。高盛交易主管指出，若算力租赁价格持续走低，将动摇整个AI硬件链的估值基础，利润可能从卖芯片的上游（如英伟达）向掌握使用量变现的下游转移。另一方面，长期协议市场依然火热，如Google与SpaceX签订了价值300亿美元的GPU租赁大单，表明大客户仍在锁定长期算力。但这类合同也包含提前终止条款，显示了买方的谨慎。综合来看，AI产业的价值链和利润分配正在发生变化。投资者的关注点需从“算力稀缺”转向产业链中定价权的转移，内存芯片厂商目前似乎占据了更有利的位置。美光即将发布的财报将成为验证这一趋势的关键。

marsbit53分钟前

marsbit53分钟前

交易

现货

合约

Cada vez más 'supermercados de modelos': ByteDance, Alibaba y Tencent compiten por integrar

文章摘要

Periodista explora comunidad de desarrolladores: la mayoría de los usuarios indican que "no es duradero"

Proveedores de nube se vuelven colectivamente hacia "supermercados de modelos": comienza a aparecer una estratificación sólida

¿Se intensifica la presión de "canalización" para las empresas de grandes modelos?

热门币种推荐

相关问答

你可能也喜欢

工党领袖换人，压抑已久的英国加密市场要翻身了？

美元硬刚日本干预红线，Carry Trade还会崩盘吗？

60天窗口压低油价，为什么市场反而跌了？

SK 海力士市值 26 年来首超三星，韩国券商喊出仍有 50% 上涨空间

GPU 租赁价格三周跌 30%，AI 价值链正从英伟达「大迁移」至内存芯片

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签