Cada vez más 'supermercados de modelos': ByteDance, Alibaba y Tencent compiten por integrar

marsbit发布于2026-04-24更新于2026-04-24

文章摘要

Resumen: Las principales plataformas en la nube de China, como ByteDance Volcano Engine, Alibaba Cloud y Tencent Cloud, están compitiendo por integrar múltiples modelos de IA en sus servicios de suscripción tipo "supermercado de modelos". Recientemente, Volcano Engine actualizó su plan "Coding Plan" con nuevos modelos como GLM-5.1, Minimax M2.7, Kimi k2.6 y DeepSeek-V3.2, permitiendo a los desarrolladores acceder a varios modelos con una sola suscripción a precios desde 40 CNY/mes. Sin embargo, usuarios reportan problemas como límites de uso demasiado estrictos (5 horas que se agotan rápidamente), errores 429 por sobrecarga del sistema, alta latencia y coeficientes de deducción variables según el modelo utilizado. La tendencia hacia la agregación de modelos está llevando a preocupaciones sobre la "canalización" de los proveedores de modelos independientes, aunque empresas como Zhipu AI, Moonlight (Kimi) y MiniMax están desarrollando estrategias para diferenciarse mediante agentes autónomos, capacidades de texto largo y especialización vertical. Los analistas sugieren que, aunque a corto plazo las plataformas pueden ganar poder de negociación, a largo plazo los modelos especializados mantendrán su valor en nichos específicos.

ByteDance Volcano Engine Ark Coding Plan lanzó oficialmente recientemente GLM-5.1, indicando oficialmente que "se alinea con las capacidades completas del fabricante original, sin límites de compra". Antes de esto, el Coding Plan de Volcano durante mucho tiempo solo tenía modelos más antiguos como GLM-4.7. Esta actualización no solo introdujo GLM-5.1, sino que también integró múltiples modelos de inteligencia artificial nacionales de última generación como Minimax M2.7, Kimi k2.6 y DeepSeek-V3.2.

Esto significa que los desarrolladores, con una sola suscripción, pueden acceder simultáneamente a múltiples modelos líderes. Según la retroalimentación del mercado, este "modelo de paquete" reduce enormemente los costos de prueba y error para los desarrolladores. Actualmente, el precio del paquete Lite es de 40 yuanes mensuales y el paquete Pro de 200 yuanes mensuales, lo que hace que muchos desarrolladores estén dispuestos a "comprar uno para asegurar su lugar".

El propio GLM-5.1 de Zhipu AI, en una actualización a principios de abril de 2026, ya mostró capacidades de ingeniería impresionantes. En dos videos oficiales publicados por Zhipu, "construir un escritorio de Linux desde cero en 8 horas" y "655 iteraciones, aumentando el rendimiento de consulta de la base de datos vectorial a 6.9 veces la versión inicial", renovaron la imaginación del público sobre la "ejecución efectiva en 8 horas" de los grandes modelos.

Periodista explora comunidad de desarrolladores: la mayoría de los usuarios indican que "no es duradero"

Al entrar en un grupo de comunicación de desarrolladores de Ark Coding, el periodista descubrió que, además de publicaciones compartiendo experiencias, muchos usuarios reportaron una brecha en la experiencia real. Al revisar unas páginas de la comunidad de intercambio, se encuentran numerosas publicaciones de quejas y solicitudes de reembolso, con muchos netizens exclamando directamente "me siento estafado".

Las controversias son principalmente dos:

Una es sobre el agotamiento rápido de la cuota. Un usuario llamado "Hakimi" publicó: "unas pocas rondas de diálogo en una tarea y la limitación de 5 horas casi se agota". Otro netizen publicó que la "razón para activar la limitación de 5 horas" fue porque la cuenta tuvo una ventana deslizante continua durante 5 horas, con un número real de solicitudes que excedió las 6004, superando el límite del sistema.

La segunda es la degradación de la experiencia debido a la presión en la programación de la capacidad de cálculo. Muchos usuarios informaron encontrar el error 429 (demasiadas solicitudes) y, en horas pico, "un retraso del primer carácter de más de un minuto es normal". Un usuario直言: "La activación de la limitación de 5 horas es demasiado frecuente, no se puede usar para un desarrollo serio."

Al mismo tiempo, detrás del bajo precio mensual de 40 yuanes del Coding Plan, también se esconde una "corriente oculta" sobre "una solicitud de llamada" que conduce a diferentes coeficientes de deducción en el paquete. Por ejemplo, un usuario publicó en el grupo de intercambio de desarrolladores una imagen de las "diferencias en los coeficientes de deducción al llamar a diferentes modelos". Por ejemplo, la serie completa de Doubao y la serie Qwen tienen un coeficiente de deducción de 1 vez, la serie DeepSeek de 2 veces, y las series MiniMax-M2.7, Kimi-K2.6 y GLM-5.1 de 5 veces.

Esto también refleja que la construcción de un "supermercado de modelos" no es tan fácil como se imaginaba. Los desarrolladores son atraídos por la "relación costo-beneficio", pero las deficiencias expuestas inicialmente en áreas como la programación de capacidad de cálculo hacen que muchos desarrolladores, después de probarlo, opten por detenerse. Esto también expone los dolores de crecimiento iniciales del "modelo de paquete". Con la afluencia de usuarios, la capacidad de carga de la plataforma de computación enfrenta desafíos. Cómo encontrar un punto de equilibrio sostenible entre la atracción de precios bajos y la calidad del servicio será una propuesta a largo plazo que Volcano Engine y sus seguidores necesitarán resolver.

Proveedores de nube se vuelven colectivamente hacia "supermercados de modelos": comienza a aparecer una estratificación sólida

Esta actualización "integrativa" del Coding Plan de Volcano Engine tampoco es un evento aislado.

Desde principios de 2026, los principales proveedores de nube como Alibaba Cloud, Baidu Intelligent Cloud y Tencent Cloud han estado avanzando en layouts de integración de múltiples modelos. Por ejemplo, Alibaba Cloud, como pionero en la industria, lanzó antes el paquete de suscripción multi-modelo "Bailian Coding Plan". Actualmente admite series como Qianwen, kimi-k2.5, glm-5, MiniMax-M2.5, etc. Actualmente, el precio Pro es de 200 yuanes mensuales, y el paquete Lite dejó de estar disponible para nuevas compras a partir del 20 de marzo, y dejará de renovarse y actualizarse a partir del 13 de abril.

El servicio de suscripción Tencent Cloud Large Model Coding Plan se lanzó completamente en marzo de 2026, admitiendo múltiples modelos最新 como Tencent HY 2.0 Instruct, GLM-5, Kimi-K2.5, MiniMax-M2.5. Baidu Qianfan lanzó oficialmente el servicio de suscripción de codificación AI Coding Plan en febrero de 2026, siendo también uno de los primeros proveedores de nube en lanzar este tipo de servicio en China.

El modelo de "supermercado de modelos" no es una elección de una sola empresa, sino que se está convirtiendo en una pista en la que compiten los proveedores de nube. Pero al desgarrar la estrategia de agregación de los proveedores de nube, quién puede proporcionar un servicio más estable, reglas de cuota más transparentes, mecanismos de tolerancia a fallos más flexibles, quién puede extender más capacidades de servicio a nivel empresarial más allá de la programación, y si la tasa de renovación puede seguir el ritmo, se convierten en nuevos núcleos de competencia.

A nivel internacional, las plataformas de servicio de agregación de modelos Amazon Bedrock y Microsoft Azure, aunque difieren en escenarios del modo de suscripción Coding nacional, pertenecen a la misma tendencia de integración.

En general, la competencia de la industria también está pasando de la "comparación de capacidades de un solo modelo" a la "capacidad de integración de plataformas + capacidad de servicio ecológico", y la concentración de la industria aumentará rápidamente.

Wang Kai, analista jefe de asignación de activos de Guoxin Securities, dijo al periodista que, aunque la diferenciación de la industria se está acelerando, puede ser un poco pronto juzgar el período de integración. "Más precisamente, esto es una refinación e iteración de la división laboral de la cadena industrial. Los fabricantes de modelos se enfocan en algoritmos, los proveedores de nube se enfocan en la entrega de ingeniería, cada uno aprovechando sus ventajas principales". Considera que, independientemente de si otros proveedores de nube siguen el ejemplo, el panorama competitivo evolucionará de luchas individuales a una diferenciación de nicho ecológico.

¿Se intensifica la presión de "canalización" para las empresas de grandes modelos?

La llamada "canalización" no se refiere a la desaparición de las empresas de modelos, sino a la pérdida de su prima de producto, derecho de conexión con el usuario y poder de discourse, transfiriéndose las ganancias a la parte de la plataforma de computación, convirtiéndose en un papel "dominado".

Bajo la ola de agregación de los proveedores de nube, la "canalización" también se está convirtiendo en la espada de Damocles que pende sobre la cabeza de las empresas independientes de grandes modelos. En este juego silencioso, jugadores líderes como Zhipu AI, Moonlight (Kimi), MiniMax, etc., no han optado por comprometerse pasivamente, sino que han crecido desde sus genes, dando diferentes caminos de突围.

Zhang Peng, CEO de Zhipu AI, en un diálogo público el 8 de abril, dejó claro que el objetivo final de Zhipu nunca es convertirse en una "herramienta de llamada reemplazable a voluntad", sino construir un agente inteligente totalmente autónomo (Autonomous Agent). Este posicionamiento intenta hacer que Zhipu actualice de "proveedor de modelos" a "ejecutor de tareas", evitando así la trampa de precios bajos de la API pura.

Moonlight (Kimi) adopta una estrategia de "disposición dispersa + profundización en texto largo". Se conecta simultáneamente a múltiples plataformas principales en la nube como Volcano Engine y Alibaba Cloud, logrando un suministro de capacidad de cálculo multi-fuente, sin estar vinculado a un solo canal, garantizando la estabilidad del servicio y el control de costos. Kimi K2.6, lanzado en abril de 2026, adopta una arquitectura Mixture of Experts (MoE), con una ventana de contexto estándar de 256K tokens.

MiniMax concentra sus recursos centrales en campos verticales como la creación de contenido, servicio al cliente inteligente, educación, servicios empresariales, entretenimiento social, etc., especialmente en escenarios como IA para juegos, humanos digitales, interacción multimodal, etc., creando "capacidades personalizadas difíciles de reemplazar por la plataforma en la nube".

¿La integración de plataformas de los grandes fabricantes acelerará la "canalización" de las empresas de modelos? Wang Kai, analista jefe de asignación de activos de Guoxin Securities, cree que es necesario distinguir entre perspectivas a corto y largo plazo.

"A corto plazo, es una ley comercial que los canales de distribución estén controlados por la plataforma, se ceda parcialmente el poder de fijación de precios y las ganancias de los fabricantes de modelos se transfieran a la parte de entrada. Pero a largo plazo, los modelos generales son fáciles de homogeneizar, y los modelos de aprendizaje profundo en escenarios verticales como finanzas, atención médica, derecho, etc., tienen barreras profesionales que la agregación centralizada no puede eliminar." Considera.

Para hacer frente al riesgo de ser platformizado, también se puede hacer referencia a las estrategias de OpenAI y Anthropic. Por un lado, fortalecer los canales que se enfrentan directamente a los usuarios finales, por ejemplo, la operación independiente de ChatGPT y Claude esencialmente establece una conexión de usuario que evita la plataforma. Por otro lado, la velocidad de iteración tecnológica y el reconocimiento de la marca del usuario son dos barreras efectivas, por lo que las empresas de modelos necesitan equilibrar la inversión en I+D y el layout de productización.

El final del juego de esta "canalización versus platformización" podría no ser quién se come a quién, sino una mayor clarificación de la división laboral. Los proveedores de nube hacen la canalización, las empresas de modelos hacen la tecnología, y ambas partes encuentran gradualmente sus límites de supervivencia en el juego.

En cuanto a quién se come a quién, en esta etapa, aún está lejos del final de la historia.

Este artículo proviene del WeChat public account "科创板日报", autor: Wang Nai

热门币种推荐

相关问答

Q¿Qué es el 'Coding Plan' de ByteDance Volcano Engine y qué nuevos modelos ha integrado recientemente?

AEl 'Coding Plan' de ByteDance Volcano Engine es un servicio de suscripción que permite a los desarrolladores acceder a múltiples modelos de inteligencia artificial. Recientemente, ha integrado modelos como GLM-5.1, Minimax M2.7, Kimi k2.6 y DeepSeek-V3.2, ofreciendo 'capacidades completas alineadas con el fabricante original sin límites de compra'.

Q¿Cuáles son las principales quejas de los desarrolladores sobre el servicio 'Coding Plan' de Volcano Engine?

ALos desarrolladores se quejan principalmente de dos problemas: 1) Límites de uso que se agotan rápidamente, con usuarios reportando que unas pocas conversaciones agotan el límite de 5 horas; y 2) Problemas de rendimiento como errores 429 (demasiadas solicitudes) y retrasos de más de un minuto para la primera respuesta durante horas pico, lo que dificulta el desarrollo serio.

Q¿Cómo están respondiendo los principales proveedores de nube en China a la tendencia de 'supermercado de modelos'?

AProveedores principales como Alibaba Cloud, Tencent Cloud y Baidu Intelligent Cloud están avanzando en la integración de múltiples modelos. Por ejemplo, Alibaba Cloud ofrece 'Bailian Coding Plan', Tencent Cloud lanzó su servicio de suscripción en marzo de 2026, y Baidu Qianfan introdujo su servicio de suscripción AI Coding en febrero de 2026, todos apoyando varios modelos líderes.

Q¿Qué estrategias están adoptando las empresas de modelos independientes como Zhipu AI, Moonlight (Kimi) y MiniMax para evitar la 'canalización'?

AZhipu AI busca construir agentes autónomos completos para ser 'ejecutores de tareas' en lugar de simples proveedores de API. Moonlight (Kimi) adopta una estrategia de distribución diversificada y se especializa en texto largo, integrando múltiples plataformas en la nube. MiniMax se enfoca en verticales como creación de contenido, servicio al cliente, educación y entretenimiento, desarrollando capacidades personalizadas difíciles de reemplazar.

QSegún el analista Wang Kai, ¿cómo evolucionará la competencia entre los proveedores de nube y las empresas de modelos?

AWang Kai, analista jefe de configuración de activos de Guoxin Securities, cree que a corto plazo, la ganancia puede transferirse a las plataformas dueñas de los canales de distribución, pero a largo plazo, los modelos especializados en verticales como finanzas, atención médica y derecho mantendrán barreras profesionales. La competencia evolucionará hacia una división del trabajo más clara, donde los proveedores de nube gestionen la canalización y las empresas de modelos se centren en la tecnología, encontrando cada uno su límite de supervivencia.

你可能也喜欢

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.6k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片