¿Podrá Alibaba Cloud reescribirse a sí mismo?

marsbitPublicado a 2026-05-20Actualizado a 2026-05-20

Resumen

Durante los últimos cinco meses, los ingresos de MaaS de Alibaba Cloud se han multiplicado por 15, un reflejo de su profunda reestructuración. La compañía ha completado una actualización integral de su pila tecnológica hacia un modelo centrado en Agent, abarcando desde chips y la nube hasta modelos y plataformas de inferencia. Presentó su nueva web de IA "QianWen Yun", servidores con su chip AI autodesarrollado Zhenwu M890 y su último modelo insignia, Qwen3.7-Max. El núcleo de esta transformación es cambiar un sistema construido durante 17 años para que lo usen humanos, por uno nuevo donde los Agents consumen Tokens. Se ha enfatizado el papel clave de los chips propios, como el Zhenwu M890, para controlar el coste marginal por Token y garantizar competitividad a largo plazo. La propia plataforma cloud está siendo reescrita para satisfacer las demandas de los Agents: cargas de trabajo elásticas, de corta vida y concurrentes. Los productos se están encapsulando como habilidades estandarizadas para que los Agents los utilicen de forma autónoma, lo que ya genera un crecimiento automático de recursos. El enfoque del modelo Qwen3.7-Max ha pasado de "hablar bien" a "hacer tareas", demostrando una ejecución autónoma de larga duración, como optimizar un kernel de cálculo para su propio chip sin intervención humana. La plataforma de inferencia "Bailian" soporta este modelo y otros de terceros. Esta reestructuración implica cambios organizativos profundos: nuevos equipos comerciales...

En los últimos cinco meses, los ingresos de MaaS de Alibaba Cloud han crecido 15 veces. Este es solo un aspecto de la reestructuración de Alibaba Cloud. En la cumbre, Alibaba Cloud anunció que ha completado la actualización de toda la pila "chip-nube-modelo-inferencia" a nivel de Agente. Simultáneamente, lanzó el nuevo sitio web oficial de IA "Qianwen Cloud", servidores de supernodos equipados con el chip de IA de diseño propio Zhenwu M890, y el modelo insignia más reciente, Qwen3.7-Max.

Como dijo Liu Weiguang, vicepresidente sénior de Alibaba Cloud: "Estamos construyendo la fábrica de IA más grande de China". La metáfora de la fábrica implica una lógica de producción completa: el chip es la materia prima, la nube es el taller, el modelo es la máquina, la plataforma de inferencia es la línea de producción, y la mercancía final producida son los Tokens.

Y la esencia de esta reestructuración es transformar todo el sistema construido durante los últimos 17 años en torno al "uso de la nube por personas" en un nuevo sistema centrado en el "consumo de Tokens por parte de Agentes".

La carta de los chips, ¿por qué jugarla ahora?

Alibaba Cloud rara vez ha enfatizado públicamente los chips en el pasado. En esta cumbre, no solo presentó la nueva generación del chip de IA unificado para entrenamiento e inferencia Zhenwu M890, sino que también reveló, sin precedentes, la hoja de ruta de chips para los próximos dos años, avanzando gradualmente con las dos generaciones de productos Zhenwu V900 y Zhenwu J900.

El Zhenwu M890 cuenta con 144 GB de memoria de video, un ancho de banda de interconexión entre chips de 800 GB/s, y un rendimiento tres veces superior al de su predecesor, el Zhenwu 810E. En combinación con el chip de interconexión ICN Switch de diseño propio, 128 chips de IA pueden formar una sola máquina, con una latencia P2P inferior a 150 nanosegundos.

Pero más allá de los parámetros, la información clave es la escala: la serie Zhenwu ha acumulado un volumen de envío de 560,000 unidades, habiéndose introducido ya en más de 400 clientes de más de 20 industrias, como telecomunicaciones, FAW, y Shanghai Pudong Development Bank.

Liu Weiguang comparó repetidamente con Google. La integración profunda entre el TPU de Google y Gemini ha permitido a Google lograr la mejor relación costo-rendimiento dentro de su propio marco. Alibaba Cloud, por supuesto, quiere seguir el mismo camino. Resumió la lógica competitiva en una frase: "Si en el futuro la competencia se basa en que cada chip pueda generar más Tokens de alta calidad que los de la competencia, entonces habremos ganado".

Sumado a la CPU Yitian, la tarjeta de red inteligente Panmai, y el chip controlador de almacenamiento Zhenyue, el panorama de chips de T-Head (Pingtouge) se ha extendido desde puntos individuales hasta cubrir completamente la potencia de cálculo, la red y el almacenamiento. Cuando la demanda de inferencia se expande exponencialmente, solo teniendo los chips en sus propias manos se puede controlar el coste marginal de cada Token.

La lógica no es compleja. Las compañías de modelos pueden competir en parámetros, pero los proveedores de nube finalmente compiten por quién ofrece Tokens más baratos, más estables y más rápidos. El chip es el punto de partida de esta guerra de costos.

La nube en sí también debe ser reescrita

Los chips resuelven el problema de "poder ejecutarlo", pero las necesidades de los Agentes respecto a la nube van mucho más allá del poder de cálculo.

La lógica de interacción de los productos de nube tradicionales está diseñada para humanos: abrir la consola, mirar los menús, configurar parámetros, hacer clic en botones. Este conjunto de cosas es completamente inutilizable para un Agente. Un Agente no ve páginas web ni hace clic en botones; necesita descripciones de capacidades estructuradas, protocolos de llamada estandarizados y retroalimentación predecible.

Li Feifei, CTO de Alibaba Cloud, usó un conjunto de contrastes para ilustrar el problema: la carga de trabajo de la nube tradicional es estable, una instancia de ECS puede ejecutarse durante meses o incluso años; pero la carga de trabajo de un Agente es "elástica sin patrón, de ciclo de vida corto, con picos instantáneos que llegan y se van". Cuando un Agente completa una tarea, su entorno de sandbox se destruye; la siguiente solicitud puede llegar en unos milisegundos o varias horas después.

Para ello, Alibaba Cloud ha hecho tres cosas.

Primero, hacer que los productos de nube sean "Skillizados", "MCPizados" y "CLIizados". En pocas palabras, encapsular cada producto de nube en una interfaz estandarizada que un Agente pueda invocar directamente, como invocar una función.

Segundo, construir un entorno de ejecución exclusivo para Agentes: sandbox ligero, colaboración multi-agente, memoria entre tareas y canales de flujo de datos.

Tercero, reconstruir la lógica de planificación, pasando de la "planificación de recursos" a la "planificación de tareas", porque cuando una gran cantidad de Agentes concurren simultáneamente, los métodos tradicionales de orquestación de recursos no pueden soportarlo.

Liu Weiguang señaló que algunas aplicaciones de IA, después de ser implementadas, automáticamente activan recursos en la nube en segundo plano: máquinas virtuales, instancias de bases de datos, entornos sandbox, todo el proceso sin intervención humana. La cantidad de recursos que un cliente activa automáticamente en un día equivale a lo que antes tomaba dos semanas de operación manual.

"Esto equivale a decir que los Agentes están usando la nube por sí mismos." Liu Weiguang proporcionó una relación de conversión calculada internamente: el consumo de Tokens se puede convertir proporcionalmente en el uso de GPU, y cada aumento en una GPU impulsa aproximadamente un aumento equivalente en CPU. Es decir, el crecimiento de los ingresos por Tokens no está erosionando los ingresos tradicionales de la nube, sino impulsándolos, siempre que la plataforma en la nube pueda manejar la carga de trabajo de los Agentes.

Por lo tanto, Alibaba Cloud no está añadiendo una capa de capacidad de IA al sistema existente, sino que está reescribiéndolo por completo, desde la forma de interacción y la lógica de planificación hasta el modelo de facturación y la forma de los productos.

El modelo no es para chatear

La tercera capa de la reestructuración completa de la pila es el modelo. Qwen3.7-Max ocupó el primer lugar nacional en la clasificación global de pruebas ciegas de Arena, superando a Kimi-K2.6, DeepSeek-v4-pro y GLM-5.1. El enfoque de esta presentación es la redefinición de la dirección de las capacidades del modelo por parte de Alibaba.

Zhou Jingren, responsable del modelo de lenguaje grande Tongyi de Alibaba, declaró: "En el pasado buscábamos que el modelo 'hablara bien'; ahora exigimos que el modelo 'pueda hacerlo'."

Tomando como referencia la práctica de Alibaba Cloud con chips, en el chip Zhenwu M890, con el que nunca tuvo contacto durante el entrenamiento, Qwen3.7-Max, basándose únicamente en una descripción de la tarea, trabajó de forma autónoma desde cero durante 35 horas, completando de manera independiente la escritura y optimización de un núcleo de computación de IA de nivel productivo. El rendimiento final fue 10 veces superior al de la versión oficial. Todo el proceso se llevó a cabo sin intervención humana ni orientación intermedia.

Esto demuestra la capacidad central del modelo en escenarios de Agentes: ejecución autónoma de largo alcance, recibiendo una tarea, descomponiéndola, planificándola, escribiendo código y depurándolo por sí mismo, trabajando de manera continua durante 35 horas sin parar.

Para soportar este nivel de demanda de inferencia, la plataforma Bailian también se actualizó correspondientemente: planificación unificada de pools para mejorar la utilización de GPU, caché de contexto para eliminar cálculos repetidos, y planificación elástica de rendimiento para enfrentar picos de concurrencia.

En cuanto al ecosistema, Bailian mantiene una integración abierta. Además de la matriz de modelos Qianwen, también incorporó modelos de terceros como Zhipu GLM-5.1, MiniMax M2.7 y MoonShot AI Kimi K2.6.

Liu Weiguang mencionó: "Los clientes en la práctica no usan solo un modelo, sino una combinación de varios. Nosotros proporcionamos las combinaciones, y los clientes encuentran la más adecuada para ellos en la plataforma". En el escenario de la cumbre, los altos ejecutivos de seis compañías líderes de modelos nacionales aparecieron juntos, creando una escena que evocaba una "alianza de IA nacional".

En los últimos tres meses, el modelo insignia Qianwen ha iterado de forma continua las versiones 3.5, 3.6 y 3.7. Este ritmo de lanzamiento en sí mismo transmite una señal: la competencia en capacidades de modelos está lejos de terminar, y Alibaba planea establecer una ventaja a largo plazo mediante la integración vertical de chips de diseño propio y modelos de diseño propio.

La verdadera apuesta de esta reestructuración

Mirando hacia atrás, la lógica subyacente de esta reestructuración completa de la pila por parte de Alibaba Cloud es simple y pura. Cuando el crecimiento de los ingresos por IA supera con creces el de los negocios tradicionales de nube, cuando los Tokens podrían reemplazar a las ECS como la mayor línea de productos, cuando los Agentes comienzan a activar automáticamente recursos en la nube sin necesidad de que un humano inicie sesión en la consola, todo el sistema tecnológico diseñado para personas llega a un punto en el que debe ser cambiado.

Pero la dificultad a nivel de ejecución es otra cosa. El propio Liu Weiguang admite que la transformación "es fácil de decir, pero muy difícil de hacer". En el pasado, el equipo de ventas trataba con los departamentos de TI de los clientes; ahora, para hacer MaaS, hay que dialogar con los departamentos de negocio o incluso con el CEO.

"Tu capacidad de diálogo y tu experiencia son requisitos de un nivel completamente diferente". Alibaba Cloud ya ha establecido vendedores especializados en MaaS para grandes clientes, separándolos de los vendedores tradicionales de IaaS, con evaluaciones y operaciones independientes.

Los indicadores de evaluación también están cambiando. Ya no solo se mira el volumen de llamadas, sino los "Tokens de alta calidad", aquellos que resuelven problemas reales, no los que charlan sin sustancia. Tres indicadores centrales: el crecimiento diario del número de clientes de pago, la cantidad de sistemas centrales de negocio que integran modelos, y la eficiencia con la que los Agentes completan de forma autónoma el ciclo de una tarea.

Estos ajustes a nivel organizativo y de mecanismos a menudo muestran el juicio real de una empresa mejor que los lanzamientos tecnológicos. Alibaba Cloud quiere reconstruir la estructura de ingresos, las relaciones con los clientes y el sistema de ventas. Liu Weiguang declaró: "Antes, cuando hacíamos nube, el presupuesto de TI del cliente era calculable, cuántos servidores había localmente, aproximadamente cuánto costaría migrarlos a la nube, podías ver el problema. Pero con MaaS, la respuesta a este problema la desconoces; una vez dentro, puede superar tus expectativas".

El problema ya no es visible, la respuesta tampoco es segura, pero Alibaba Cloud ha decidido desarmar y reescribir todo el sistema, porque lo único cierto es que la IA es una oportunidad diez o incluso cien veces mayor que cualquier otra anterior.

Esta es probablemente la información más destacable de esta cumbre: no cuánta potencia de cálculo tiene un chip en particular o en qué lugar se clasifica un modelo, sino que el mayor proveedor de nube de China está apostando, con una actitud radical cercana a la de una empresa emergente, por un futuro que está convencido que llegará. (Autor del artículo | Zhang Shuai, Editor | Yang Lin)

Preguntas relacionadas

Q¿Cuál es el objetivo principal de la reestructuración de Alibaba Cloud según el artículo?

AEl objetivo principal de la reestructuración de Alibaba Cloud es transformar su sistema, construido durante 17 años en torno al 'uso de la nube por personas', en un nuevo sistema basado en 'Agentes que consumen Tokens'. Esto implica rediseñar toda la pila tecnológica, desde los chips y la infraestructura en la nube hasta los modelos y las plataformas de inferencia, para adaptarse a la era de la IA y la computación impulsada por Agent.

Q¿Por qué Alibaba Cloud está enfatizando ahora su estrategia de chips, especialmente con la serie Zhenwu?

AAlibaba Cloud está enfatizando su estrategia de chips, particularmente con la serie Zhenwu (como el nuevo M890), porque considera que el control sobre el hardware es fundamental para ganar la guerra de costos en la era de la IA. El objetivo es que cada chip produzca más Tokens de alta calidad a un costo marginal menor que la competencia. Con más de 560,000 chips Zhenwu ya desplegados, buscan replicar la integración profunda que Google logra entre sus TPU y el modelo Gemini, optimizando el rendimiento y la relación costo-beneficio en toda su pila tecnológica.

Q¿Qué tres cambios principales está implementando Alibaba Cloud en su plataforma en la nube para adaptarse a las cargas de trabajo de los Agent?

APara adaptarse a las cargas de trabajo de los Agent, Alibaba Cloud está implementando tres cambios principales en su plataforma: 1) Convertir los productos en la nube en 'Skills' o interfaces estandarizadas que los Agent puedan invocar directamente (Skill化, MCP化, CLI化). 2) Construir un entorno de ejecución específico para Agent, con contenedores ligeros (sandboxes), capacidades de colaboración multi-Agent, memoria entre tareas y canales de flujo de datos. 3) Reconstruir la lógica de programación (scheduling), pasando de una 'programación de recursos' a una 'programación de tareas' para manejar la elasticidad impredecible y la vida útil breve de las cargas de trabajo de los Agent.

QSegún el artículo, ¿cómo ha evolucionado el enfoque de Alibaba Cloud respecto a sus modelos de IA, como Qwen3.7-Max?

AEl enfoque de Alibaba Cloud respecto a sus modelos de IA ha evolucionado de buscar que el modelo 'hable bien' (conversación) a exigir que el modelo 'pueda hacer' (ejecución de tasks). Un ejemplo destacado es Qwen3.7-Max, que, sin entrenamiento previo, trabajó de forma autónoma durante 35 horas para escribir y optimizar un kernel de computación de IA para el chip Zhenwu M890, logrando una mejora de rendimiento de 10x. Esto subraya la capacidad clave para escenarios de Agent: ejecución autónoma de larga duración, descomposición de tareas, planificación y codificación sin intervención humana.

Q¿Qué cambios organizativos y en los indicadores de desempeño reflejan la seriedad de la apuesta de Alibaba Cloud por la transformación hacia MaaS (Modelo como Servicio)?

ALos cambios organizativos y en los KPI que reflejan la seriedad de la apuesta de Alibaba Cloud incluyen: 1) Separar los equipos de ventas de MaaS de los de IaaS tradicional, con dedicación exclusiva para clientes grandes y evaluación independiente. 2) Cambiar los indicadores clave de desempeño: ya no solo se mide el volumen de llamadas a la API, sino el crecimiento diario de clientes pagos, el número de sistemas centrales de negocio que integran modelos y la eficiencia con la que los Agent completan ciclos de tareas de forma autónoma. Estos cambios muestran un rediseño profundo de la estructura de ingresos, las relaciones con los clientes y el sistema comercial para un futuro dominado por la IA.

Lecturas Relacionadas

El Movimiento de Ripple hacia la Privacidad: Cómo una Reorganización del Libro Mayor de XRP Afectará a la Red

El director de tecnología emérito de Ripple, David Schwartz, analizó cómo la red XRP Ledger (XRPL) podría responder ante una posible presión o ataque por parte de un actor estatal, como un régimen autoritario. Aunque reconoció que tales actores podrían causar interrupciones temporales, destacó que el daño a largo plazo sería limitado si la comunidad mantiene una respuesta activa. Schwartz explicó que, en caso de un ataque serio, el XRPL podría reorganizarse alrededor de una estructura de validadores más resistente. Propuso un posible modelo de consenso de dos capas: una capa interna para la operación diaria, con validadores fácilmente reemplazables si son atacados, y una capa externa que solo intervendría para modificar la lista de nodos únicos (UNL). Esta capa externa sería más ligera, operaría de forma intermitente y podría utilizar servicios de anonimización como Tor o I2P, lo que dificultaría su objetivo. Enfatizó que, dado que los validadores de Ripple representan menos del 20% de la red, un ataque concentrado en su infraestructura no comprometería el conjunto total de validadores. La supervivencia del XRPL dependería de la capacidad de la red para reemplazar operadores comprometidos, y solo sería crítica si los actores hostiles lograran disuadir por completo la ejecución de validadores.

bitcoinistHace 25 min(s)

El Movimiento de Ripple hacia la Privacidad: Cómo una Reorganización del Libro Mayor de XRP Afectará a la Red

bitcoinistHace 25 min(s)

Revisión de mitad de año de Fidelity: las 6 tendencias clave de los activos digitales para 2026

Repaso interanual de Fidelity: los 6 grandes temas para los activos digitales en 2026 A mitad de año, el panorama de los activos digitales en 2026 presenta un equilibrio entre las presiones a corto plazo y los avances estructurales a largo plazo. 1. **Integración acelerada con los mercados de capitales**: La fusión con los mercados tradicionales avanza, incluso más rápido de lo esperado en áreas como los ETPs de Bitcoin al contado y la tokenización. La claridad regulatoria también está aumentando. 2. **Derechos de los poseedores de tokens**: Se están probando mecanismos como recompras y nuevas estructuras de gobernanza, pero una "prima por derechos" aún no se refleja plenamente en los precios del mercado. 3. **IA y posible cambio en la minería**: El crecimiento del hashrate de Bitcoin se ha desacelerado, posiblemente debido a que los mineros reasignan energía e infraestructura hacia la rentable demanda de computación para IA. 4. **Bitcoin en un nuevo punto de inflexión**: El aumento del límite de datos para OP_RETURN no ha sobrecargado la red. La atención se centra ahora en la dinámica de los nodos (posible actividad Sybil en Knots) y en las mejoras de seguridad a largo plazo frente a la computación cuántica. 5. **Los bajistas controlan temporalmente**: El escenario bajista ha predominado, con Bitcoin cayendo un 13% debido a la desapalancamiento y la incertidumbre macro. Sin embargo, los fundamentos estructurales positivos, como la adopción institucional, persisten. 6. **El oro se mantiene fuerte**: El oro ha tenido un rendimiento sólido, respaldado por la demanda de los bancos centrales y las tendencias de desdolarización. El rendimiento posterior esperado de Bitcoin aún no se ha materializado. En conclusión, para los inversores, es clave mirar más allá de la volatilidad de precios a corto plazo y centrarse en cómo se están consolidando estos cambios estructurales subyacentes.

marsbitHace 2 hora(s)

Revisión de mitad de año de Fidelity: las 6 tendencias clave de los activos digitales para 2026

marsbitHace 2 hora(s)

Fidelity realiza un balance interanual: 6 tendencias clave para los activos digitales en 2026

Revisión de mitad de año de Fidelity: 6 tendencias clave sobre activos digitales para 2026 A mitad de año, el panorama de los activos digitales equilibra las presiones a corto plazo con avances estructurales. Varias tendencias clave avanzan según lo previsto, mientras que otras aún están en desarrollo. 1. **Integración acelerada con los mercados de capital**: Se mantiene la demanda de exposición a activos digitales a través de canales financieros tradicionales. Los contratos de opciones sobre ETF de Bitcoin al contango rivalizan con las opciones nativas, mostrando una mayor adopción institucional. El sector del tokenización gana fuerza con más productos de inversión basados en blockchain. El marco regulatorio en EE.UU. se aclara. 2. **Derechos de los tenedores de tokens**: Aunque continúan los experimentos en el ecosistema (como recompra de tokens y reestructuraciones de gobernanza), aún no se observa una "prima" clara en los precios del mercado por los derechos de los tenedores. La tendencia avanza, pero está en etapa temprana. 3. **IA y posible cambio en la minería**: La competencia por recursos energéticos de la IA parece estar ralentizando el crecimiento de la tasa de hash de Bitcoin, ya que algunos mineros podrían estar reasignando infraestructura hacia actividades más rentables. El crecimiento del hash ha sido más lento que en años anteriores. 4. **Bitcoin en un nuevo punto de inflexión**: El aumento del límite de datos en OP_RETURN no ha causado una expansión significativa de la cadena de bloques. La atención se centra en dinámicas de red más amplias, como la fluctuación en los nodos Bitcoin Knots, que presenta un riesgo de división bajo pero no nulo. Avanzan las investigaciones sobre actualizaciones de seguridad a largo plazo (post-cuánticas). 5. **Los bajistas controlan temporalmente**: El escenario bajista ha predominado en 2026, con Bitcoin cayendo un 13% debido a desapalancamiento e incertidumbre macroeconómica. Sin embargo, los fundamentos estructurales positivos (adopción institucional, claridad regulatoria) persisten. Bitcoin mostró cierta resiliencia como activo neutral durante tensiones geopolíticas recientes. 6. **El oro mantiene fuerza**: El rendimiento del oro, apoyado por la demanda de los bancos centrales y las tendencias de desdolarización, ha sido sólido, alineándose con las expectativas. La posible superación posterior de Bitcoin prevista aún no se ha materializado. **Conclusión**: Los cimientos para la próxima fase de crecimiento se están fortaleciendo bajo la superficie, a pesar de la volatilidad a corto plazo. Los inversores deben observar estos cambios estructurales en formación.

链捕手Hace 3 hora(s)

Fidelity realiza un balance interanual: 6 tendencias clave para los activos digitales en 2026

链捕手Hace 3 hora(s)

La crisis de la mediana edad de los GP de Crypto: Sin PMF, no hay el próximo cheque de los LP

**Crisis de la mediana edad de los GP de cripto: Sin PMF, no hay próximo cheque de los LP** Los inversores institucionales (LP) ya no compran sueños; los gestores de fondos (GP) deben vender productos concretos. El mercado de cripto ha pasado de la fase de "comprar una visión futura" a la de "comprar un producto específico". Los LP han perdido la paciencia y la confianza tras el ciclo anterior, donde muchos no obtuvieron rendimientos excesivos y la narrativa del "próximo ciclo" se desvaneció. Para sobrevivir, la mayoría de los GP de cripto deben demostrar un "Product-Market Fit" (PMF), ya sea encontrando un nicho donde puedan generar alfa (rendimientos superiores) o resolviendo problemas específicos para los LP. El acceso a la beta (exposición general al mercado) ahora es fácil mediante ETF, ETPs u otros productos líquidos, reduciendo el valor de los fondos de capital riesgo (VC) cripto de "grupo ciego" (blind pool). Las razones tradicionales para invertir en VC cripto se han debilitado: acceso al sector, acceso a acuerdos (deals), juicio superior de los GP y capacidad de "construir la mesa" (networking/exit). Solo los fondos muy grandes con capital paciente (como endowments), family offices, o aquellos que demostraron récords excepcionales en este ciclo, pueden mantenerse en la mesa principal (primary market). Los demás deben reconstruir la confianza desde cero en un nicho específico.

marsbitHace 3 hora(s)

La crisis de la mediana edad de los GP de Crypto: Sin PMF, no hay el próximo cheque de los LP

marsbitHace 3 hora(s)

Trading

Spot
Futuros
活动图片