¿Podrá Alibaba Cloud reescribirse a sí mismo?

marsbitPublicado a 2026-05-20Actualizado a 2026-05-20

Resumen

Durante los últimos cinco meses, los ingresos de MaaS de Alibaba Cloud se han multiplicado por 15, un reflejo de su profunda reestructuración. La compañía ha completado una actualización integral de su pila tecnológica hacia un modelo centrado en Agent, abarcando desde chips y la nube hasta modelos y plataformas de inferencia. Presentó su nueva web de IA "QianWen Yun", servidores con su chip AI autodesarrollado Zhenwu M890 y su último modelo insignia, Qwen3.7-Max. El núcleo de esta transformación es cambiar un sistema construido durante 17 años para que lo usen humanos, por uno nuevo donde los Agents consumen Tokens. Se ha enfatizado el papel clave de los chips propios, como el Zhenwu M890, para controlar el coste marginal por Token y garantizar competitividad a largo plazo. La propia plataforma cloud está siendo reescrita para satisfacer las demandas de los Agents: cargas de trabajo elásticas, de corta vida y concurrentes. Los productos se están encapsulando como habilidades estandarizadas para que los Agents los utilicen de forma autónoma, lo que ya genera un crecimiento automático de recursos. El enfoque del modelo Qwen3.7-Max ha pasado de "hablar bien" a "hacer tareas", demostrando una ejecución autónoma de larga duración, como optimizar un kernel de cálculo para su propio chip sin intervención humana. La plataforma de inferencia "Bailian" soporta este modelo y otros de terceros. Esta reestructuración implica cambios organizativos profundos: nuevos equipos comerciales...

En los últimos cinco meses, los ingresos de MaaS de Alibaba Cloud han crecido 15 veces. Este es solo un aspecto de la reestructuración de Alibaba Cloud. En la cumbre, Alibaba Cloud anunció que ha completado la actualización de toda la pila "chip-nube-modelo-inferencia" a nivel de Agente. Simultáneamente, lanzó el nuevo sitio web oficial de IA "Qianwen Cloud", servidores de supernodos equipados con el chip de IA de diseño propio Zhenwu M890, y el modelo insignia más reciente, Qwen3.7-Max.

Como dijo Liu Weiguang, vicepresidente sénior de Alibaba Cloud: "Estamos construyendo la fábrica de IA más grande de China". La metáfora de la fábrica implica una lógica de producción completa: el chip es la materia prima, la nube es el taller, el modelo es la máquina, la plataforma de inferencia es la línea de producción, y la mercancía final producida son los Tokens.

Y la esencia de esta reestructuración es transformar todo el sistema construido durante los últimos 17 años en torno al "uso de la nube por personas" en un nuevo sistema centrado en el "consumo de Tokens por parte de Agentes".

La carta de los chips, ¿por qué jugarla ahora?

Alibaba Cloud rara vez ha enfatizado públicamente los chips en el pasado. En esta cumbre, no solo presentó la nueva generación del chip de IA unificado para entrenamiento e inferencia Zhenwu M890, sino que también reveló, sin precedentes, la hoja de ruta de chips para los próximos dos años, avanzando gradualmente con las dos generaciones de productos Zhenwu V900 y Zhenwu J900.

El Zhenwu M890 cuenta con 144 GB de memoria de video, un ancho de banda de interconexión entre chips de 800 GB/s, y un rendimiento tres veces superior al de su predecesor, el Zhenwu 810E. En combinación con el chip de interconexión ICN Switch de diseño propio, 128 chips de IA pueden formar una sola máquina, con una latencia P2P inferior a 150 nanosegundos.

Pero más allá de los parámetros, la información clave es la escala: la serie Zhenwu ha acumulado un volumen de envío de 560,000 unidades, habiéndose introducido ya en más de 400 clientes de más de 20 industrias, como telecomunicaciones, FAW, y Shanghai Pudong Development Bank.

Liu Weiguang comparó repetidamente con Google. La integración profunda entre el TPU de Google y Gemini ha permitido a Google lograr la mejor relación costo-rendimiento dentro de su propio marco. Alibaba Cloud, por supuesto, quiere seguir el mismo camino. Resumió la lógica competitiva en una frase: "Si en el futuro la competencia se basa en que cada chip pueda generar más Tokens de alta calidad que los de la competencia, entonces habremos ganado".

Sumado a la CPU Yitian, la tarjeta de red inteligente Panmai, y el chip controlador de almacenamiento Zhenyue, el panorama de chips de T-Head (Pingtouge) se ha extendido desde puntos individuales hasta cubrir completamente la potencia de cálculo, la red y el almacenamiento. Cuando la demanda de inferencia se expande exponencialmente, solo teniendo los chips en sus propias manos se puede controlar el coste marginal de cada Token.

La lógica no es compleja. Las compañías de modelos pueden competir en parámetros, pero los proveedores de nube finalmente compiten por quién ofrece Tokens más baratos, más estables y más rápidos. El chip es el punto de partida de esta guerra de costos.

La nube en sí también debe ser reescrita

Los chips resuelven el problema de "poder ejecutarlo", pero las necesidades de los Agentes respecto a la nube van mucho más allá del poder de cálculo.

La lógica de interacción de los productos de nube tradicionales está diseñada para humanos: abrir la consola, mirar los menús, configurar parámetros, hacer clic en botones. Este conjunto de cosas es completamente inutilizable para un Agente. Un Agente no ve páginas web ni hace clic en botones; necesita descripciones de capacidades estructuradas, protocolos de llamada estandarizados y retroalimentación predecible.

Li Feifei, CTO de Alibaba Cloud, usó un conjunto de contrastes para ilustrar el problema: la carga de trabajo de la nube tradicional es estable, una instancia de ECS puede ejecutarse durante meses o incluso años; pero la carga de trabajo de un Agente es "elástica sin patrón, de ciclo de vida corto, con picos instantáneos que llegan y se van". Cuando un Agente completa una tarea, su entorno de sandbox se destruye; la siguiente solicitud puede llegar en unos milisegundos o varias horas después.

Para ello, Alibaba Cloud ha hecho tres cosas.

Primero, hacer que los productos de nube sean "Skillizados", "MCPizados" y "CLIizados". En pocas palabras, encapsular cada producto de nube en una interfaz estandarizada que un Agente pueda invocar directamente, como invocar una función.

Segundo, construir un entorno de ejecución exclusivo para Agentes: sandbox ligero, colaboración multi-agente, memoria entre tareas y canales de flujo de datos.

Tercero, reconstruir la lógica de planificación, pasando de la "planificación de recursos" a la "planificación de tareas", porque cuando una gran cantidad de Agentes concurren simultáneamente, los métodos tradicionales de orquestación de recursos no pueden soportarlo.

Liu Weiguang señaló que algunas aplicaciones de IA, después de ser implementadas, automáticamente activan recursos en la nube en segundo plano: máquinas virtuales, instancias de bases de datos, entornos sandbox, todo el proceso sin intervención humana. La cantidad de recursos que un cliente activa automáticamente en un día equivale a lo que antes tomaba dos semanas de operación manual.

"Esto equivale a decir que los Agentes están usando la nube por sí mismos." Liu Weiguang proporcionó una relación de conversión calculada internamente: el consumo de Tokens se puede convertir proporcionalmente en el uso de GPU, y cada aumento en una GPU impulsa aproximadamente un aumento equivalente en CPU. Es decir, el crecimiento de los ingresos por Tokens no está erosionando los ingresos tradicionales de la nube, sino impulsándolos, siempre que la plataforma en la nube pueda manejar la carga de trabajo de los Agentes.

Por lo tanto, Alibaba Cloud no está añadiendo una capa de capacidad de IA al sistema existente, sino que está reescribiéndolo por completo, desde la forma de interacción y la lógica de planificación hasta el modelo de facturación y la forma de los productos.

El modelo no es para chatear

La tercera capa de la reestructuración completa de la pila es el modelo. Qwen3.7-Max ocupó el primer lugar nacional en la clasificación global de pruebas ciegas de Arena, superando a Kimi-K2.6, DeepSeek-v4-pro y GLM-5.1. El enfoque de esta presentación es la redefinición de la dirección de las capacidades del modelo por parte de Alibaba.

Zhou Jingren, responsable del modelo de lenguaje grande Tongyi de Alibaba, declaró: "En el pasado buscábamos que el modelo 'hablara bien'; ahora exigimos que el modelo 'pueda hacerlo'."

Tomando como referencia la práctica de Alibaba Cloud con chips, en el chip Zhenwu M890, con el que nunca tuvo contacto durante el entrenamiento, Qwen3.7-Max, basándose únicamente en una descripción de la tarea, trabajó de forma autónoma desde cero durante 35 horas, completando de manera independiente la escritura y optimización de un núcleo de computación de IA de nivel productivo. El rendimiento final fue 10 veces superior al de la versión oficial. Todo el proceso se llevó a cabo sin intervención humana ni orientación intermedia.

Esto demuestra la capacidad central del modelo en escenarios de Agentes: ejecución autónoma de largo alcance, recibiendo una tarea, descomponiéndola, planificándola, escribiendo código y depurándolo por sí mismo, trabajando de manera continua durante 35 horas sin parar.

Para soportar este nivel de demanda de inferencia, la plataforma Bailian también se actualizó correspondientemente: planificación unificada de pools para mejorar la utilización de GPU, caché de contexto para eliminar cálculos repetidos, y planificación elástica de rendimiento para enfrentar picos de concurrencia.

En cuanto al ecosistema, Bailian mantiene una integración abierta. Además de la matriz de modelos Qianwen, también incorporó modelos de terceros como Zhipu GLM-5.1, MiniMax M2.7 y MoonShot AI Kimi K2.6.

Liu Weiguang mencionó: "Los clientes en la práctica no usan solo un modelo, sino una combinación de varios. Nosotros proporcionamos las combinaciones, y los clientes encuentran la más adecuada para ellos en la plataforma". En el escenario de la cumbre, los altos ejecutivos de seis compañías líderes de modelos nacionales aparecieron juntos, creando una escena que evocaba una "alianza de IA nacional".

En los últimos tres meses, el modelo insignia Qianwen ha iterado de forma continua las versiones 3.5, 3.6 y 3.7. Este ritmo de lanzamiento en sí mismo transmite una señal: la competencia en capacidades de modelos está lejos de terminar, y Alibaba planea establecer una ventaja a largo plazo mediante la integración vertical de chips de diseño propio y modelos de diseño propio.

La verdadera apuesta de esta reestructuración

Mirando hacia atrás, la lógica subyacente de esta reestructuración completa de la pila por parte de Alibaba Cloud es simple y pura. Cuando el crecimiento de los ingresos por IA supera con creces el de los negocios tradicionales de nube, cuando los Tokens podrían reemplazar a las ECS como la mayor línea de productos, cuando los Agentes comienzan a activar automáticamente recursos en la nube sin necesidad de que un humano inicie sesión en la consola, todo el sistema tecnológico diseñado para personas llega a un punto en el que debe ser cambiado.

Pero la dificultad a nivel de ejecución es otra cosa. El propio Liu Weiguang admite que la transformación "es fácil de decir, pero muy difícil de hacer". En el pasado, el equipo de ventas trataba con los departamentos de TI de los clientes; ahora, para hacer MaaS, hay que dialogar con los departamentos de negocio o incluso con el CEO.

"Tu capacidad de diálogo y tu experiencia son requisitos de un nivel completamente diferente". Alibaba Cloud ya ha establecido vendedores especializados en MaaS para grandes clientes, separándolos de los vendedores tradicionales de IaaS, con evaluaciones y operaciones independientes.

Los indicadores de evaluación también están cambiando. Ya no solo se mira el volumen de llamadas, sino los "Tokens de alta calidad", aquellos que resuelven problemas reales, no los que charlan sin sustancia. Tres indicadores centrales: el crecimiento diario del número de clientes de pago, la cantidad de sistemas centrales de negocio que integran modelos, y la eficiencia con la que los Agentes completan de forma autónoma el ciclo de una tarea.

Estos ajustes a nivel organizativo y de mecanismos a menudo muestran el juicio real de una empresa mejor que los lanzamientos tecnológicos. Alibaba Cloud quiere reconstruir la estructura de ingresos, las relaciones con los clientes y el sistema de ventas. Liu Weiguang declaró: "Antes, cuando hacíamos nube, el presupuesto de TI del cliente era calculable, cuántos servidores había localmente, aproximadamente cuánto costaría migrarlos a la nube, podías ver el problema. Pero con MaaS, la respuesta a este problema la desconoces; una vez dentro, puede superar tus expectativas".

El problema ya no es visible, la respuesta tampoco es segura, pero Alibaba Cloud ha decidido desarmar y reescribir todo el sistema, porque lo único cierto es que la IA es una oportunidad diez o incluso cien veces mayor que cualquier otra anterior.

Esta es probablemente la información más destacable de esta cumbre: no cuánta potencia de cálculo tiene un chip en particular o en qué lugar se clasifica un modelo, sino que el mayor proveedor de nube de China está apostando, con una actitud radical cercana a la de una empresa emergente, por un futuro que está convencido que llegará. (Autor del artículo | Zhang Shuai, Editor | Yang Lin)

Preguntas relacionadas

Q¿Cuál es el objetivo principal de la reestructuración de Alibaba Cloud según el artículo?

AEl objetivo principal de la reestructuración de Alibaba Cloud es transformar su sistema, construido durante 17 años en torno al 'uso de la nube por personas', en un nuevo sistema basado en 'Agentes que consumen Tokens'. Esto implica rediseñar toda la pila tecnológica, desde los chips y la infraestructura en la nube hasta los modelos y las plataformas de inferencia, para adaptarse a la era de la IA y la computación impulsada por Agent.

Q¿Por qué Alibaba Cloud está enfatizando ahora su estrategia de chips, especialmente con la serie Zhenwu?

AAlibaba Cloud está enfatizando su estrategia de chips, particularmente con la serie Zhenwu (como el nuevo M890), porque considera que el control sobre el hardware es fundamental para ganar la guerra de costos en la era de la IA. El objetivo es que cada chip produzca más Tokens de alta calidad a un costo marginal menor que la competencia. Con más de 560,000 chips Zhenwu ya desplegados, buscan replicar la integración profunda que Google logra entre sus TPU y el modelo Gemini, optimizando el rendimiento y la relación costo-beneficio en toda su pila tecnológica.

Q¿Qué tres cambios principales está implementando Alibaba Cloud en su plataforma en la nube para adaptarse a las cargas de trabajo de los Agent?

APara adaptarse a las cargas de trabajo de los Agent, Alibaba Cloud está implementando tres cambios principales en su plataforma: 1) Convertir los productos en la nube en 'Skills' o interfaces estandarizadas que los Agent puedan invocar directamente (Skill化, MCP化, CLI化). 2) Construir un entorno de ejecución específico para Agent, con contenedores ligeros (sandboxes), capacidades de colaboración multi-Agent, memoria entre tareas y canales de flujo de datos. 3) Reconstruir la lógica de programación (scheduling), pasando de una 'programación de recursos' a una 'programación de tareas' para manejar la elasticidad impredecible y la vida útil breve de las cargas de trabajo de los Agent.

QSegún el artículo, ¿cómo ha evolucionado el enfoque de Alibaba Cloud respecto a sus modelos de IA, como Qwen3.7-Max?

AEl enfoque de Alibaba Cloud respecto a sus modelos de IA ha evolucionado de buscar que el modelo 'hable bien' (conversación) a exigir que el modelo 'pueda hacer' (ejecución de tasks). Un ejemplo destacado es Qwen3.7-Max, que, sin entrenamiento previo, trabajó de forma autónoma durante 35 horas para escribir y optimizar un kernel de computación de IA para el chip Zhenwu M890, logrando una mejora de rendimiento de 10x. Esto subraya la capacidad clave para escenarios de Agent: ejecución autónoma de larga duración, descomposición de tareas, planificación y codificación sin intervención humana.

Q¿Qué cambios organizativos y en los indicadores de desempeño reflejan la seriedad de la apuesta de Alibaba Cloud por la transformación hacia MaaS (Modelo como Servicio)?

ALos cambios organizativos y en los KPI que reflejan la seriedad de la apuesta de Alibaba Cloud incluyen: 1) Separar los equipos de ventas de MaaS de los de IaaS tradicional, con dedicación exclusiva para clientes grandes y evaluación independiente. 2) Cambiar los indicadores clave de desempeño: ya no solo se mide el volumen de llamadas a la API, sino el crecimiento diario de clientes pagos, el número de sistemas centrales de negocio que integran modelos y la eficiencia con la que los Agent completan ciclos de tareas de forma autónoma. Estos cambios muestran un rediseño profundo de la estructura de ingresos, las relaciones con los clientes y el sistema comercial para un futuro dominado por la IA.

Lecturas Relacionadas

Resumen Matutino | Michael Saylor publica información sobre Bitcoin Tracker; Aave publica investigación post-mortem del ataque al puente Kelp rsETH; Gravity Bridge anuncia suspensión de servicios tras sufrir un ataque

**Resumen de noticias de cripto (1 de junio):** **Regulación y adopción institucional:** * La empresa de activos digitales **Laser Digital** obtuvo aprobación preliminar de la OCC de EE. UU. para establecer un banco fiduciario regulado a nivel federal. * **Vietnam** propone permitir que las PYMEs utilicen activos digitales/virtuales como garantía para préstamos bancarios. * El presidente de la SFC de **Hong Kong** informó que el volumen de operaciones de las plataformas de activos virtuales con licencia se triplicó en el primer trimestre de 2026. **Incidentes de seguridad y investigaciones:** * El protocolo **Aave** publicó un análisis post-mortem del ataque al puente Kelp rsETH (LayerZero V2), atribuyéndolo a una infraestructura de puente de terceros. * El puente cross-chain **Gravity Bridge** (Cosmos) suspendió su servicio tras sufrir un ataque. **Noticias del mercado y Bitcoin:** * **Michael Saylor** publicó información sobre el "Bitcoin Tracker", lo que sugiere que MicroStrategy podría revelar pronto una nueva compra de BTC. * Un gobernador de la **Fed (Waller)** señaló que la adopción global de stablecoins podría amplificar el impacto de la política monetaria estadounidense. * **Santiment** advierte que el alto ratio largo/corto de BTC podría indicar una corrección a corto plazo, mientras que el sentimiento negativo en torno a ETH podría ser una señal alcista contraria. **Otros hechos relevantes:** * La **SEC de EE. UU.** demandó al fundador de Privvy por una presunta estafa con criptoactivos de 12.3 millones de dólares. * En **China**, un hombre fue condenado a más de 10 años de prisión por robar 107 BTC tras ayudar a un conocido a crear una billetera. * Se incluyen rankings de tokens Meme populares en las últimas 24h en ETH, Solana y Base.

链捕手Hace 18 min(s)

Resumen Matutino | Michael Saylor publica información sobre Bitcoin Tracker; Aave publica investigación post-mortem del ataque al puente Kelp rsETH; Gravity Bridge anuncia suspensión de servicios tras sufrir un ataque

链捕手Hace 18 min(s)

PA Gráficos | Un gráfico para entender los grandes eventos de Web3 que vale la pena seguir en junio

**Resumen: Eventos clave de Web3 en junio (2026)** El calendario cripto de junio presenta una mezcla de factores macroeconómicos, desbloqueos de tokens y eventos tecnológicos que darán forma al mercado: * **Factores Macro:** Los datos de inflación (IPC) y empleo (no agrícolas) de EE.UU., junto con las decisiones de tipos de interés de la Fed, el BCE y el Banco de Japón, seguirán influyendo en la aversión al riesgo y las expectativas de liquidez global. * **Desbloqueos de Tokens:** Proyectos como SUI y ENA tendrán eventos de desbloqueo, lo que requiere atención al posible impacto en el mercado. * **Dinámicas de Proyectos:** Nuevos productos institucionales llegarán, como los futuros de índices bursátiles perpetuos de Coinbase y los futuros de índices cripto de CME Group. También habrá inclusiones en índices tradicionales (SharpLink en Russell). * **Ajustes del Ecosistema:** Continúa el proceso de consolidación, con el cierre de algunos servicios como el explorador Ord.io de Bitcoin Ordinals. Los usuarios deben estar atentos a la migración de activos. * **Eventos Externos Destacados:** Eventos como el inicio del Mundial, la conferencia WWDC de Apple, la posible OPV de acciones de SpaceX y la audiencia para la IPO de宇树科技en China añaden contexto más amplio. En resumen, junio será un mes donde el mercado buscará una nueva dirección bajo la influencia de expectativas de liquidez, cambios políticos y la rotación dentro del ecosistema.

marsbitHace 1 hora(s)

PA Gráficos | Un gráfico para entender los grandes eventos de Web3 que vale la pena seguir en junio

marsbitHace 1 hora(s)

Alibaba "reabastece", ByteDance "entrena"

**Resumen en español europeo (≈1500 caracteres):** En la última semana de mayo, dos estrategias de IA chinas contrastaron claramente. Alibaba aceleró la **implementación comercial** de la IA. Integró su modelo Qwen con Taobao, permitiendo funciones como probadores virtuales y comparación de precios con IA. Su protocolo ACT busca estandarizar pagos automatizados por agentes de IA. Financieramente, apuesta por ser la "fábrica de IA" de China, con ingresos externos de su nube creciendo un 40%, demostrando un enfoque en **ROI inmediato y monetización**. Su premisa: una brecha de capacidad en modelos base no se ampliará críticamente en 5 años. ByteDance adopta una postura de **investigación a largo plazo**. Su departamento Seed, con líneas separadas para aplicaciones e investigación fundamental, tiene como meta principal "explorar el límite superior de la inteligencia". Su modelo de video Seedance 2.0 lidera benchmarks globales. Invierten masivamente en talento (programa Top Seed) y en investigación pura, como un artículo de 8 meses sobre modelos mundiales. Su presupuesto de capital se revisa al alza de forma agresiva, posible gracias a su condición de empresa **no cotizada**, lo que le otorga paciencia para perseguir avances fundamentales sin presión trimestral por beneficios. La diferencia clave no es filosófica, sino estructural. Las empresas cotizadas como Alibaba deben priorizar la monetización para el mercado. Las no cotizadas como ByteDance pueden permitirse "entrenar" a fondo. El futuro de la estrategia de IA en China depende en gran medida de este estado financiero.

marsbitHace 1 hora(s)

Alibaba "reabastece", ByteDance "entrena"

marsbitHace 1 hora(s)

¿Por qué más agentes de IA no equivalen a mayor productividad?

**Resumen: Por qué más agentes de IA no equivalen a mayor productividad** Cuando los agentes de IA se vuelven más baratos y fáciles de ejecutar, el desarrollo de software enfrenta un nuevo desafío: el cuello de botella ya no es lanzar más agentes, sino la capacidad humana de gestionar, evaluar e integrar sus resultados. Este artículo introduce el concepto de "impuesto de orquestación". Iniciar un agente es barato (un prompt o un clic), pero cerrar el ciclo es costoso: verificar resultados, entender su impacto arquitectónico, resolver conflictos entre agentes y decidir qué código integrar. Este trabajo no se puede paralelizar; depende de un recurso en serie: el juicio humano. El desarrollador es el "GIL" (Cerradura Global del Intérprete) del sistema de agentes: el candido de un solo hilo que limita el rendimiento final. Múltiples agentes pueden ejecutarse concurrentemente, pero las fases de juicio arquitectónico, revisión de código y fusión de cambios deben pasar por la mente del desarrollador. Más agentes no siempre significan más producción; pueden solo alargar la cola de tareas pendientes de revisión, llevando a cambios de contexto más frecuentes y fatiga cognitiva. La sensación de eficiencia no equivale a productividad real. Un panel lleno de agentes en ejecución crea una ilusión de "alta producción", pero si el desarrollador no comprende, revisa e integra esos cambios, el sistema puede acumular deuda técnica y cognitiva. La discusión clave no es "cómo usar más agentes", sino "cómo rediseñar el flujo de trabajo en torno a la atención humana". La habilidad crucial es saber qué tareas delegar a la máquina para procesamiento en paralelo y cuáles reservar para el juicio humano, cuándo revisar por lotes y cuándo detener la orquestación para concentrarse en un problema central. La IA amplía la capacidad de concurrencia en la producción de software, pero la atención humana sigue siendo el recurso más escaso e irreplicable. Un flujo de trabajo maduro con agentes no consiste en asignar todas las tareas a la máquina, sino en diseñar cuidadosamente la arquitectura de la propia atención, como se haría con cualquier sistema de producción. La verdadera habilidad es diseñar el sistema respetando ese recurso en serie que no se puede clonar: tu atención.

marsbitHace 3 hora(s)

¿Por qué más agentes de IA no equivalen a mayor productividad?

marsbitHace 3 hora(s)

Trading

Spot
Futuros
活动图片