Alibaba Cloud peut-il se réinventer ?

marsbitPublié le 2026-05-20Dernière mise à jour le 2026-05-20

Résumé

Ces cinq derniers mois, les revenus MaaS d'Alibaba Cloud ont été multipliés par 15, reflétant une transformation profonde. Lors d'un sommet, le géant du cloud a annoncé avoir achevé la mise à niveau de sa pile complète "puce - cloud - modèle - inférence" vers une architecture Agent, avec le lancement d'un nouveau portail IA "QianWen Cloud", de serveurs utilisant sa puce AI auto-développée Zhenwu M890 et de son dernier modèle phare Qwen3.7-Max. L'objectif est de passer d'un système conçu pour "l'humain utilisant le cloud" à un écosystème où "l'Agent consomme des Tokens". La puce, notamment la nouvelle Zhenwu M890, est vue comme le point de départ d'une bataille sur le coût marginal du Token. Parallèlement, la plateforme cloud elle-même est réécrite pour répondre aux besoins des Agents : interfaces standardisées, environnement d'exécution dédié (sandbox) et nouvelle logique d'orchestration des tâches. Concernant les modèles, l'accent est mis sur leur capacité à "faire" plutôt qu'à simplement "bien parler". Qwen3.7-Max a démontré une capacité d'exécution autonome de longue durée. La plateforme d'inférence "Bailian" a été améliorée pour soutenir ces charges et intègre également des modèles tiers. Cette refonte totale, techniquement et organisationnellement complexe, vise à saisir une opportunité perçue comme dix à cent fois plus grande que les précédentes. Alibaba Cloud reconstruit sa structure de revenus, ses relations clients et son système commercial autour du paradigme de ...

Au cours des cinq derniers mois, les revenus MaaS d'Alibaba Cloud ont été multipliés par 15. Ce n'est qu'un aspect de la refonte d'Alibaba Cloud. Lors de son sommet, Alibaba Cloud a annoncé avoir achevé la modernisation en « agent » de sa pile complète « puce - cloud - modèle - inférence », et a simultanément lancé un nouveau site web de produits AI "Qianwen Cloud", des serveurs à nœud ultra haute densité équipés de sa puce AI auto-développée Zhenwu M890, ainsi que son dernier modèle phare, Qwen3.7-Max.

Pour reprendre les mots de Liu Weiguang, vice-président principal d'Alibaba Cloud : "Nous sommes en train de construire la plus grande usine d'IA de Chine." La métaphore de l'usine évoque une logique de production complète : les puces sont la matière première, le cloud est l'atelier, les modèles sont les machines, la plateforme d'inférence est la chaîne de montage, et la marchandise finale est le Token.

L'essence de cette refonte est de transformer le système entier, construit au cours des 17 dernières années autour de "l'utilisation du cloud par l'homme", en un nouveau système conçu pour la "consommation de Tokens par les Agents".

Pourquoi jouer la carte de la puce maintenant ?

Alibaba Cloud a rarement mis en avant ses puces en public par le passé. Lors de ce sommet, non seulement la nouvelle puce AI d'entraînement et d'inférence Zhenwu M890 a été présentée, mais une feuille de route pour les deux prochaines années a été exceptionnellement dévoilée, avec les deux générations de produits Zhenwu V900 et Zhenwu J900 à venir.

Le Zhenwu M890 est doté de 144 Go de mémoire, d'une bande passante d'interconnexion inter-puces de 800 Go/s, et ses performances sont trois fois supérieures à celles de la génération précédente, le Zhenwu 810E. Associé à la puce d'interconnexion ICN Switch développée en interne, 128 puces AI peuvent former une seule machine, avec une latence P2P inférieure à 150 nanosecondes.

Mais au-delà des spécifications, l'information clé est celle de l'échelle : la série Zhenwu a déjà expédié 560 000 puces cumulées, et a pénétré plus de 400 clients dans plus de 20 secteurs, notamment les télécoms, FAW, et la Banque de Développement de Pudong.

Liu Weiguang utilise à plusieurs reprises Google comme analogie. L'intégration profonde entre le TPU de Google et Gemini a permis à Google d'obtenir le meilleur rapport coût-performance dans son propre framework. Alibaba Cloud souhaite bien sûr emprunter le même chemin. Il résume la logique concurrentielle en une phrase : "Si l'avenir se joue sur le fait de générer plus de Tokens de haute qualité que les concurrents sur chaque puce, alors nous gagnerons."

Avec en plus le CPU Yitian, la carte réseau intelligente Panmai, le contrôleur de stockage Zhenyue, la carte des puces de T-Head s'est étendue d'un point unique à une couverture complète du calcul, du réseau et du stockage. Lorsque la demande d'inférence explose de façon exponentielle, ce n'est qu'en gardant le contrôle des puces qu'on peut maîtriser le coût marginal de chaque Token.

Le raisonnement n'est pas compliqué. Les entreprises de modèles peuvent rivaliser sur les paramètres, mais les fournisseurs de cloud finiront par comparer qui produit des Tokens moins chers, plus stables et plus rapides. La puce est le point de départ de cette guerre des coûts.

Le cloud lui-même doit aussi être réécrit

Les puces résolvent le problème de "l'exécution", mais les besoins d'un Agent en matière de cloud vont bien au-delà de la puissance de calcul.

La logique d'interaction des produits cloud traditionnels est conçue pour les humains : ouvrir la console, regarder les menus, configurer les paramètres, cliquer sur les boutons. Tout cela est totalement inutilisable pour un Agent. Un Agent ne regarde pas de pages web, ne clique pas sur des boutons. Il a besoin d'une description structurée des capacités, de protocoles d'appel standardisés et de retours prévisibles.

Li Feifei, CTO d'Alibaba Cloud, utilise une comparaison pour illustrer le problème : la charge de travail du cloud traditionnel est stable, une instance ECS peut tourner pendant des mois, voire des années ; mais la charge de travail d'un Agent est caractérisée par une "élasticité erratique, un cycle de vie court, une montée en puissance instantanée puis une disparition". Une fois qu'un Agent a exécuté sa tâche, le bac à sable est détruit. La prochaine demande peut arriver dans quelques millisecondes, ou seulement quelques heures plus tard.

Pour répondre à cela, Alibaba Cloud a fait trois choses.

Premièrement, transformer les produits cloud en "Skills", en MCP et en CLI. En clair, il s'agit d'encapsuler chaque produit cloud dans une interface standardisée qu'un Agent peut appeler directement, comme s'il appelait une fonction.

Deuxièmement, construire un environnement d'exécution dédié pour les Agents : bac à sable léger, collaboration multi-agents, mémoire inter-tâches, voie de circulation des données.

Troisièmement, reconstruire la logique d'ordonnancement, passant de "l'ordonnancement des ressources" à "l'ordonnancement des tâches", car lorsque des masses d'Agents fonctionnent simultanément en concurrence, les méthodes traditionnelles d'orchestration des ressources ne tiennent pas.

Liu Weiguang indique que certaines applications AI, une fois déployées, ouvrent automatiquement des ressources cloud en arrière-plan (machines virtuelles, instances de bases de données, environnements bac à sable) sans aucune intervention humaine. Le volume de ressources ouvertes automatiquement en une journée pour un client équivaut à deux semaines d'opérations manuelles.

"Cela revient à dire que les Agents utilisent eux-mêmes le cloud." Liu Weiguang donne une relation de conversion issue d'un calcul interne : la consommation de Tokens peut être convertie proportionnellement en utilisation GPU, et chaque augmentation de la capacité GPU entraîne à peu près une augmentation équivalente de la capacité CPU. Autrement dit, la croissance des revenus liés aux Tokens ne ronge pas les revenus cloud traditionnels, mais les tire vers le haut, à condition que la plateforme cloud soit capable de supporter la charge de travail des Agents.

Par conséquent, Alibaba Cloud ne se contente pas d'ajouter une couche d'IA au système existant, mais réécrit entièrement les modes d'interaction, la logique d'ordonnancement, le modèle de facturation et la forme des produits.

Le modèle n'est pas fait pour discuter

La troisième couche de la refonte complète est le modèle. Qwen3.7-Max a atteint la première place nationale dans le classement général de l'Arena Global Blind Test, dépassant Kimi-K2.6, DeepSeek-v4-pro et GLM-5.1. L'accent de cette version est la redéfinition par Alibaba de l'orientation des capacités des modèles.

Zhou Jingren, responsable du modèle Tongyi d'Alibaba, déclare : "Par le passé, nous cherchions un modèle qui 'parle bien'. Maintenant, nous exigeons un modèle qui 'fasse des choses'."

Prenant l'exemple des pratiques d'Alibaba Cloud sur les puces, sur la puce Zhenwu M890 qu'il n'avait jamais rencontrée pendant l'entraînement, Qwen3.7-Max, uniquement avec une description de tâche, a travaillé de manière autonome pendant 35 heures, écrivant et optimisant de zéro un noyau de calcul AI de niveau production. Les performances finales ont été améliorées d'un facteur 10 par rapport à la version officielle, sans intervention humaine ni guidance intermédiaire tout au long du processus.

Cela illustre la capacité centrale du modèle dans un scénario Agent : l'exécution autonome de longue durée, prenant une tâche, la décomposant, la planifiant, écrivant le code, le déboguant, travaillant continuellement pendant 35 heures sans s'arrêter.

Pour supporter ce niveau de demande d'inférence, la plateforme Bailian a également été mise à niveau : ordonnancement en pool partagé pour améliorer l'utilisation du GPU, cache de contexte pour éliminer les calculs répétés, ordonnancement élastique du débit pour faire face aux pics de concurrence.

Sur l'écosystème, Bailian maintient une ouverture d'accès, proposant en plus de la matrice de modèles Qianwen, des modèles tiers tels que GLM-5.1 de Zhipu AI, M2.7 de MiniMax, et Kimi K2.6 de Moonshot AI.

Liu Weiguang mentionne : "Dans l'usage réel, les clients n'utilisent pas qu'un seul modèle, mais une combinaison de plusieurs modèles. Nous fournissons les combinaisons, les clients trouvent sur la plateforme celle qui leur convient le mieux." Sur scène lors du sommet, les dirigeants de six entreprises de modèles leaders en Chine se sont rassemblés, créant une ambiance évoquant une "alliance AI nationale".

Au cours des trois derniers mois, le modèle phare Qianwen a été mis à jour de manière continue avec trois versions : 3.5, 3.6, et 3.7. Ce rythme de publication envoie un signal : la course aux capacités des modèles est loin d'être terminée, et Alibaba compte utiliser l'intégration verticale puces auto-développées + modèles auto-développés pour établir un avantage à long terme.

Le véritable enjeu de cette refonte

En y regardant de plus près, la logique sous-jacente de cette refonte complète d'Alibaba Cloud est simple et pure : lorsque la croissance des revenus de l'IA dépasse largement celle des activités cloud traditionnelles, lorsque les Tokens ont le potentiel de remplacer les ECS en tant que plus grande gamme de produits, lorsque les Agents commencent à ouvrir automatiquement des ressources cloud sans que les humains aient besoin de se connecter à la console, alors l'ensemble du système technique conçu pour l'homme atteint un point où il doit absolument être modifié.

Mais la difficulté au niveau de l'exécution est une autre affaire. Liu Weiguang lui-même admet que la transformation est "facile à dire, mais très difficile à faire". Auparavant, les équipes commerciales traitaient avec les services informatiques des clients. Maintenant, pour faire du MaaS, elles doivent dialoguer avec les services opérationnels, voire avec les PDG.

"Votre capacité de dialogue, votre expérience, exigent un tout autre niveau." Alibaba Cloud a déjà mis en place des commerciaux MaaS dédiés pour ses grands clients, séparés des commerciaux IaaS traditionnels, avec des évaluations distinctes et des opérations indépendantes.

Les indicateurs de performance changent également. On ne regarde plus seulement le volume d'appels, mais les "Tokens de haute qualité", ceux qui résolvent des problèmes concrets, pas ceux de bavardages. Trois indicateurs clés : la croissance quotidienne du nombre de clients payants, le nombre de systèmes métiers centraux intégrant des modèles, et l'efficacité avec laquelle les Agents accomplissent de manière autonome des tâches en boucle fermée.

Ces ajustements organisationnels et de mécanismes révèlent souvent plus que les annonces techniques le jugement réel d'une entreprise. Alibaba Cloud veut reconstruire sa structure de revenus, ses relations clients et son système commercial. Liu Weiguang déclare : "Avant, quand nous faisions du cloud, le budget informatique du client était calculable : tant de serveurs sur site, un prix approximatif pour les migrer, on pouvait voir le sujet. Mais avec le MaaS, la réponse à ce sujet, vous ne la connaissez pas. Une fois à l'intérieur, cela peut dépasser votre imagination."

Le sujet n'est plus visible, la réponse est incertaine, mais Alibaba Cloud a décidé de démonter et de réécrire l'ensemble du système, car la seule certitude est que l'IA représente une opportunité dix, voire cent fois plus grande que toutes les précédentes.

C'est probablement l'information la plus notable de ce sommet : pas tant quelle puce offre plus de puissance, ou quel modèle est classé où, mais le fait que le plus grand fournisseur de cloud de Chine adopte une posture aussi radicale, proche de celle d'une start-up, pour parier sur un avenir qu'il est convaincu de voir arriver. (Auteur de cet article | Zhang Shuai, Éditeur | Yang Lin)

Questions liées

QPourquoi Alibaba Cloud a-t-il soudainement mis l'accent sur ses puces lors de ce sommet, après en avoir peu parlé publiquement auparavant ?

AParce que la demande d'inférence augmente de façon exponentielle. Pour contrôler le coût marginal de chaque Token et gagner la guerre des coûts à long terme, il est essentiel de maîtriser la technologie des puces. Alibaba Cloud souhaite suivre la voie de Google, où la puce TPU et le modèle Gemini sont étroitement liés, afin d'obtenir le meilleur rapport prix/performance dans son propre framework.

QQuels sont les trois changements majeurs apportés par Alibaba Cloud à sa plateforme cloud pour l'adapter aux besoins des Agents IA ?

A1. Transformer les produits cloud en "Skills", MCP et CLI, les encapsulant dans des interfaces standardisées que les Agents peuvent appeler directement. 2. Construire un environnement d'exécution dédié aux Agents : sandbox légers, collaboration multi-Agents, mémoire inter-tâches, canaux de circulation des données. 3. Reconstruire la logique d'orchestration, passant de l'"orchestration des ressources" à l'"orchestration des tâches" pour supporter la concurrence massive d'Agents.

QComment la définition des capacités du modèle Qwen3.7-Max a-t-elle changé, et quel exemple concret le démontre ?

AL'accent est passé de la recherche d'un modèle qui "parle bien" à un modèle qui "peut accomplir des tâches". Un exemple concret : sur la nouvelle puce Zhenwu M890, qu'il n'avait jamais rencontrée pendant l'entraînement, Qwen3.7-Max a travaillé de manière autonome pendant 35 heures en suivant uniquement une description de tâche. Il a écrit et optimisé un noyau de calcul IA de niveau production, améliorant les performances d'un facteur 10 par rapport à la version officielle, sans intervention humaine.

QQuels sont les nouveaux indicateurs clés de performance (KPI) pour l'équipe commerciale de MaaS chez Alibaba Cloud, remplaçant les anciennes mesures ?

ALes nouveaux KPI ne se concentrent plus uniquement sur le volume d'appels, mais sur les "Tokens de haute qualité" - ceux qui résolvent des problèmes pratiques. Les trois indicateurs principaux sont : la croissance quotidienne du nombre de clients payants, le nombre de systèmes métiers centraux intégrant des modèles, et l'efficacité avec laquelle les Agents accomplissent de manière autonome des tâches en boucle fermée.

QQuelle est la logique fondamentale derrière la reconstruction complète de la pile technologique par Alibaba Cloud, et quel est le véritable enjeu ?

ALa logique fondamentale est que l'ancien système conçu pour "l'utilisation du cloud par l'homme" doit être transformé en un nouveau système pour la "consommation de Tokens par les Agents". Le véritable enjeu est de parier sur un avenir que l'entreprise est convaincue de voir arriver : l'IA représentant une opportunité dix à cent fois plus grande que par le passé. Cela nécessite de reconstruire non seulement la technologie, mais aussi la structure des revenus, les relations clients et le système commercial.

Lectures associées

Apprendre Codex grâce au « Briefing Matinal » : Six niveaux d'utilisation reproductibles

Apprendre à utiliser Codex à travers le « briefing matinal » : six niveaux de complexité progressifs. Au lieu de démarrer par des concepts techniques abstraits, cette méthode propose de commencer par un scénario familier : la préparation de sa journée. L'idée est de transformer progressivement Codex d'un simple outil de questions-réponses en un assistant de travail intégré. **Niveau 1 : Consultation basique.** Connectez Codex à Slack, Gmail et Calendar, et demandez-lui un résumé de vos priorités du jour. **Niveau 2 : Personnalisation via un fichier agents.** Définissez des règles par défaut (format, préférences) pour standardiser et améliorer la qualité des briefings. **Niveau 3 : Automatisation périodique.** Configurez le briefing pour qu'il se génère automatiquement chaque matin, créant un fil de discussion évolutif que vous pouvez affiner. **Niveau 4 : Briefings par projet.** Créez des fils dédiés à différents projets (lancement, recrutement, etc.), chacun fournissant une vue contextuelle pertinente. **Niveau 5 : Assistance proactive.** Codex ébauche des réponses Slack, des notes de réunion ou identifie des décisions en attente, préparant le terrain pour votre action. **Niveau 6 : Système de mémoire (vault).** Les informations importantes sont sauvegardées dans une base de connaissances structurée (tâches, personnes, projets), permettant aux briefings futurs d'être plus intelligents et contextuels. Cette progression permet d'appréhender des fonctionnalités avancées (connecteurs, automatisation, agents, mémoire persistante) par petites étapes, ancrées dans un besoin concret, transformant finalement le simple briefing en un véritable système d'organisation du travail.

marsbitIl y a 32 mins

Apprendre Codex grâce au « Briefing Matinal » : Six niveaux d'utilisation reproductibles

marsbitIl y a 32 mins

À la veille d’une vague d’IPO technologiques, Polymarket s’associe au Nasdaq pour s’emparer du «droit de détermination de la valorisation»

La ruée vers les introductions en bourse (IPO) technologiques s'intensifie, et Polymarket s'associe au Nasdaq pour tenter de s'imposer comme arbitre de la valorisation des entreprises privées. Alors que des géants comme SpaceX, OpenAI et Anthropic préparent des entrées en bourse historiques, leur valorisation reste opaque pour le grand public, réservée aux investisseurs institutionnels. Pour saisir cette opportunité, Polymarket a lancé le 19 mai des contrats de prédiction sur la valorisation future de ces entreprises pré-IPO, en partenariat exclusif avec Nasdaq Private Market (NPM). NPM fournira les données de valorisation issues des transactions secondaires d'actions salariales pour le règlement des contrats, tandis que les courbes de probabilité générées par les parieurs de Polymarket seront reversées aux clients institutionnels de NPM. Cette manœuvre intervient alors que Polymarket, pénalisé par des problèmes réglementaires par le passé, est désormais distancé par son concurrent Kalshi sur le marché américain. Le partenariat avec NPM représente une stratégie clé pour reprendre l'initiative. Polymarket renforce ainsi son modèle commercial qui consiste à vendre ses données de marché prédictif à des institutions, comme il le fait déjà via des accords avec ICE et Dow Jones. L'enjeu est de contrôler la narration et l'évaluation du marché privé en plein essor. Cette collaboration exclusive avec une source de données majeure comme NPM pourrait donner un avantage difficile à rattraper pour Kalshi dans la course pour devenir la référence en matière de valorisation pré-IPO.

marsbitIl y a 1 h

À la veille d’une vague d’IPO technologiques, Polymarket s’associe au Nasdaq pour s’emparer du «droit de détermination de la valorisation»

marsbitIl y a 1 h

Arrêtez de cliquer les yeux fermés, Ethereum veut vous aider à comprendre ce que vous signez

Le monde de la blockchain prône l’autocustodie des actifs, mais une question cruciale persiste : si les utilisateurs ne comprennent pas ce qu’ils signent, cette maîtrise est-elle réelle ? L’« Ethereum Foundation » a annoncé le lancement du « Clear Signing », une initiative visant à remplacer le « blind signing » (signature aveugle) par une expérience de signature de transaction lisible par l’être humain. Auparavant, signer une transaction signifiait souvent approuver une série incompréhensible de code hexadécimal. Le Clear Signing, via la norme ERC-7730, propose une solution plus fondamentale. Il permet aux protocoles de fournir des métadonnées structurées (des « dictionnaires de traduction ») qui décrivent sémantiquement leurs fonctions de contrat. Les portefeuilles peuvent alors consulter ces métadonnées dans un registre public et traduire les données techniques (calldata) en une explication claire pour l'utilisateur, comme : « Échangez 1 000 USDC contre au moins 0,42 WETH sur Uniswap V3 ». Cette approche ne remplace pas les outils existants comme les simulateurs de transaction, mais les complète en clarifiant *l'intention* de la transaction. Le déploiement est progressif : plusieurs protocoles majeurs (Uniswap, Aave, etc.) ont déjà soumis leurs descripteurs, et des portefeuilles comme Ledger l'ont intégré. Cependant, son efficacité repose sur l'adoption par les protocoles, la vigilance des portefeuilles pour vérifier les métadonnées, et des mécanismes de confiance pour le registre. Le Clear Signing représente une avancée essentielle pour réduire la barrière d'entrée technique de la blockchain. Il ne s'agit pas de rendre les utilisateurs experts en code, mais de leur redonner un droit fondamental : comprendre, dans un langage clair, ce à quoi ils consentent lorsqu'ils signent une transaction. C'est une étape nécessaire vers une adoption de masse véritablement responsable et accessible.

marsbitIl y a 1 h

Arrêtez de cliquer les yeux fermés, Ethereum veut vous aider à comprendre ce que vous signez

marsbitIl y a 1 h

Ceux qui se sont rués sur le marché secondaire privé de SpaceX, perdus face à la plus grande vague d'enrichissement de l'histoire

L'article raconte l'histoire contrastée d'investisseurs dans SpaceX avant son introduction en bourse (IPO). D'un côté, des fonds comme Darsana Capital réalisent des profits historiques, leur investissement de 2019 valant désormais des milliards. De l'autre, de nombreux particuliers se retrouvent piégés dans un marché secondaire privé opaque et complexe. Poussés par la "FOMO" (peur de rater l'opportunité) autour de l'IA et des géants tech non cotés comme SpaceX, les investisseurs se ruent vers des véhicules d'investissement (SPV) qui promettent un accès à ces actions. Ce marché a explosé, atteignant des milliers de milliards de dollars de transactions. Le problème réside dans la structure en "poupées russes" de ces SPV, parfois empilés sur 5 niveaux. Chaque couche ajoute des frais et opacifie la traçabilité réelle des actions SpaceX sous-jacentes. Des escroqueries apparaissent, et même les investisseurs de bonne foi, comme l'entrepreneur Tejpaul Bhatia, ne peuvent pas vérifier la validité de leurs titres. Les entreprises concernées (OpenAI, Anthropic, SpaceX via son droit de préemption) réagissent en déclarant invalides les cessions non autorisées, pour contrôler leur nombre d'actionnaires et protéger leurs informations sensibles. Pour les investisseurs des SPV, l'introduction en bourse de SpaceX le 12 juin sera le moment de vérité : le registre actionnaire public révélera si leurs parts sont légitimes ou sans valeur. En résumé, le marché secondaire privé, gonflé par l'argent cherchant à investir dans l'IA, est devenu une loterie risquée où les investisseurs achètent sans certitude des "boîtes mystères" dont le contenu ne sera révélé qu'au jour de l'IPO.

marsbitIl y a 1 h

Ceux qui se sont rués sur le marché secondaire privé de SpaceX, perdus face à la plus grande vague d'enrichissement de l'histoire

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片