Alibaba Cloud peut-il se réinventer ?

marsbitPublié le 2026-05-20Dernière mise à jour le 2026-05-20

Résumé

Ces cinq derniers mois, les revenus MaaS d'Alibaba Cloud ont été multipliés par 15, reflétant une transformation profonde. Lors d'un sommet, le géant du cloud a annoncé avoir achevé la mise à niveau de sa pile complète "puce - cloud - modèle - inférence" vers une architecture Agent, avec le lancement d'un nouveau portail IA "QianWen Cloud", de serveurs utilisant sa puce AI auto-développée Zhenwu M890 et de son dernier modèle phare Qwen3.7-Max. L'objectif est de passer d'un système conçu pour "l'humain utilisant le cloud" à un écosystème où "l'Agent consomme des Tokens". La puce, notamment la nouvelle Zhenwu M890, est vue comme le point de départ d'une bataille sur le coût marginal du Token. Parallèlement, la plateforme cloud elle-même est réécrite pour répondre aux besoins des Agents : interfaces standardisées, environnement d'exécution dédié (sandbox) et nouvelle logique d'orchestration des tâches. Concernant les modèles, l'accent est mis sur leur capacité à "faire" plutôt qu'à simplement "bien parler". Qwen3.7-Max a démontré une capacité d'exécution autonome de longue durée. La plateforme d'inférence "Bailian" a été améliorée pour soutenir ces charges et intègre également des modèles tiers. Cette refonte totale, techniquement et organisationnellement complexe, vise à saisir une opportunité perçue comme dix à cent fois plus grande que les précédentes. Alibaba Cloud reconstruit sa structure de revenus, ses relations clients et son système commercial autour du paradigme de ...

Au cours des cinq derniers mois, les revenus MaaS d'Alibaba Cloud ont été multipliés par 15. Ce n'est qu'un aspect de la refonte d'Alibaba Cloud. Lors de son sommet, Alibaba Cloud a annoncé avoir achevé la modernisation en « agent » de sa pile complète « puce - cloud - modèle - inférence », et a simultanément lancé un nouveau site web de produits AI "Qianwen Cloud", des serveurs à nœud ultra haute densité équipés de sa puce AI auto-développée Zhenwu M890, ainsi que son dernier modèle phare, Qwen3.7-Max.

Pour reprendre les mots de Liu Weiguang, vice-président principal d'Alibaba Cloud : "Nous sommes en train de construire la plus grande usine d'IA de Chine." La métaphore de l'usine évoque une logique de production complète : les puces sont la matière première, le cloud est l'atelier, les modèles sont les machines, la plateforme d'inférence est la chaîne de montage, et la marchandise finale est le Token.

L'essence de cette refonte est de transformer le système entier, construit au cours des 17 dernières années autour de "l'utilisation du cloud par l'homme", en un nouveau système conçu pour la "consommation de Tokens par les Agents".

Pourquoi jouer la carte de la puce maintenant ?

Alibaba Cloud a rarement mis en avant ses puces en public par le passé. Lors de ce sommet, non seulement la nouvelle puce AI d'entraînement et d'inférence Zhenwu M890 a été présentée, mais une feuille de route pour les deux prochaines années a été exceptionnellement dévoilée, avec les deux générations de produits Zhenwu V900 et Zhenwu J900 à venir.

Le Zhenwu M890 est doté de 144 Go de mémoire, d'une bande passante d'interconnexion inter-puces de 800 Go/s, et ses performances sont trois fois supérieures à celles de la génération précédente, le Zhenwu 810E. Associé à la puce d'interconnexion ICN Switch développée en interne, 128 puces AI peuvent former une seule machine, avec une latence P2P inférieure à 150 nanosecondes.

Mais au-delà des spécifications, l'information clé est celle de l'échelle : la série Zhenwu a déjà expédié 560 000 puces cumulées, et a pénétré plus de 400 clients dans plus de 20 secteurs, notamment les télécoms, FAW, et la Banque de Développement de Pudong.

Liu Weiguang utilise à plusieurs reprises Google comme analogie. L'intégration profonde entre le TPU de Google et Gemini a permis à Google d'obtenir le meilleur rapport coût-performance dans son propre framework. Alibaba Cloud souhaite bien sûr emprunter le même chemin. Il résume la logique concurrentielle en une phrase : "Si l'avenir se joue sur le fait de générer plus de Tokens de haute qualité que les concurrents sur chaque puce, alors nous gagnerons."

Avec en plus le CPU Yitian, la carte réseau intelligente Panmai, le contrôleur de stockage Zhenyue, la carte des puces de T-Head s'est étendue d'un point unique à une couverture complète du calcul, du réseau et du stockage. Lorsque la demande d'inférence explose de façon exponentielle, ce n'est qu'en gardant le contrôle des puces qu'on peut maîtriser le coût marginal de chaque Token.

Le raisonnement n'est pas compliqué. Les entreprises de modèles peuvent rivaliser sur les paramètres, mais les fournisseurs de cloud finiront par comparer qui produit des Tokens moins chers, plus stables et plus rapides. La puce est le point de départ de cette guerre des coûts.

Le cloud lui-même doit aussi être réécrit

Les puces résolvent le problème de "l'exécution", mais les besoins d'un Agent en matière de cloud vont bien au-delà de la puissance de calcul.

La logique d'interaction des produits cloud traditionnels est conçue pour les humains : ouvrir la console, regarder les menus, configurer les paramètres, cliquer sur les boutons. Tout cela est totalement inutilisable pour un Agent. Un Agent ne regarde pas de pages web, ne clique pas sur des boutons. Il a besoin d'une description structurée des capacités, de protocoles d'appel standardisés et de retours prévisibles.

Li Feifei, CTO d'Alibaba Cloud, utilise une comparaison pour illustrer le problème : la charge de travail du cloud traditionnel est stable, une instance ECS peut tourner pendant des mois, voire des années ; mais la charge de travail d'un Agent est caractérisée par une "élasticité erratique, un cycle de vie court, une montée en puissance instantanée puis une disparition". Une fois qu'un Agent a exécuté sa tâche, le bac à sable est détruit. La prochaine demande peut arriver dans quelques millisecondes, ou seulement quelques heures plus tard.

Pour répondre à cela, Alibaba Cloud a fait trois choses.

Premièrement, transformer les produits cloud en "Skills", en MCP et en CLI. En clair, il s'agit d'encapsuler chaque produit cloud dans une interface standardisée qu'un Agent peut appeler directement, comme s'il appelait une fonction.

Deuxièmement, construire un environnement d'exécution dédié pour les Agents : bac à sable léger, collaboration multi-agents, mémoire inter-tâches, voie de circulation des données.

Troisièmement, reconstruire la logique d'ordonnancement, passant de "l'ordonnancement des ressources" à "l'ordonnancement des tâches", car lorsque des masses d'Agents fonctionnent simultanément en concurrence, les méthodes traditionnelles d'orchestration des ressources ne tiennent pas.

Liu Weiguang indique que certaines applications AI, une fois déployées, ouvrent automatiquement des ressources cloud en arrière-plan (machines virtuelles, instances de bases de données, environnements bac à sable) sans aucune intervention humaine. Le volume de ressources ouvertes automatiquement en une journée pour un client équivaut à deux semaines d'opérations manuelles.

"Cela revient à dire que les Agents utilisent eux-mêmes le cloud." Liu Weiguang donne une relation de conversion issue d'un calcul interne : la consommation de Tokens peut être convertie proportionnellement en utilisation GPU, et chaque augmentation de la capacité GPU entraîne à peu près une augmentation équivalente de la capacité CPU. Autrement dit, la croissance des revenus liés aux Tokens ne ronge pas les revenus cloud traditionnels, mais les tire vers le haut, à condition que la plateforme cloud soit capable de supporter la charge de travail des Agents.

Par conséquent, Alibaba Cloud ne se contente pas d'ajouter une couche d'IA au système existant, mais réécrit entièrement les modes d'interaction, la logique d'ordonnancement, le modèle de facturation et la forme des produits.

Le modèle n'est pas fait pour discuter

La troisième couche de la refonte complète est le modèle. Qwen3.7-Max a atteint la première place nationale dans le classement général de l'Arena Global Blind Test, dépassant Kimi-K2.6, DeepSeek-v4-pro et GLM-5.1. L'accent de cette version est la redéfinition par Alibaba de l'orientation des capacités des modèles.

Zhou Jingren, responsable du modèle Tongyi d'Alibaba, déclare : "Par le passé, nous cherchions un modèle qui 'parle bien'. Maintenant, nous exigeons un modèle qui 'fasse des choses'."

Prenant l'exemple des pratiques d'Alibaba Cloud sur les puces, sur la puce Zhenwu M890 qu'il n'avait jamais rencontrée pendant l'entraînement, Qwen3.7-Max, uniquement avec une description de tâche, a travaillé de manière autonome pendant 35 heures, écrivant et optimisant de zéro un noyau de calcul AI de niveau production. Les performances finales ont été améliorées d'un facteur 10 par rapport à la version officielle, sans intervention humaine ni guidance intermédiaire tout au long du processus.

Cela illustre la capacité centrale du modèle dans un scénario Agent : l'exécution autonome de longue durée, prenant une tâche, la décomposant, la planifiant, écrivant le code, le déboguant, travaillant continuellement pendant 35 heures sans s'arrêter.

Pour supporter ce niveau de demande d'inférence, la plateforme Bailian a également été mise à niveau : ordonnancement en pool partagé pour améliorer l'utilisation du GPU, cache de contexte pour éliminer les calculs répétés, ordonnancement élastique du débit pour faire face aux pics de concurrence.

Sur l'écosystème, Bailian maintient une ouverture d'accès, proposant en plus de la matrice de modèles Qianwen, des modèles tiers tels que GLM-5.1 de Zhipu AI, M2.7 de MiniMax, et Kimi K2.6 de Moonshot AI.

Liu Weiguang mentionne : "Dans l'usage réel, les clients n'utilisent pas qu'un seul modèle, mais une combinaison de plusieurs modèles. Nous fournissons les combinaisons, les clients trouvent sur la plateforme celle qui leur convient le mieux." Sur scène lors du sommet, les dirigeants de six entreprises de modèles leaders en Chine se sont rassemblés, créant une ambiance évoquant une "alliance AI nationale".

Au cours des trois derniers mois, le modèle phare Qianwen a été mis à jour de manière continue avec trois versions : 3.5, 3.6, et 3.7. Ce rythme de publication envoie un signal : la course aux capacités des modèles est loin d'être terminée, et Alibaba compte utiliser l'intégration verticale puces auto-développées + modèles auto-développés pour établir un avantage à long terme.

Le véritable enjeu de cette refonte

En y regardant de plus près, la logique sous-jacente de cette refonte complète d'Alibaba Cloud est simple et pure : lorsque la croissance des revenus de l'IA dépasse largement celle des activités cloud traditionnelles, lorsque les Tokens ont le potentiel de remplacer les ECS en tant que plus grande gamme de produits, lorsque les Agents commencent à ouvrir automatiquement des ressources cloud sans que les humains aient besoin de se connecter à la console, alors l'ensemble du système technique conçu pour l'homme atteint un point où il doit absolument être modifié.

Mais la difficulté au niveau de l'exécution est une autre affaire. Liu Weiguang lui-même admet que la transformation est "facile à dire, mais très difficile à faire". Auparavant, les équipes commerciales traitaient avec les services informatiques des clients. Maintenant, pour faire du MaaS, elles doivent dialoguer avec les services opérationnels, voire avec les PDG.

"Votre capacité de dialogue, votre expérience, exigent un tout autre niveau." Alibaba Cloud a déjà mis en place des commerciaux MaaS dédiés pour ses grands clients, séparés des commerciaux IaaS traditionnels, avec des évaluations distinctes et des opérations indépendantes.

Les indicateurs de performance changent également. On ne regarde plus seulement le volume d'appels, mais les "Tokens de haute qualité", ceux qui résolvent des problèmes concrets, pas ceux de bavardages. Trois indicateurs clés : la croissance quotidienne du nombre de clients payants, le nombre de systèmes métiers centraux intégrant des modèles, et l'efficacité avec laquelle les Agents accomplissent de manière autonome des tâches en boucle fermée.

Ces ajustements organisationnels et de mécanismes révèlent souvent plus que les annonces techniques le jugement réel d'une entreprise. Alibaba Cloud veut reconstruire sa structure de revenus, ses relations clients et son système commercial. Liu Weiguang déclare : "Avant, quand nous faisions du cloud, le budget informatique du client était calculable : tant de serveurs sur site, un prix approximatif pour les migrer, on pouvait voir le sujet. Mais avec le MaaS, la réponse à ce sujet, vous ne la connaissez pas. Une fois à l'intérieur, cela peut dépasser votre imagination."

Le sujet n'est plus visible, la réponse est incertaine, mais Alibaba Cloud a décidé de démonter et de réécrire l'ensemble du système, car la seule certitude est que l'IA représente une opportunité dix, voire cent fois plus grande que toutes les précédentes.

C'est probablement l'information la plus notable de ce sommet : pas tant quelle puce offre plus de puissance, ou quel modèle est classé où, mais le fait que le plus grand fournisseur de cloud de Chine adopte une posture aussi radicale, proche de celle d'une start-up, pour parier sur un avenir qu'il est convaincu de voir arriver. (Auteur de cet article | Zhang Shuai, Éditeur | Yang Lin)

Questions liées

QPourquoi Alibaba Cloud a-t-il soudainement mis l'accent sur ses puces lors de ce sommet, après en avoir peu parlé publiquement auparavant ?

AParce que la demande d'inférence augmente de façon exponentielle. Pour contrôler le coût marginal de chaque Token et gagner la guerre des coûts à long terme, il est essentiel de maîtriser la technologie des puces. Alibaba Cloud souhaite suivre la voie de Google, où la puce TPU et le modèle Gemini sont étroitement liés, afin d'obtenir le meilleur rapport prix/performance dans son propre framework.

QQuels sont les trois changements majeurs apportés par Alibaba Cloud à sa plateforme cloud pour l'adapter aux besoins des Agents IA ?

A1. Transformer les produits cloud en "Skills", MCP et CLI, les encapsulant dans des interfaces standardisées que les Agents peuvent appeler directement. 2. Construire un environnement d'exécution dédié aux Agents : sandbox légers, collaboration multi-Agents, mémoire inter-tâches, canaux de circulation des données. 3. Reconstruire la logique d'orchestration, passant de l'"orchestration des ressources" à l'"orchestration des tâches" pour supporter la concurrence massive d'Agents.

QComment la définition des capacités du modèle Qwen3.7-Max a-t-elle changé, et quel exemple concret le démontre ?

AL'accent est passé de la recherche d'un modèle qui "parle bien" à un modèle qui "peut accomplir des tâches". Un exemple concret : sur la nouvelle puce Zhenwu M890, qu'il n'avait jamais rencontrée pendant l'entraînement, Qwen3.7-Max a travaillé de manière autonome pendant 35 heures en suivant uniquement une description de tâche. Il a écrit et optimisé un noyau de calcul IA de niveau production, améliorant les performances d'un facteur 10 par rapport à la version officielle, sans intervention humaine.

QQuels sont les nouveaux indicateurs clés de performance (KPI) pour l'équipe commerciale de MaaS chez Alibaba Cloud, remplaçant les anciennes mesures ?

ALes nouveaux KPI ne se concentrent plus uniquement sur le volume d'appels, mais sur les "Tokens de haute qualité" - ceux qui résolvent des problèmes pratiques. Les trois indicateurs principaux sont : la croissance quotidienne du nombre de clients payants, le nombre de systèmes métiers centraux intégrant des modèles, et l'efficacité avec laquelle les Agents accomplissent de manière autonome des tâches en boucle fermée.

QQuelle est la logique fondamentale derrière la reconstruction complète de la pile technologique par Alibaba Cloud, et quel est le véritable enjeu ?

ALa logique fondamentale est que l'ancien système conçu pour "l'utilisation du cloud par l'homme" doit être transformé en un nouveau système pour la "consommation de Tokens par les Agents". Le véritable enjeu est de parier sur un avenir que l'entreprise est convaincue de voir arriver : l'IA représentant une opportunité dix à cent fois plus grande que par le passé. Cela nécessite de reconstruire non seulement la technologie, mais aussi la structure des revenus, les relations clients et le système commercial.

Lectures associées

Suite au piratage de Coldcard, l’une des plus grandes violations de portefeuilles Bitcoin récentes, une nouvelle vague de pertes a commencé ! Les pertes augmentent

La société Galaxy Research a signalé une troisième vague d'attaques visant les portefeuilles Bitcoin générés sur les appareils Coldcard, portant le total des pertes à environ 1367 BTC (88,6 millions de dollars). Cette dernière vague a dérobé 207,7 BTC supplémentaires. Alors que les deux premières vagues présentaient des similitudes (fonds envoyés vers quelques adresses communes, ciblage de portefeuilles spécifiques), la troisième vague diffère significativement : utilisation d'une adresse de destination unique par victime, ciblage d'un type d'adresse Bitcoin différent (P2WSH) et agrégation de multiples adresses victimes par transaction. Ces différences suggèrent soit un même attaquant ayant modifié ses méthodes, soit l'émergence d'un second acteur malveillant exploitant la même vulnérabilité rendue publique. Les fonds volés, principalement issus de portefeuilles individuels détenant moins de 1 BTC, n'ont pas encore été déplacés depuis les adresses des pirates. La vulnérabilité logicielle à l'origine de ces attaques date de mars 2021, et tous les Bitcoins volés ont été créés après cette date.

cryptonews.ruIl y a 38 mins

Suite au piratage de Coldcard, l’une des plus grandes violations de portefeuilles Bitcoin récentes, une nouvelle vague de pertes a commencé ! Les pertes augmentent

cryptonews.ruIl y a 38 mins

Trump Media vend 2 628 BTC supplémentaires, ses avoirs tombent à 4 261 BTC

Trump Media & Technology Group, la société derrière Truth Social, a procédé à une nouvelle vente majeure de ses réserves de Bitcoin. Selon l'analyse de Lookonchain basée sur les données d'Arkham, la société a vendu 2 628 BTC pour environ 165 millions de dollars via des transferts vers Crypto.com. Ceci porte ses ventes totales sur les sept derniers mois à 7 281 BTC, pour une valeur d'environ 545 millions de dollars, réduisant ainsi ses avoirs de 63%. Ses réserves restantes s'élèvent désormais à 4 261 BTC, évalués à 269,8 millions de dollars. Ces transactions interviennent dans un contexte de surveillance accrue des activités cryptos liées à l'ancien président Donald Trump, notamment dans le cadre du débat législatif entourant le CLARITY Act, qui vise à renforcer les règles éthiques concernant la possession d'actifs numériques par les personnalités publiques.

cointelegraphIl y a 58 mins

Trump Media vend 2 628 BTC supplémentaires, ses avoirs tombent à 4 261 BTC

cointelegraphIl y a 58 mins

Fujian Jinjiang, un super-licorne de stockage dans l'ombre

Voici un résumé de l'article en français : Au cœur de la ville de Jinjiang, Fujian, connue pour ses chaussures de sport, se cache Fujian Jinhua Integrated Circuit Co., un acteur majeur mais discret dans le domaine de la mémoire DRAM. Fondée en 2016 avec une mission nationale de briser le monopole de Samsung, SK Hynix et Micron, l'entreprise a connu un départ prometteur grâce à un partenariat technologique avec United Microelectronics Corporation (UMC) de Taïwan et la direction de Chen Zhengkun, ancien cadre de Micron. Cependant, son développement a été brutalement interrompu en 2018 lorsque les États-Unis l'ont placée sur la liste des entités et ont engagé des poursuites pénales pour espionnage économique, alléguant le vol de secrets commerciaux de Micron. Cette sanction a gelé sa chaîne d'approvisionnement et paralysé sa production pendant près de cinq ans. Malgré un verdict d'innocence rendu par un tribunal américain en février 2024, Jinhua reste sous sanction. Pendant cette période difficile, soutenue par les autorités provinciales et locales, l'entreprise a travaillé à reconstruire sa ligne de production en réduisant sa dépendance aux technologies américaines. Elle se concentre désormais sur le marché des DRAM de niche (pour téléviseurs intelligents, routeurs, etc.) avec une capacité mensuelle d'environ 40 000 plaquettes. Bien que ses performances (chiffre d'affaires annuel d'environ 2 milliards de yuans) soient loin derrière celles de ses homologues chinois ChangXin Memory Technologies (CXMT) et Yangtze Memory Technologies Corp (YMTC), Jinhua a survécu et maintient sa position. L'histoire de Jinhua s'inscrit également dans la transformation audacieuse de Jinjiang, une ville dont l'économie reposait traditionnellement sur le textile et l'agroalimentaire, vers l'industrie des semi-conducteurs. Cet investissement massif, symbolisant la ténacité de la ville, a donné naissance à un cluster intégré de la filière des puces. Alors que l'industrie mondiale de la mémoire entre dans un super-cycle porté par l'IA, Jinhua, bien que modeste en taille, représente la résilience d'une entreprise ayant résisté à une intense pression géopolitique.

marsbitIl y a 1 h

Fujian Jinjiang, un super-licorne de stockage dans l'ombre

marsbitIl y a 1 h

Face à un déficit de 38 GW d'électricité, pourquoi les fermes de minage de bitcoin sont-elles devenues soudain une nouvelle porte d'entrée pour la puissance de calcul de l'IA ?

Face à une pénurie électrique projetée de 38 GW aux États-Unis d'ici 2026-2028, d'anciennes fermes de minage de Bitcoin se transforment rapidement en centres de données pour l'IA. Ces entreprises, comme TeraWulf ou Riot Platforms, évoluent du « minage » vers la fourniture d'infrastructures clés en main (« Powered Shell Provider »). Elles offrent aux géants du cloud un accès accéléré à des ressources critiques : terrains, raccordements au réseau électrique approuvés, sous-stations et bâtiments. La valeur réside dans leur capacité à fournir des centaines de mégawatts de capacité de calcul plusieurs années plus tôt que les nouveaux projets, comblant ainsi une partie du déficit électrique futur. Morgan Stanley estime que cette conversion pourrait contribuer 10 à 19 GW. Cette transition interroge : s'agit-il d'une réévaluation durable des infrastructures ou d'un récit financier amplifié par la ferveur autour de l'IA ?

华尔街日报Il y a 1 h

Face à un déficit de 38 GW d'électricité, pourquoi les fermes de minage de bitcoin sont-elles devenues soudain une nouvelle porte d'entrée pour la puissance de calcul de l'IA ?

华尔街日报Il y a 1 h

Michael Saylor : « Nous n'avons jamais dit que nous ne vendrions jamais de bitcoins »

Michael Saylor, président du comité stratégique, a déclaré que son entreprise n'a jamais pris l'engagement de ne jamais vendre ses bitcoins, mais s'attend à rester un acheteur net de bitcoins à long terme. Cette déclaration fait suite à des informations selon lesquelles la société aurait obtenu une nouvelle autorisation de vente de bitcoins pour une valeur allant jusqu'à 5 milliards de dollars. Saylor a précisé que cette autorisation n'était pas nouvelle et avait été annoncée le 29 juin dans le cadre du système de gestion de trésorerie de l'entreprise. Il a qualifié ces rapports de "vieilles nouvelles présentées comme nouvelles", soulignant que l'autorisation permet des ventes pour des objectifs spécifiques mais n'oblige pas l'entreprise à vendre. Aucune nouvelle autorisation n'ayant été annoncée, la société prévoit de rester un acheteur net de bitcoins. Saylor a également noté que le programme de monétisation de bitcoin de l'entreprise n'exige pas la vente de ses actifs en BTC et que l'entreprise n'a jamais officiellement adopté une politique de "vente interdite du BTC".

cryptonews.ruIl y a 2 h

Michael Saylor : « Nous n'avons jamais dit que nous ne vendrions jamais de bitcoins »

cryptonews.ruIl y a 2 h

Trading

Spot

Alibaba Cloud peut-il se réinventer ?

Résumé

Pourquoi jouer la carte de la puce maintenant ?

Le cloud lui-même doit aussi être réécrit

Le modèle n'est pas fait pour discuter

Le véritable enjeu de cette refonte

Questions liées

Lectures associées

Suite au piratage de Coldcard, l’une des plus grandes violations de portefeuilles Bitcoin récentes, une nouvelle vague de pertes a commencé ! Les pertes augmentent

Trump Media vend 2 628 BTC supplémentaires, ses avoirs tombent à 4 261 BTC

Fujian Jinjiang, un super-licorne de stockage dans l'ombre

Face à un déficit de 38 GW d'électricité, pourquoi les fermes de minage de bitcoin sont-elles devenues soudain une nouvelle porte d'entrée pour la puissance de calcul de l'IA ?

Michael Saylor : « Nous n'avons jamais dit que nous ne vendrions jamais de bitcoins »

Trading

Catégories populaires

Tags tendances