"Je ne me soucie pas vraiment du nombre total de Tokens, ni du chiffre d'affaires total." Le 5 juin, lors de la conférence INSPIRE CREATORS 2026 de Huawei Cloud, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a accordé sa première interview aux médias depuis sa prise de fonction, exprimant clairement et distinctement l'actuel axe stratégique de Huawei Cloud.
Il s'agit d'une déclaration rare sur le marché chinois actuel du cloud IA.
Au cours des six derniers mois, des fournisseurs de cloud comme Alibaba Cloud et Volcano Engine n'ont cessé de mettre en avant le récit du cloud IA, utilisant le volume quotidien d'appels de Tokens et l'échelle des revenus MaaS comme nouveaux indicateurs de croissance. Même les principaux éditeurs de grands modèles, tels que Moon's Dark Side, DeepSeek, Zhipu, etc., ont continuellement réduit les prix de l'inférence. Le mot-clé de toute l'industrie était le volume d'appels de modèles et l'échelle.
Huawei Cloud a choisi d'entrer sur ce champ de bataille encombré d'une autre manière. Huawei Cloud a dévoilé en rafale sa série de nouvelles offres la plus dense depuis l'année dernière orientée vers l'IA : le cluster de calcul intelligent AICS Lingqu, le stockage mémoire AMS Agentic, le moteur d'orchestration unifié CCE Volcano Next, la plateforme de sécurité et d'autonomie AgentSphere, ainsi que ModelArts Next, la plateforme d'agents intelligents d'entreprise AgentArts (version open source openJiuwen), le tout regroupé sous le nouveau paradigme "Agentic Infra".
Le KPI que Zhou Yuefeng a défini pour Huawei Cloud n'est pas le nombre de Tokens, mais "si chaque Token améliore véritablement la productivité". Durant cette période de transition où l'offre de puissance de calcul localisée est limitée et où les modèles économiques sont encore en cours de remodelage, Huawei Cloud s'est extrait de la "course à la deuxième place sur le cloud IA".
Ne pas comparer l'échelle des Tokens
Lors de la rencontre, Zhou Yuefeng a rarement répondu directement aux différences avec Alibaba Cloud et Volcano Engine. Il a déclaré que Huawei Cloud était différent des autres fournisseurs de cloud pour trois raisons.
Premièrement, la voie de la puissance de calcul est différente. Huawei Cloud utilise une chaîne complète de matériels et logiciels de calcul entièrement locaux et autodéveloppés : Ascend, Kunpeng, CANN, Euler, etc. Cette voie est plus sinueuse car Huawei ne peut pas utiliser la puissance de calcul des autres ; il doit faire de la solution locale une réponse au niveau de l'industrie.
Par conséquent, Huawei Cloud doit construire un deuxième plan de calcul, offrant un autre choix d'écosystème en dehors de la voie dominante mondiale constituée par NVIDIA et les principaux clouds publics. Huawei Cloud ne peut pas, et ne prévoit pas, d'utiliser du matériel "multinational" pour rivaliser avec ses concurrents sur l'échelle de la puissance de calcul. Zhou Yuefeng a déclaré : "Je ne veux pas comparer les revenus, l'échelle ou le classement de la deuxième à la énième place avec d'autres entreprises de cloud, cela n'a pas de sens."
Deuxièmement, l'accent commercial est différent. Les fournisseurs de cloud d'origine Internet dépendent naturellement du trafic grand public et de l'écosystème des développeurs, tandis que Huawei Cloud concentre ses forces sur les secteurs public-entreprise et ceux liés à l'économie nationale et aux moyens de subsistance. Par exemple, le cloud hybride de Huawei occupe depuis plusieurs années la première part de marché dans les secteurs gouvernemental, financier et des entreprises d'État centrales, servant plus de 5500 clients dans le monde.
Zhou Yuefeng a indiqué que l'itération des modèles et de la puissance de calcul était si rapide qu'il était probable que les déploiements soient déjà obsolètes une fois terminés. Il recommande donc aux clients publics et aux entreprises de ne pas construire leurs propres clusters de dizaines de milliers de cartes, mais plutôt d'utiliser des données locales combinées à de la puissance de calcul IA/des services de modèles de cloud public distants, avec des technologies comme l'inférence confidentielle, l'entraînement confidentiel et le calcul confidentiel, afin d'établir un équilibre entre la souveraineté des données et le partage de la puissance de calcul. Essentiellement, il s'agit d'apporter les avantages de l'itération du cloud public aux clients qui ne peuvent pas entièrement migrer vers le cloud public.
Troisièmement, l'approche de l'écosystème est différente. Huawei Cloud pousse l'open source à un niveau assez radical : Ascend CANN, le système d'exploitation Euler, l'orchestrateur CCE Volcano, la chaîne d'outils ModelArts sont tous open source ; la version open source openJiuwen de la plateforme d'agents intelligents AgentArts partage plus de 90% de son noyau avec la version commerciale.
La conférence a également lancé conjointement avec plus de 20 principaux éditeurs de modèles, dont Zhipu, DeepSeek, MiniMax, Kimi, StepFun, Baidu, Meituan LongCat, iFlyTek Spark, le plan "Cent Modèles, Mille Formes, le Cloud Rassemble pour Gagner Ensemble".
Lorsque la puissance de calcul locale est encore limitée en capacités et en approvisionnement, élargir l'écosystème et offrir plus de choix de modèles est la seule façon d'ancrer solidement ce deuxième plan de calcul.
Agentic Infra : Déplacer le champ de bataille de la vente de Tokens vers la vente de productivité
Si la voie de la puissance de calcul détermine ce que Huawei Cloud "ne combat pas", Agentic Infra détermine ce qu'il "veut combattre".
Zhou Yuefeng a émis un jugement sur l'évolution de l'industrie de l'IA : il y a quatre ans, faire de l'IA c'était acheter des cartes de calcul ; il y a trois ans, c'était entraîner de grands modèles ; cette année, c'est utiliser des agents intelligents. La puissance de calcul et les modèles reculent à l'arrière-plan, les agents intelligents passent au premier plan.
Le point de compétition du cloud IA se déplace du débit de Tokens vers la capacité des agents intelligents à fonctionner réellement dans les entreprises.
La matrice produit de Huawei Cloud est également réorganisée selon ce constat. Le "pack de quatre" d'Agentic Infra - l'usine efficace de Tokens, l'apprentissage continu, l'orchestration unifiée calcul-intelligence, la sécurité et l'autonomie - répond chacun à un défi d'ingénierie incontournable lors du déploiement d'agents intelligents en entreprise.
AICS Lingqu réduit la latence des Tokens d'un cluster de 100 000 cartes à moins de 10 millisecondes ; AMS utilise un accès direct NPU-CMS pour un espace mémoire de l'ordre du pétaoctet, résolvant le goulot d'étranglement de la mémoire à long terme des Agents ; CCE Volcano Next améliore l'utilisation des ressources de plus de 30% grâce au partage de pool entraînement-inférence ; AgentSphere réalise un démarrage de l'ordre de 100 millisecondes et une création par lots de l'ordre de centaines de milliers par minute avec des sandbox légères.
ModelArts Next, quant à lui, reconfigure l'approche MaaS. Son routage de modèles prend en charge trois stratégies : priorité coût, priorité efficacité, équilibre. Il intègre déjà plus de 15 modèles SOTA, avec une précision de planification supérieure à 95% et un coût d'appel réduit en moyenne de 20%.
Mais le vrai pari différenciateur de Huawei Cloud, ce sont les zones sectorielles. Lors de cette conférence, Huawei Cloud a lancé simultanément quatre "Usines à Rêves IA Sectorielles" : Santé Intelligente, Intelligence Incarnée, Fabrication Intelligente et Calcul Scientifique.
La zone Santé Intelligente, construite conjointement avec l'hôpital Ruijin de Shanghai autour du grand modèle RuiPath, a vu plus de 20 hôpitaux de différents niveaux (hôpitaux de comté, villes-préfectures, hôpitaux de classe A de troisième niveau) s'installer massivement, notamment à Handan, Ruian, Qianxinan, Wu'an, etc. Cela signifie que des capacités hautement dépendantes de l'expertise, comme le diagnostic pathologique, sont pour la première fois délivrées sous forme de "service cloud" à grande échelle aux hôpitaux de comté.
La zone Intelligence Incarnée a lancé la première plateforme de développement d'intelligence incarnée de bout en bout au monde, CloudRobo, avec pour objectif de répondre aux besoins d'outillage de toute la chaîne des plus de 300 startups chinoises dans l'intelligence incarnée.
Zhou Yuefeng a déclaré que la santé et la finance étaient les secteurs les plus matures numériquement et les plus riches en données en Chine. "Si même l'IA dans ces secteurs ne décolle pas, ce sera encore plus difficile pour les autres secteurs." Dans ces domaines, l'échelle pour mesurer la valeur de l'IA ne devrait pas être les utilisateurs actifs quotidiens ou le nombre de Tokens, mais plutôt la proportion de prévention des risques financiers, l'amélioration de l'efficacité du crédit, ou la probabilité pour les patients éloignés d'obtenir un diagnostic précis.
En reliant ces indices, le contour stratégique de Huawei Cloud devient clair : utiliser une base de puissance de calcul entièrement locale + écosystème open source comme fondation, couvrir le secteur public-entreprise avec le cloud hybride + le calcul confidentiel, et déplacer la compétition de la "vente de Tokens" vers la "vente de productivité" avec Agentic Infra + les zones sectorielles.
Cette voie est beaucoup plus lente que la poursuite des revenus MaaS et plus difficile à illustrer avec de belles données de croissance annuelle, mais elle contourne l'océan rouge des prix actuellement le plus féroce sur le cloud IA. Elle mise sur un marché encore non tarifé : qui occupera la position d'infrastructure fondamentale lorsque les agents intelligents pénétreront véritablement l'industrie.
Sur cette piste du cloud IA, Huawei Cloud ne peut qu'utiliser une autre solution. Zhou Yuefeng a résumé : "Je ne peux pas construire une terre noire silicium multinationale." Alors que d'autres fournisseurs de cloud comparent le rapport qualité-prix de leurs Tokens, Huawei Cloud se bat pour que ce système de calcul local puisse répondre aux véritables besoins futurs de l'IA industrielle chinoise. (Auteur | Zhang Shuai, Éditeur | Yang Lin)








