Huawei Cloud ne fait pas de guerre des prix sur les Tokens, Zhou Yuefeng veut changer la façon de gagner dans le cloud AI

marsbitPublié le 2026-06-06Dernière mise à jour le 2026-06-06

Résumé

"Je ne me soucie pas vraiment du nombre total de tokens, ni du chiffre d'affaires total." Lors de la conférence INSPIRE 2026 de Huawei Cloud, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a clairement défini la priorité stratégique actuelle : se concentrer sur l'amélioration de la productivité réelle derrière chaque token, plutôt que de participer à la guerre des prix sur le marché chinois du cloud IA. Contrairement aux concurrents comme Alibaba Cloud et Volcano Engine qui mettent en avant le volume d'appels de tokens et les revenus MaaS, Huawei Cloud adopte une approche différente basée sur trois piliers. Premièrement, une voie de calcul entièrement autonome et localisée (ascendante, Kunpeng), construisant un "deuxième plan de calcul" indépendant de l'écosystème NVIDIA. Deuxièmement, une focalisation commerciale sur les entreprises publiques et les secteurs clés (gouvernement, finance) via son cloud hybride, en proposant un modèle équilibrant souveraineté des données et partage de la puissance de calcul. Troisièmement, une stratégie open source agressive pour son écosystème logiciel. Le cœur de sa nouvelle offre est le paradigme "Agentic Infra", qui déplace la concurrence de la vente de tokens vers la vente de capacités productives pour les agents IA. Huawei Cloud a lancé une série de nouveaux produits (AICS, AMS, CCE Volcano Next, AgentSphere, ModelArts Next, AgentArts/openJiuwen) conçus pour résoudre les défis techniques du déploiement des agents en entr...

"Je ne me soucie pas vraiment du nombre total de Tokens, ni du chiffre d'affaires total." Le 5 juin, lors de la conférence INSPIRE CREATORS 2026 de Huawei Cloud, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a accordé sa première interview aux médias depuis sa prise de fonction, exprimant clairement et distinctement l'actuel axe stratégique de Huawei Cloud.

Il s'agit d'une déclaration rare sur le marché chinois actuel du cloud IA.

Au cours des six derniers mois, des fournisseurs de cloud comme Alibaba Cloud et Volcano Engine n'ont cessé de mettre en avant le récit du cloud IA, utilisant le volume quotidien d'appels de Tokens et l'échelle des revenus MaaS comme nouveaux indicateurs de croissance. Même les principaux éditeurs de grands modèles, tels que Moon's Dark Side, DeepSeek, Zhipu, etc., ont continuellement réduit les prix de l'inférence. Le mot-clé de toute l'industrie était le volume d'appels de modèles et l'échelle.

Huawei Cloud a choisi d'entrer sur ce champ de bataille encombré d'une autre manière. Huawei Cloud a dévoilé en rafale sa série de nouvelles offres la plus dense depuis l'année dernière orientée vers l'IA : le cluster de calcul intelligent AICS Lingqu, le stockage mémoire AMS Agentic, le moteur d'orchestration unifié CCE Volcano Next, la plateforme de sécurité et d'autonomie AgentSphere, ainsi que ModelArts Next, la plateforme d'agents intelligents d'entreprise AgentArts (version open source openJiuwen), le tout regroupé sous le nouveau paradigme "Agentic Infra".

Le KPI que Zhou Yuefeng a défini pour Huawei Cloud n'est pas le nombre de Tokens, mais "si chaque Token améliore véritablement la productivité". Durant cette période de transition où l'offre de puissance de calcul localisée est limitée et où les modèles économiques sont encore en cours de remodelage, Huawei Cloud s'est extrait de la "course à la deuxième place sur le cloud IA".

Ne pas comparer l'échelle des Tokens

Lors de la rencontre, Zhou Yuefeng a rarement répondu directement aux différences avec Alibaba Cloud et Volcano Engine. Il a déclaré que Huawei Cloud était différent des autres fournisseurs de cloud pour trois raisons.

Premièrement, la voie de la puissance de calcul est différente. Huawei Cloud utilise une chaîne complète de matériels et logiciels de calcul entièrement locaux et autodéveloppés : Ascend, Kunpeng, CANN, Euler, etc. Cette voie est plus sinueuse car Huawei ne peut pas utiliser la puissance de calcul des autres ; il doit faire de la solution locale une réponse au niveau de l'industrie.

Par conséquent, Huawei Cloud doit construire un deuxième plan de calcul, offrant un autre choix d'écosystème en dehors de la voie dominante mondiale constituée par NVIDIA et les principaux clouds publics. Huawei Cloud ne peut pas, et ne prévoit pas, d'utiliser du matériel "multinational" pour rivaliser avec ses concurrents sur l'échelle de la puissance de calcul. Zhou Yuefeng a déclaré : "Je ne veux pas comparer les revenus, l'échelle ou le classement de la deuxième à la énième place avec d'autres entreprises de cloud, cela n'a pas de sens."

Deuxièmement, l'accent commercial est différent. Les fournisseurs de cloud d'origine Internet dépendent naturellement du trafic grand public et de l'écosystème des développeurs, tandis que Huawei Cloud concentre ses forces sur les secteurs public-entreprise et ceux liés à l'économie nationale et aux moyens de subsistance. Par exemple, le cloud hybride de Huawei occupe depuis plusieurs années la première part de marché dans les secteurs gouvernemental, financier et des entreprises d'État centrales, servant plus de 5500 clients dans le monde.

Zhou Yuefeng a indiqué que l'itération des modèles et de la puissance de calcul était si rapide qu'il était probable que les déploiements soient déjà obsolètes une fois terminés. Il recommande donc aux clients publics et aux entreprises de ne pas construire leurs propres clusters de dizaines de milliers de cartes, mais plutôt d'utiliser des données locales combinées à de la puissance de calcul IA/des services de modèles de cloud public distants, avec des technologies comme l'inférence confidentielle, l'entraînement confidentiel et le calcul confidentiel, afin d'établir un équilibre entre la souveraineté des données et le partage de la puissance de calcul. Essentiellement, il s'agit d'apporter les avantages de l'itération du cloud public aux clients qui ne peuvent pas entièrement migrer vers le cloud public.

Troisièmement, l'approche de l'écosystème est différente. Huawei Cloud pousse l'open source à un niveau assez radical : Ascend CANN, le système d'exploitation Euler, l'orchestrateur CCE Volcano, la chaîne d'outils ModelArts sont tous open source ; la version open source openJiuwen de la plateforme d'agents intelligents AgentArts partage plus de 90% de son noyau avec la version commerciale.

La conférence a également lancé conjointement avec plus de 20 principaux éditeurs de modèles, dont Zhipu, DeepSeek, MiniMax, Kimi, StepFun, Baidu, Meituan LongCat, iFlyTek Spark, le plan "Cent Modèles, Mille Formes, le Cloud Rassemble pour Gagner Ensemble".

Lorsque la puissance de calcul locale est encore limitée en capacités et en approvisionnement, élargir l'écosystème et offrir plus de choix de modèles est la seule façon d'ancrer solidement ce deuxième plan de calcul.

Agentic Infra : Déplacer le champ de bataille de la vente de Tokens vers la vente de productivité

Si la voie de la puissance de calcul détermine ce que Huawei Cloud "ne combat pas", Agentic Infra détermine ce qu'il "veut combattre".

Zhou Yuefeng a émis un jugement sur l'évolution de l'industrie de l'IA : il y a quatre ans, faire de l'IA c'était acheter des cartes de calcul ; il y a trois ans, c'était entraîner de grands modèles ; cette année, c'est utiliser des agents intelligents. La puissance de calcul et les modèles reculent à l'arrière-plan, les agents intelligents passent au premier plan.

Le point de compétition du cloud IA se déplace du débit de Tokens vers la capacité des agents intelligents à fonctionner réellement dans les entreprises.

La matrice produit de Huawei Cloud est également réorganisée selon ce constat. Le "pack de quatre" d'Agentic Infra - l'usine efficace de Tokens, l'apprentissage continu, l'orchestration unifiée calcul-intelligence, la sécurité et l'autonomie - répond chacun à un défi d'ingénierie incontournable lors du déploiement d'agents intelligents en entreprise.

AICS Lingqu réduit la latence des Tokens d'un cluster de 100 000 cartes à moins de 10 millisecondes ; AMS utilise un accès direct NPU-CMS pour un espace mémoire de l'ordre du pétaoctet, résolvant le goulot d'étranglement de la mémoire à long terme des Agents ; CCE Volcano Next améliore l'utilisation des ressources de plus de 30% grâce au partage de pool entraînement-inférence ; AgentSphere réalise un démarrage de l'ordre de 100 millisecondes et une création par lots de l'ordre de centaines de milliers par minute avec des sandbox légères.

ModelArts Next, quant à lui, reconfigure l'approche MaaS. Son routage de modèles prend en charge trois stratégies : priorité coût, priorité efficacité, équilibre. Il intègre déjà plus de 15 modèles SOTA, avec une précision de planification supérieure à 95% et un coût d'appel réduit en moyenne de 20%.

Mais le vrai pari différenciateur de Huawei Cloud, ce sont les zones sectorielles. Lors de cette conférence, Huawei Cloud a lancé simultanément quatre "Usines à Rêves IA Sectorielles" : Santé Intelligente, Intelligence Incarnée, Fabrication Intelligente et Calcul Scientifique.

La zone Santé Intelligente, construite conjointement avec l'hôpital Ruijin de Shanghai autour du grand modèle RuiPath, a vu plus de 20 hôpitaux de différents niveaux (hôpitaux de comté, villes-préfectures, hôpitaux de classe A de troisième niveau) s'installer massivement, notamment à Handan, Ruian, Qianxinan, Wu'an, etc. Cela signifie que des capacités hautement dépendantes de l'expertise, comme le diagnostic pathologique, sont pour la première fois délivrées sous forme de "service cloud" à grande échelle aux hôpitaux de comté.

La zone Intelligence Incarnée a lancé la première plateforme de développement d'intelligence incarnée de bout en bout au monde, CloudRobo, avec pour objectif de répondre aux besoins d'outillage de toute la chaîne des plus de 300 startups chinoises dans l'intelligence incarnée.

Zhou Yuefeng a déclaré que la santé et la finance étaient les secteurs les plus matures numériquement et les plus riches en données en Chine. "Si même l'IA dans ces secteurs ne décolle pas, ce sera encore plus difficile pour les autres secteurs." Dans ces domaines, l'échelle pour mesurer la valeur de l'IA ne devrait pas être les utilisateurs actifs quotidiens ou le nombre de Tokens, mais plutôt la proportion de prévention des risques financiers, l'amélioration de l'efficacité du crédit, ou la probabilité pour les patients éloignés d'obtenir un diagnostic précis.

En reliant ces indices, le contour stratégique de Huawei Cloud devient clair : utiliser une base de puissance de calcul entièrement locale + écosystème open source comme fondation, couvrir le secteur public-entreprise avec le cloud hybride + le calcul confidentiel, et déplacer la compétition de la "vente de Tokens" vers la "vente de productivité" avec Agentic Infra + les zones sectorielles.

Cette voie est beaucoup plus lente que la poursuite des revenus MaaS et plus difficile à illustrer avec de belles données de croissance annuelle, mais elle contourne l'océan rouge des prix actuellement le plus féroce sur le cloud IA. Elle mise sur un marché encore non tarifé : qui occupera la position d'infrastructure fondamentale lorsque les agents intelligents pénétreront véritablement l'industrie.

Sur cette piste du cloud IA, Huawei Cloud ne peut qu'utiliser une autre solution. Zhou Yuefeng a résumé : "Je ne peux pas construire une terre noire silicium multinationale." Alors que d'autres fournisseurs de cloud comparent le rapport qualité-prix de leurs Tokens, Huawei Cloud se bat pour que ce système de calcul local puisse répondre aux véritables besoins futurs de l'IA industrielle chinoise. (Auteur | Zhang Shuai, Éditeur | Yang Lin)

Cryptos en tendance

Questions liées

QQuels sont les trois principaux points que Zhou Yuefeng, PDG de Huawei Cloud, a mentionnés comme différenciant Huawei Cloud des autres fournisseurs de cloud comme Alibaba Cloud et Volcano Engine ?

AZhou Yuefeng a souligné trois différences principales : 1) La voie de calcul différente, utilisant entièrement du matériel et des logiciels de calcul produits localement comme Ascend et Kunpeng. 2) L'accent commercial différent, se concentrant sur les entreprises publiques et les secteurs clés plutôt que sur l'écosystème grand public et les développeurs. 3) Une approche différente de l'écosystème, avec un engagement fort envers l'open source pour construire un deuxième plan de calcul viable.

QQue signifie le nouveau paradigme "Agentic Infra" proposé par Huawei Cloud, et quels sont ses quatre composants clés ?

A"Agentic Infra" est un nouveau paradigme stratégique de Huawei Cloud qui déplace l'accent de la vente de Tokens vers la vente de gains de productivité grâce aux agents IA. Ses quatre composants clés sont : 1) Une usine à Tokens efficace (AICS Lingqu). 2) Un apprentissage continu (AMS Agentic Memory Storage). 3) Une orchestration unifiée calcul/intelligence (CCE Volcano Next). 4) Une base d'exécution autonome sécurisée (AgentSphere).

QPourquoi Huawei Cloud ne participe-t-il pas à la guerre des prix des Tokens sur le marché du cloud IA chinois selon l'article ?

ASelon l'article, Huawei Cloud évite la guerre des prix sur les Tokens parce que sa stratégie n'est pas axée sur le volume ou les revenus des Tokens. Au lieu de cela, l'entreprise se concentre sur la valeur réelle créée par chaque Token, c'est-à-dire l'amélioration de la productivité. De plus, son utilisation exclusive de matériel de calcul produit localement l'empêche de rivaliser directement sur l'échelle et le prix du calcul "classique" (comme NVIDIA).

QQuels sont les "Ateliers IA pour l'industrie" (行业AI梦工厂) annoncés par Huawei Cloud lors de la conférence INSPIRE 2026, et quel est leur objectif ?

AHuawei Cloud a lancé quatre "Ateliers IA pour l'industrie" : Santé intelligente, Intelligence incarnée (Embodied AI), Fabrication intelligente et Calcul scientifique. Leur objectif est de fournir des solutions et des plateformes spécialisées pour permettre le déploiement profond de l'IA dans des secteurs spécifiques. Par exemple, l'atelier Santé intelligente, développé avec l'hôpital Ruijin de Shanghai, vise à démocratiser l'expertise médicale de haut niveau (comme le diagnostic pathologique) vers les hôpitaux des comtés via le cloud.

QComment Huawei Cloud compte-t-il servir les clients des secteurs public et des entreprises d'État qui ont des restrictions concernant le cloud public, selon les propos de Zhou Yuefeng ?

APour servir les clients du secteur public et des entreprises d'État qui ne peuvent pas entièrement migrer vers le cloud public, Zhou Yuefeng propose un modèle hybride. Il recommande de combiner des données locales avec la puissance de calcul IA et les services de modèles du cloud public distant. Cette approche est sécurisée par des technologies comme le calcul confidentiel (confidential computing) pour l'inférence et l'entraînement, permettant ainsi de préserver la souveraineté des données tout en bénéficiant des avantages évolutifs du cloud public.

Lectures associées

Nouvelle étude d'OpenAI : Comment entraîner une IA qui 'ne déraille pas sous pression' ?

Les modèles d'IA modernes peuvent se comporter de manière non fiable ou dangereuse lorsqu'ils sont poussés au-delà de leurs données d'entraînement ou soumis à des pressions. Dans un nouveau document de recherche intitulé "Reinforcement Learning Towards Broadly and Persistently Beneficial Models", OpenAI explore comment entraîner des modèles pour qu'ils conservent des comportements bénéfiques et sûrs dans de nouveaux scénarios complexes et sous contrainte. Plutôt que de se concentrer uniquement sur une liste d'interdictions, l'étude défend l'idée qu'un bon assistant d'IA doit, dans des situations inédites, rester honnête, prudent, capable d'être corrigé et orienté vers des jugements bénéfiques pour l'humain. Elle propose d'utiliser l'apprentissage par renforcement non pas pour maximiser une récompense étroite (ce qui peut conduire à des détournements ou "reward hacking"), mais pour inculquer des traits bénéfiques profonds. Les chercheurs ont créé un ensemble de données de dialogue synthétique couvrant 12 domaines (médical, juridique, scientifique, etc.) pour évaluer 15 traits bénéfiques comme la véracité, la transparence métacognitive, la perception des risques et l'équité. Dans des expériences, le remplacement de seulement 5% des données d'entraînement standard par des données axées sur ces traits a significativement amélioré les performances du modèle sur 44 des 53 évaluations de sécurité et d'alignement, avec une amélioration moyenne de 9,1 points de pourcentage. Fait marquant, un modèle entraîné avec des données de traits bénéfiques uniquement dans le domaine de la santé a également montré des améliorations dans des tâches non sanitaires, suggérant un transfert d'alignement inter-domaines. Le modèle a appris une inclination sous-jacente à reconnaître l'incertitude et à privilégier la prudence dans les situations à risque. De plus, ces modèles ont démontré une "persistance de l'alignement" plus forte, résistant mieux aux invites adverses et au réglage fin malveillant sans dégradation généralisée de leur comportement. OpenAI souligne que cette recherche ne résout pas l'alignement des IA, mais représente un pas vers un "façonnage préalable" des modèles. L'enjeu pour l'industrie est de développer des IA dont le comportement reste robuste et prévisible dans des tâches complexes à haut risque, au-delà du simple refus systématique.

marsbitIl y a 16 mins

Nouvelle étude d'OpenAI : Comment entraîner une IA qui 'ne déraille pas sous pression' ?

marsbitIl y a 16 mins

Goldman Sachs aborde à nouveau l'état actuel de la frénésie de l'IA : "Les bénéfices solides l'emporteront sur les inquiétudes liées à la valorisation" avant que le cycle d'investissement n'atteigne son sommet, la volatilité augmentera encore

L'engouement pour l'IA n'est pas une simple réplique de la bulle de 1999-2000, selon Goldman Sachs. Le rapport clé est que, si les bénéfices et les dépenses en capital continuent d'être révisés à la hausse, les marchés ont déjà intégré des attentes optimistes importantes, les rendant plus sensibles à tout changement de récit. Contrairement à la fin des années 1990, la valorisation prospective n'est pas excessivement étirée car les anticipations de profits ont augmenté en parallèle des cours. Le signal majeur actuel est l'accélération des investissements en IA, dont l'intensité dépasse déjà le pic des années 90. Cependant, d'autres signaux de bulle (baisse des marges macro, déséquilibres de financement des entreprises, déficit courant) ne sont pas présents. Le défi principal est désormais le risque de "bulle de profits". La valeur boursière ajoutée des sociétés liées à l'IA (environ 27 000 milliards de dollars) dépasse les gains macroéconomiques de référence. Pour justifier les valorisations actuelles, il faut postuler que les gagnants de l'IA capteront une part durablement élevée des gains de productivité. À court terme, tant que le pic du cycle d'investissement n'est pas atteint, les bénéfices solides devraient l'emporter sur les craintes de valorisation. Cependant, la volatilité devrait augmenter, car les cours dépendent d'hypothèses optimistes. La demande de protection contre les baisses prend donc de la valeur. Par ailleurs, l'économie non-IA est moins vigoureuse qu'à la fin des années 1990, ce qui pourrait amplifier les corrections si le récit de l'IA faiblit.

marsbitIl y a 17 mins

Goldman Sachs aborde à nouveau l'état actuel de la frénésie de l'IA : "Les bénéfices solides l'emporteront sur les inquiétudes liées à la valorisation" avant que le cycle d'investissement n'atteigne son sommet, la volatilité augmentera encore

marsbitIl y a 17 mins

Le rebond du marché des actions des semi-conducteurs : est-ce la fin d'un ajustement technique ou le début d'une inversion de tendance ?

L'action des semi-conducteurs a rebondi après une forte vente le 23 juin en Corée du Sud, où le Kospi a chuté d'environ 10%. La question centrale est de savoir si ce rebond marque la fin d'un simple ajustement technique ou un début de renversement de tendance. Le cœur de la volatilité réside dans la phase de repricing des actions semi-conductrices après le sur-achat lié à l'IA. Les titres mémoire, comme Samsung, SK Hynix et Micron, ont été poussés à la hausse par l'expansion des infrastructures IA, le HBM (mémoire haute bande passante) étant un composant clé en pénurie. Le rebond observé ressemble davantage à une correction de position qu'à une confirmation de reprise haussière. L'attente de rémunération des actionnaires chez Samsung a aidé, mais le test décisif viendra des résultats trimestriels, notamment ceux de Micron. Ses chiffres et ses prévisions doivent prouver que la dynamique de prix et la visibilité des commandes pour le HBM restent solides, soutenant ainsi la valorisation de toute la chaîne. Si Micron dépasse ses prévisions élevées et maintient des perspectives fortes, le rebond pourrait signaler la poursuite de la tendance. En revanche, si les indications deviennent prudentes, notamment sur l'équilibre offre-demande pour 2027, la correction récente pourrait annoncer un affaiblissement. Pour l'instant, le marché attend la preuve que les fondamentaux justifient encore les valorisations élevées.

marsbitIl y a 50 mins

Le rebond du marché des actions des semi-conducteurs : est-ce la fin d'un ajustement technique ou le début d'une inversion de tendance ?

marsbitIl y a 50 mins

Trading

Spot
Futures

Articles tendance

Comment acheter WAR

Bienvenue sur HTX.com ! Nous vous permettons d'acheter WAR (WAR) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément WAR (WAR).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos WAR (WAR)Après avoir acheté vos WAR (WAR), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des WAR (WAR)Tradez facilement WAR (WAR) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

538 vues totalesPublié le 2024.12.11Mis à jour le 2026.06.02

Comment acheter WAR

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de WAR (WAR) sont présentées ci-dessous.

活动图片