Huawei Cloud ne fait pas de guerre des prix sur les Tokens, Zhou Yuefeng veut changer la façon de gagner dans le cloud AI

marsbitPublié le 2026-06-06Dernière mise à jour le 2026-06-06

Résumé

"Je ne me soucie pas vraiment du nombre total de tokens, ni du chiffre d'affaires total." Lors de la conférence INSPIRE 2026 de Huawei Cloud, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a clairement défini la priorité stratégique actuelle : se concentrer sur l'amélioration de la productivité réelle derrière chaque token, plutôt que de participer à la guerre des prix sur le marché chinois du cloud IA. Contrairement aux concurrents comme Alibaba Cloud et Volcano Engine qui mettent en avant le volume d'appels de tokens et les revenus MaaS, Huawei Cloud adopte une approche différente basée sur trois piliers. Premièrement, une voie de calcul entièrement autonome et localisée (ascendante, Kunpeng), construisant un "deuxième plan de calcul" indépendant de l'écosystème NVIDIA. Deuxièmement, une focalisation commerciale sur les entreprises publiques et les secteurs clés (gouvernement, finance) via son cloud hybride, en proposant un modèle équilibrant souveraineté des données et partage de la puissance de calcul. Troisièmement, une stratégie open source agressive pour son écosystème logiciel. Le cœur de sa nouvelle offre est le paradigme "Agentic Infra", qui déplace la concurrence de la vente de tokens vers la vente de capacités productives pour les agents IA. Huawei Cloud a lancé une série de nouveaux produits (AICS, AMS, CCE Volcano Next, AgentSphere, ModelArts Next, AgentArts/openJiuwen) conçus pour résoudre les défis techniques du déploiement des agents en entr...

"Je ne me soucie pas vraiment du nombre total de Tokens, ni du chiffre d'affaires total." Le 5 juin, lors de la conférence INSPIRE CREATORS 2026 de Huawei Cloud, Zhou Yuefeng, administrateur de Huawei et PDG de Huawei Cloud, a accordé sa première interview aux médias depuis sa prise de fonction, exprimant clairement et distinctement l'actuel axe stratégique de Huawei Cloud.

Il s'agit d'une déclaration rare sur le marché chinois actuel du cloud IA.

Au cours des six derniers mois, des fournisseurs de cloud comme Alibaba Cloud et Volcano Engine n'ont cessé de mettre en avant le récit du cloud IA, utilisant le volume quotidien d'appels de Tokens et l'échelle des revenus MaaS comme nouveaux indicateurs de croissance. Même les principaux éditeurs de grands modèles, tels que Moon's Dark Side, DeepSeek, Zhipu, etc., ont continuellement réduit les prix de l'inférence. Le mot-clé de toute l'industrie était le volume d'appels de modèles et l'échelle.

Huawei Cloud a choisi d'entrer sur ce champ de bataille encombré d'une autre manière. Huawei Cloud a dévoilé en rafale sa série de nouvelles offres la plus dense depuis l'année dernière orientée vers l'IA : le cluster de calcul intelligent AICS Lingqu, le stockage mémoire AMS Agentic, le moteur d'orchestration unifié CCE Volcano Next, la plateforme de sécurité et d'autonomie AgentSphere, ainsi que ModelArts Next, la plateforme d'agents intelligents d'entreprise AgentArts (version open source openJiuwen), le tout regroupé sous le nouveau paradigme "Agentic Infra".

Le KPI que Zhou Yuefeng a défini pour Huawei Cloud n'est pas le nombre de Tokens, mais "si chaque Token améliore véritablement la productivité". Durant cette période de transition où l'offre de puissance de calcul localisée est limitée et où les modèles économiques sont encore en cours de remodelage, Huawei Cloud s'est extrait de la "course à la deuxième place sur le cloud IA".

Ne pas comparer l'échelle des Tokens

Lors de la rencontre, Zhou Yuefeng a rarement répondu directement aux différences avec Alibaba Cloud et Volcano Engine. Il a déclaré que Huawei Cloud était différent des autres fournisseurs de cloud pour trois raisons.

Premièrement, la voie de la puissance de calcul est différente. Huawei Cloud utilise une chaîne complète de matériels et logiciels de calcul entièrement locaux et autodéveloppés : Ascend, Kunpeng, CANN, Euler, etc. Cette voie est plus sinueuse car Huawei ne peut pas utiliser la puissance de calcul des autres ; il doit faire de la solution locale une réponse au niveau de l'industrie.

Par conséquent, Huawei Cloud doit construire un deuxième plan de calcul, offrant un autre choix d'écosystème en dehors de la voie dominante mondiale constituée par NVIDIA et les principaux clouds publics. Huawei Cloud ne peut pas, et ne prévoit pas, d'utiliser du matériel "multinational" pour rivaliser avec ses concurrents sur l'échelle de la puissance de calcul. Zhou Yuefeng a déclaré : "Je ne veux pas comparer les revenus, l'échelle ou le classement de la deuxième à la énième place avec d'autres entreprises de cloud, cela n'a pas de sens."

Deuxièmement, l'accent commercial est différent. Les fournisseurs de cloud d'origine Internet dépendent naturellement du trafic grand public et de l'écosystème des développeurs, tandis que Huawei Cloud concentre ses forces sur les secteurs public-entreprise et ceux liés à l'économie nationale et aux moyens de subsistance. Par exemple, le cloud hybride de Huawei occupe depuis plusieurs années la première part de marché dans les secteurs gouvernemental, financier et des entreprises d'État centrales, servant plus de 5500 clients dans le monde.

Zhou Yuefeng a indiqué que l'itération des modèles et de la puissance de calcul était si rapide qu'il était probable que les déploiements soient déjà obsolètes une fois terminés. Il recommande donc aux clients publics et aux entreprises de ne pas construire leurs propres clusters de dizaines de milliers de cartes, mais plutôt d'utiliser des données locales combinées à de la puissance de calcul IA/des services de modèles de cloud public distants, avec des technologies comme l'inférence confidentielle, l'entraînement confidentiel et le calcul confidentiel, afin d'établir un équilibre entre la souveraineté des données et le partage de la puissance de calcul. Essentiellement, il s'agit d'apporter les avantages de l'itération du cloud public aux clients qui ne peuvent pas entièrement migrer vers le cloud public.

Troisièmement, l'approche de l'écosystème est différente. Huawei Cloud pousse l'open source à un niveau assez radical : Ascend CANN, le système d'exploitation Euler, l'orchestrateur CCE Volcano, la chaîne d'outils ModelArts sont tous open source ; la version open source openJiuwen de la plateforme d'agents intelligents AgentArts partage plus de 90% de son noyau avec la version commerciale.

La conférence a également lancé conjointement avec plus de 20 principaux éditeurs de modèles, dont Zhipu, DeepSeek, MiniMax, Kimi, StepFun, Baidu, Meituan LongCat, iFlyTek Spark, le plan "Cent Modèles, Mille Formes, le Cloud Rassemble pour Gagner Ensemble".

Lorsque la puissance de calcul locale est encore limitée en capacités et en approvisionnement, élargir l'écosystème et offrir plus de choix de modèles est la seule façon d'ancrer solidement ce deuxième plan de calcul.

Agentic Infra : Déplacer le champ de bataille de la vente de Tokens vers la vente de productivité

Si la voie de la puissance de calcul détermine ce que Huawei Cloud "ne combat pas", Agentic Infra détermine ce qu'il "veut combattre".

Zhou Yuefeng a émis un jugement sur l'évolution de l'industrie de l'IA : il y a quatre ans, faire de l'IA c'était acheter des cartes de calcul ; il y a trois ans, c'était entraîner de grands modèles ; cette année, c'est utiliser des agents intelligents. La puissance de calcul et les modèles reculent à l'arrière-plan, les agents intelligents passent au premier plan.

Le point de compétition du cloud IA se déplace du débit de Tokens vers la capacité des agents intelligents à fonctionner réellement dans les entreprises.

La matrice produit de Huawei Cloud est également réorganisée selon ce constat. Le "pack de quatre" d'Agentic Infra - l'usine efficace de Tokens, l'apprentissage continu, l'orchestration unifiée calcul-intelligence, la sécurité et l'autonomie - répond chacun à un défi d'ingénierie incontournable lors du déploiement d'agents intelligents en entreprise.

AICS Lingqu réduit la latence des Tokens d'un cluster de 100 000 cartes à moins de 10 millisecondes ; AMS utilise un accès direct NPU-CMS pour un espace mémoire de l'ordre du pétaoctet, résolvant le goulot d'étranglement de la mémoire à long terme des Agents ; CCE Volcano Next améliore l'utilisation des ressources de plus de 30% grâce au partage de pool entraînement-inférence ; AgentSphere réalise un démarrage de l'ordre de 100 millisecondes et une création par lots de l'ordre de centaines de milliers par minute avec des sandbox légères.

ModelArts Next, quant à lui, reconfigure l'approche MaaS. Son routage de modèles prend en charge trois stratégies : priorité coût, priorité efficacité, équilibre. Il intègre déjà plus de 15 modèles SOTA, avec une précision de planification supérieure à 95% et un coût d'appel réduit en moyenne de 20%.

Mais le vrai pari différenciateur de Huawei Cloud, ce sont les zones sectorielles. Lors de cette conférence, Huawei Cloud a lancé simultanément quatre "Usines à Rêves IA Sectorielles" : Santé Intelligente, Intelligence Incarnée, Fabrication Intelligente et Calcul Scientifique.

La zone Santé Intelligente, construite conjointement avec l'hôpital Ruijin de Shanghai autour du grand modèle RuiPath, a vu plus de 20 hôpitaux de différents niveaux (hôpitaux de comté, villes-préfectures, hôpitaux de classe A de troisième niveau) s'installer massivement, notamment à Handan, Ruian, Qianxinan, Wu'an, etc. Cela signifie que des capacités hautement dépendantes de l'expertise, comme le diagnostic pathologique, sont pour la première fois délivrées sous forme de "service cloud" à grande échelle aux hôpitaux de comté.

La zone Intelligence Incarnée a lancé la première plateforme de développement d'intelligence incarnée de bout en bout au monde, CloudRobo, avec pour objectif de répondre aux besoins d'outillage de toute la chaîne des plus de 300 startups chinoises dans l'intelligence incarnée.

Zhou Yuefeng a déclaré que la santé et la finance étaient les secteurs les plus matures numériquement et les plus riches en données en Chine. "Si même l'IA dans ces secteurs ne décolle pas, ce sera encore plus difficile pour les autres secteurs." Dans ces domaines, l'échelle pour mesurer la valeur de l'IA ne devrait pas être les utilisateurs actifs quotidiens ou le nombre de Tokens, mais plutôt la proportion de prévention des risques financiers, l'amélioration de l'efficacité du crédit, ou la probabilité pour les patients éloignés d'obtenir un diagnostic précis.

En reliant ces indices, le contour stratégique de Huawei Cloud devient clair : utiliser une base de puissance de calcul entièrement locale + écosystème open source comme fondation, couvrir le secteur public-entreprise avec le cloud hybride + le calcul confidentiel, et déplacer la compétition de la "vente de Tokens" vers la "vente de productivité" avec Agentic Infra + les zones sectorielles.

Cette voie est beaucoup plus lente que la poursuite des revenus MaaS et plus difficile à illustrer avec de belles données de croissance annuelle, mais elle contourne l'océan rouge des prix actuellement le plus féroce sur le cloud IA. Elle mise sur un marché encore non tarifé : qui occupera la position d'infrastructure fondamentale lorsque les agents intelligents pénétreront véritablement l'industrie.

Sur cette piste du cloud IA, Huawei Cloud ne peut qu'utiliser une autre solution. Zhou Yuefeng a résumé : "Je ne peux pas construire une terre noire silicium multinationale." Alors que d'autres fournisseurs de cloud comparent le rapport qualité-prix de leurs Tokens, Huawei Cloud se bat pour que ce système de calcul local puisse répondre aux véritables besoins futurs de l'IA industrielle chinoise. (Auteur | Zhang Shuai, Éditeur | Yang Lin)

Cryptos en tendance

Questions liées

QQuels sont les trois principaux points que Zhou Yuefeng, PDG de Huawei Cloud, a mentionnés comme différenciant Huawei Cloud des autres fournisseurs de cloud comme Alibaba Cloud et Volcano Engine ?

AZhou Yuefeng a souligné trois différences principales : 1) La voie de calcul différente, utilisant entièrement du matériel et des logiciels de calcul produits localement comme Ascend et Kunpeng. 2) L'accent commercial différent, se concentrant sur les entreprises publiques et les secteurs clés plutôt que sur l'écosystème grand public et les développeurs. 3) Une approche différente de l'écosystème, avec un engagement fort envers l'open source pour construire un deuxième plan de calcul viable.

QQue signifie le nouveau paradigme "Agentic Infra" proposé par Huawei Cloud, et quels sont ses quatre composants clés ?

A"Agentic Infra" est un nouveau paradigme stratégique de Huawei Cloud qui déplace l'accent de la vente de Tokens vers la vente de gains de productivité grâce aux agents IA. Ses quatre composants clés sont : 1) Une usine à Tokens efficace (AICS Lingqu). 2) Un apprentissage continu (AMS Agentic Memory Storage). 3) Une orchestration unifiée calcul/intelligence (CCE Volcano Next). 4) Une base d'exécution autonome sécurisée (AgentSphere).

QPourquoi Huawei Cloud ne participe-t-il pas à la guerre des prix des Tokens sur le marché du cloud IA chinois selon l'article ?

ASelon l'article, Huawei Cloud évite la guerre des prix sur les Tokens parce que sa stratégie n'est pas axée sur le volume ou les revenus des Tokens. Au lieu de cela, l'entreprise se concentre sur la valeur réelle créée par chaque Token, c'est-à-dire l'amélioration de la productivité. De plus, son utilisation exclusive de matériel de calcul produit localement l'empêche de rivaliser directement sur l'échelle et le prix du calcul "classique" (comme NVIDIA).

QQuels sont les "Ateliers IA pour l'industrie" (行业AI梦工厂) annoncés par Huawei Cloud lors de la conférence INSPIRE 2026, et quel est leur objectif ?

AHuawei Cloud a lancé quatre "Ateliers IA pour l'industrie" : Santé intelligente, Intelligence incarnée (Embodied AI), Fabrication intelligente et Calcul scientifique. Leur objectif est de fournir des solutions et des plateformes spécialisées pour permettre le déploiement profond de l'IA dans des secteurs spécifiques. Par exemple, l'atelier Santé intelligente, développé avec l'hôpital Ruijin de Shanghai, vise à démocratiser l'expertise médicale de haut niveau (comme le diagnostic pathologique) vers les hôpitaux des comtés via le cloud.

QComment Huawei Cloud compte-t-il servir les clients des secteurs public et des entreprises d'État qui ont des restrictions concernant le cloud public, selon les propos de Zhou Yuefeng ?

APour servir les clients du secteur public et des entreprises d'État qui ne peuvent pas entièrement migrer vers le cloud public, Zhou Yuefeng propose un modèle hybride. Il recommande de combiner des données locales avec la puissance de calcul IA et les services de modèles du cloud public distant. Cette approche est sécurisée par des technologies comme le calcul confidentiel (confidential computing) pour l'inférence et l'entraînement, permettant ainsi de préserver la souveraineté des données tout en bénéficiant des avantages évolutifs du cloud public.

Lectures associées

Il y a quelques instants, DeepSeek V4 a mis à jour DSpark, augmentant la vitesse d'inférence de 80 %

DeepSeek a annoncé une mise à jour majeure de son modèle DeepSeek-V4-Pro avec le lancement de DSpark, un nouveau cadre de décodage spéculatif (Speculative Decoding) open source, accompagné de l'infrastructure complète DeepSpec. Cette mise à jour, axée sur l'ingénierie et non sur les capacités fondamentales du modèle, vise à accélérer considérablement l'inférence des LLM en production. Le cœur de DSpark est l'introduction d'une **génération semi-autorégressive**. Cela combine la génération parallèle à haut débit d'un modèle "brouillon" léger avec une modélisation des dépendances entre tokens pour améliorer le taux d'acceptation. De plus, un système de **vérification planifiée par confiance et conscient du matériel** (Confidence-Scheduled Verification) évalue dynamiquement la probabilité que chaque token généré soit accepté par le modèle cible. Il adapte ainsi la longueur de vérification en temps réel pour optimiser l'utilisation des ressources GPU, notamment en charge élevée. Les résultats sont significatifs : face aux méthodes de pointe comme Eagle3 et DFlash, DSpark augmente la longueur moyenne de tokens acceptés de 26.7% à 30.9% et de 16.3% à 18.4% respectivement sur les modèles Qwen3. En déploiement réel, par rapport à la génération token par token précédente (MTP-1), **DSpark améliore la vitesse de génération pour l'utilisateur de 60% à 85% pour le modèle Flash et de 57% à 78% pour le modèle Pro**, à débit total constant. Le projet open source **DeepSpec** fournit une stack complète pour entraîner et évaluer des modèles brouillons pour le décodage spéculatif, supportant actuellement les algorithmes DSpark, DFlash et Eagle3, ainsi que les familles de modèles cibles Qwen3 et Gemma.

marsbitIl y a 3 h

Il y a quelques instants, DeepSeek V4 a mis à jour DSpark, augmentant la vitesse d'inférence de 80 %

marsbitIl y a 3 h

BIT Recherche : La réduction de moitié en 2028 n'est pas une fin en soi, le véritable remodelage de l'industrie minière du Bitcoin ne fait que commencer

L'industrie du minage de Bitcoin traverse actuellement l'ajustement structurel le plus complexe depuis la création du protocole. Malgré un prix du Bitcoin d'environ 61 000 $ et une puissance de calcul (hashrate) proche du record historique à 1 ZH/s, la rentabilité des mineurs se détériore. Plusieurs indicateurs montrent que le secteur fonctionne près du seuil de rentabilité, et le prochain halving de 2028 pourrait accélérer la consolidation. Les problèmes ne viennent pas seulement de la future réduction des récompenses de bloc, mais aussi de la transition incomplète vers un modèle de revenus basé sur les frais de transaction. De plus en plus d'entreprises minières évoluent de simples producteurs de Bitcoin vers des opérateurs d'infrastructures, d'énergie et de calcul pour l'IA/le HPC. La compétition se déplace ainsi de l'expansion de la puissance de calcul vers l'innovation des modèles économiques. Le modèle de coût de production indique un plancher actuel d'environ 46 744 $. Fait notable, les revenus des mineurs divergent historiquement du prix du Bitcoin. Alors que les revenus théoriques journaliers devraient être d'environ 78 millions de $, ils ne sont en réalité que de 33 millions de $. Les revenus provenant des frais sont également bas, à environ 220 000 $ par jour. En 2025, le coût de l'électricité a représenté 71,5% des revenus totaux des mineurs. Le prix d'équilibre pour le secteur est estimé à environ 65 000 $, rendant le minage seul peu rentable au prix actuel. Après le halving de 2028, le coût de production plancher pourrait atteindre ~93 289 $, favorisant les grandes entreprises aux ressources diversifiées. En conclusion, le secteur transforme son modèle fondamental : du "minage" vers les "infrastructures". La rentabilité future dépendra de la diversification des revenus, notamment via la gestion énergétique et l'hébergement de calcul IA/HPC. Pour les investisseurs, l'enjeu clé est d'identifier les entreprises capables de réussir cette transition et de bâtir un avantage compétitif résilient.

marsbitIl y a 4 h

BIT Recherche : La réduction de moitié en 2028 n'est pas une fin en soi, le véritable remodelage de l'industrie minière du Bitcoin ne fait que commencer

marsbitIl y a 4 h

Trading

Spot

Articles tendance

Comment acheter WAR

Bienvenue sur HTX.com ! Nous vous permettons d'acheter WAR (WAR) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément WAR (WAR).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos WAR (WAR)Après avoir acheté vos WAR (WAR), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des WAR (WAR)Tradez facilement WAR (WAR) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

546 vues totalesPublié le 2024.12.11Mis à jour le 2026.06.02

Comment acheter WAR

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de WAR (WAR) sont présentées ci-dessous.

活动图片