Article | Qiu Shui Bi Dan
Au premier trimestre 2026, le classement des revenus des grands modèles linguistiques mondiaux de Counterpoint Research a révélé une nouvelle carte des pouvoirs. Anthropic, avec 134 millions d'utilisateurs, captait 31,4 % des parts de revenus mondiaux de l'IA, avec un revenu moyen par utilisateur (ARPU) de 16,2 dollars. OpenAI comptait 900 millions d'utilisateurs, avec un ARPU de seulement 2,2 dollars. Doubao de ByteDance, avec 345 millions d'utilisateurs actifs mensuels, arrivait en tête en Chine, mais était absent de ce classement de revenus. Un autre géant de l'internet, pourtant critiqué pour ses investissements prudents et son retard en R&D, apparaissait de manière inattendue en tête des revenus des entreprises d'IA chinoises.
Ces données mettent en lumière un fait criant : le plus grand bassin d'utilisateurs contribue le moins de revenus, tandis que le plus petit bassin d'utilisateurs s'accapare la plus grande part. De plus, chaque appel d'inférence consomme une puissance de calcul réelle, chaque nouvel utilisateur signifiant une facture plus élevée.
La loi du fer de l'internet des coûts marginaux nuls se heurte, à l'ère de l'IA, au mur d'airain des "coûts marginaux non nuls". L'ancienne logique consistant à brûler de l'argent pour gagner en échelle est remplacée par une nouvelle règle : "Les lignes de ravitaillement et l'efficacité de la monétisation déterminent la survie ou la mort."
En juin 1942, la bataille de Midway a commencé. La flotte combinée japonaise disposait d'un avantage en tonnage et en expérience, mais ses lignes de ravitaillement s'étendaient sur des milliers de milles nautiques depuis le territoire national, chaque sortie consommant du carburant et des munitions difficiles à remplacer. Les forces américaines, au contraire : les bases de Hawaï et la capacité industrielle du continent signifiaient que leurs lignes de ravitaillement s'épaississaient à mesure que le combat progressait.
Aujourd'hui, l'industrie chinoise de l'IA a atteint son propre "Midway". La part de la Chine dans le volume total d'appels des grands modèles d'IA mondiaux dépasse régulièrement 50 %. DeepSeek V4 mobilise les développeurs mondiaux avec un cinquantième du coût, mais les revenus totaux de l'IA chinoise sont comprimés à un chiffre unique dans la part mondiale, ne dépassant pas ceux d'une seule entreprise américaine. Derrière ces données se cachent à la fois les jeux de stratégie commerciale des entreprises et le conflit entre deux approches industrielles nationales.
Deux lignes de front se déploient ainsi : À l'Est, les lignes de ravitaillement de trois géants de l'entreprise sont mises à l'épreuve de la limite — dont les munitions s'épuiseront en premier, dont la défense s'effondrera en premier. À l'Ouest, un jeu de stratégie mondial plus caché sur la voie de l'IA se déroule — comment gagner une guerre d'IA illimitée avec des ressources limitées. Ces deux lignes se font écho mutuellement dès le début sous la forme d'une offensive en tenaille.
Ligne de front Est : Le jeu de l'approvisionnement et de l'efficacité de la monétisation dans une guerre d'usure
Tencent, Alibaba et ByteDance ont choisi trois voies radicalement différentes, mais font face à la même question : dans cette guerre d'usure aux coûts marginaux non nuls, qui a la ligne de ravitaillement la plus fiable, qui a l'efficacité de monétisation la plus élevée ?
Tencent : La course à l'efficacité de la monétisation par les scénarios
Parmi les entreprises d'IA chinoises, Tencent, pourtant largement critiquée pour son manque de vision stratégique prospective et ses capacités de R&D, affiche la meilleure efficacité de monétisation. Sur le classement mondial, Tencent se classe première en Chine avec 114 millions d'utilisateurs et un ARPU de 2,9 dollars, plus du double de celui de Baidu et plus de quatre fois celui d'Alibaba, tout en restant à près de la moitié des 5,0 dollars de Microsoft. Mais son secret réside précisément dans le fait de ne pas compter sur la vente de l'IA elle-même pour gagner de l'argent.
Au T1 2026, le chiffre d'affaires de Tencent s'est élevé à 196,46 milliards de yuans, en hausse de 9 % en glissement annuel. Mais le contraste le plus crucial est le suivant : si l'on exclut l'impact des investissements dans les nouveaux produits d'IA, le bénéfice d'exploitation a augmenté de 17 % en glissement annuel, atteignant 84,4 milliards de yuans. La nouvelle gamme de produits d'IA a à elle seule absorbé environ 8,8 milliards de yuans de bénéfices au cours du trimestre.
Où cet argent est-il allé ? Les revenus des services marketing ont augmenté de 20 % en glissement annuel, les modèles de recommandation publicitaire alimentés par l'IA en étant le moteur central ; les revenus des services aux entreprises ont augmenté de 20 % en glissement annuel, la demande de services cloud liés à l'IA constituant le principal facteur de croissance. L'IA n'est pas une ligne de revenus dans le livre de comptes de Tencent, mais un catalyseur qui accélère le fonctionnement des lignes de revenus existantes — elle rend la publicité plus précise, rend les services cloud plus faciles à vendre, fait croître le temps d'utilisation des utilisateurs de Video Channels de plus de 20 %.
Le véritable secret de la compétitivité de l'IA de Tencent ne réside pas au niveau du modèle, mais dans l'efficacité de la boucle "scénario - données - monétisation". La mise à niveau du modèle de recommandation ne nécessite pas le modèle générique le plus puissant, mais la boucle de données la plus à même de comprendre le comportement des utilisateurs de Tencent — cette barrière de données est entre les mains de Tencent elle-même.
La stratégie de Tencent est claire et pragmatique : les bénéfices de l'activité principale sont la ligne d'approvisionnement principale. La publicité et les jeux fournissent des munitions à l'IA, et l'IA rend en retour la publicité plus précise et l'expérience de jeu meilleure — c'est un cycle vertueux déjà validé. Liu Chiping, le président de Tencent, a systématiquement exposé "l'économie de l'IA" de Tencent : "Dans les scénarios d'IA, chaque fois qu'un service intelligent est délivré à un utilisateur, cela génère des coûts considérables." La stratégie centrale est de "trouver des scénarios à haute valeur ajoutée", et non pas "d'acquérir aveuglément un grand nombre d'utilisateurs actifs quotidiens".
Le pari le plus lointain réside dans l'Agent intelligent de WeChat, mais le calendrier a été repoussé à plusieurs reprises de "lancement total au T3" à "pas de lancement à court terme". Cet écart mesure la profondeur de la fissure dans la ligne de ravitaillement de l'IA de Tencent : tout le potentiel de l'Agent intelligent WeChat dépend d'une prochaine version "nettement meilleure" du modèle Hunyuan ; et les progrès de Hunyuan dépendent à leur tour du jeu d'allocation de la puissance de calcul entre la formation de Hunyuan, l'IA de WeChat, Yuanbao et sept ou huit autres projets. Tencent a rarement démenti avec éclat la rumeur selon laquelle Yao Shunyu, "numéro un" de l'IA, aurait quitté l'entreprise en raison du fait que "WeChat a pris une partie de la puissance de calcul" — la rumeur touchait précisément le maillon le plus fragile : lorsque la puissance de calcul limitée doit être répartie entre plusieurs lignes métier, qui se bat pour les munitions de l'avenir à long terme ?
Sous cette fissure se cache un défaut stratégique plus profond de Tencent. La stratégie de "mixage de modèles", où les capacités du modèle central dépendent partiellement de sources externes, illustre le pragmatisme constant de Tencent : utiliser les capacités de modèles externes pour gagner du temps et développer ses propres portails d'applications d'IA. Mais cela signifie également qu'une fois que l'écart de génération en compétitivité des modèles de base s'élargit, les portails, services et écosystèmes construits sur ces modèles pourraient migrer avec eux. Si la clé de la survie est entre les mains d'autrui, même les muscles les plus robustes peuvent devenir inutiles du jour au lendemain.
Tencent est clairement conscient de ce problème. James Mitchell, le directeur de la stratégie, a déclaré lors de la conférence téléphonique sur les résultats que, pour privilégier la sécurisation des scénarios internes, Tencent "a délibérément reporté la commercialisation externe de la puissance de calcul cloud", "la puissance de calcul étant entièrement allouée à elle-même". La concentration des ressources de puissance de calcul sur le développement des modèles de base et la monétisation des scénarios à haute valeur ajoutée est actuellement la priorité absolue de Tencent.
Alibaba : Le pari coûteux de la pile complète autonome
Au quatrième trimestre de l'exercice 2026, le chiffre d'affaires du groupe Cloud Intelligence d'Alibaba s'est élevé à 41,626 milliards de yuans, en hausse de 38 % en glissement annuel ; les revenus des produits d'IA ont atteint 8,971 milliards de yuans, représentant pour la première fois plus de 30 % du total, avec une croissance à trois chiffres pour le onzième trimestre consécutif. Le PDG Wu Yongming a clairement déclaré : "Les investissements dans les technologies d'IA en pile complète sont entrés dans un cycle de retour commercial à grande échelle positif." Mais au même trimestre, l'EBITA ajusté d'Alibaba a chuté de 84 % en glissement annuel, et le bénéfice d'exploitation est passé du positif au négatif. La guerre des livraisons de repas et la course aux armements de l'IA se déroulant simultanément, entre la flambée de l'ARR et la chute des bénéfices se pose la question réelle : "Quelle est la durée des ténèbres avant l'aube ?"
La ligne de ravitaillement d'Alibaba est la "profondeur des infrastructures". La lettre officielle aux actionnaires publiée le 20 mai a fourni la carte stratégique la plus claire pour le pari en pile complète d'Alibaba. La stratégie des modèles est passée d'une percée ponctuelle à une guerre de groupe impliquant des agents intelligents, des modèles du monde et des modèles multimodaux. L'entreprise mise sur une logique centrale : seul le contrôle de toute la chaîne, des puces aux applications, peut réduire les coûts d'inférence au point critique permettant un service à grande échelle. Le pari en pile complète d'Alibaba consiste essentiellement à reproduire le "moment Android" de l'ère de l'IA. Contrôler la base, c'est contrôler indirectement tous les portails supérieurs qui se développent sur cette base. Google a mis dix ans à faire passer Android d'un centre de coûts à un moteur de profits. La capacité d'Alibaba à traverser les ténèbres avant l'aube dépend de son niveau de patience stratégique.
La lettre a également clairement désigné le commerce de détail instantané comme "pilier stratégique central de la mise à niveau de la plateforme Taobao Tmall", faisant de Taobao Flash Deals un scénario clé pour la croissance des nouveaux utilisateurs et le renforcement de la fidélité, tous deux stimulés par l'IA. L'application Qwen destinée aux utilisateurs grand public est profondément intégrée aux diverses applications de l'écosystème, notamment Taobao Tmall, Taobao Flash Deals, Fliggy, Damai, Amap, Alipay, etc., disposant d'avantages significatifs en termes de ressources pour mobiliser les services écosystémiques dans les domaines de la vie quotidienne, des services, de la productivité et du divertissement. Avec la plateforme de travail d'IA d'entreprise Wukong, cette stratégie à double détente B2C/B2B pourrait constituer une véritable menace pour l'ambition de Doubao de construire un super-portail.
Un défi plus profond réside également dans le jeu organisationnel concernant l'allocation de la puissance de calcul entre les différentes lignes métier. Le compte rendu largement diffusé de la réunion d'analyse interne qui a suivi le départ de Lin Junyang, responsable technique de Tongyi Qianwen, a révélé une fissure, exposant la pénurie de puissance de calcul de ce produit stratégique. En tant que fournisseur de services cloud à actifs lourds, Alibaba Cloud doit arbitrer entre garantir le développement de son propre grand modèle, soutenir l'adoption de l'IA par le commerce électronique au sein du groupe, et vendre de la puissance de calcul à des clients externes. La répartition des ressources et la nécessité de coordonner de nombreuses lignes métier sont des contraintes objectives.
Ce conflit révèle la contradiction structurelle de l'IA d'Alibaba : même si la chaîne logistique est longue, si chaque segment met des bâtons dans les roues des autres, les approvisionnements ne monteront pas en ligne.
Mais le changement est en cours. Tongyi Qianwen et Taobao Tmall ont achevé leur interconnexion totale bidirectionnelle, et 166 millions d'utilisateurs actifs mensuels commencent à être systématiquement dirigés vers le bassin de 4 milliards de produits de Taobao. Le produit d'IA pour le service client B2B "Dian Xiaomi" a déjà réussi à boucler la boucle payante. Le commerce de détail instantané, nouveau champ de bataille de la fusion IA + e-commerce, étend la "chirurgie de suture" des outils de service client vers les scénarios de transaction centraux. La preuve de la valeur de cette chirurgie de suture lors du grand événement promotionnel du 18 juin constituera le test de pression le plus direct pour la stratégie ATH d'Alibaba.
De plus, le bug mentionné précédemment dans un article, où il produisait des plans inutiles, n'a toujours pas été corrigé par Qwen à ce jour, ce qui est étrange. Le manque d'attention portée à l'expérience des utilisateurs finaux est également un problème.
ByteDance : L'examen de passage de l'IA à la logique du trafic
L'approche de ByteDance est la continuation de l'inertie du modèle "usine d'applications" de l'ère de l'internet mobile : déployer simultanément plus de 20 applications d'IA côté B2C et B2B, couvrant les chatbots, les personnages virtuels, les réseaux sociaux, les images, les outils, etc. La logique est simple : arroser les succès avec du trafic, utiliser les succès pour s'approprier les portails, puis monétiser une fois les portails consolidés.
Cette méthodologie a été maintes fois validée à l'ère de l'internet mobile, s'appuyant sur la loi industrielle des coûts de reproduction logicielle tendant vers zéro. L'ère de l'IA a brisé cette loi : chaque appel de modèle est une consommation réelle de puissance de calcul, plus l'échelle est grande, plus les coûts sont élevés. Les 345 millions d'utilisateurs actifs mensuels de Doubao représentent 345 millions de coûts actifs qui brûlent de l'argent chaque jour. C'est le dilemme le plus profond auquel est confrontée la stratégie d'IA de ByteDance. La situation de Meta dans le classement mondial est une référence plus sévère : 1 milliard d'utilisateurs, un ARPU de seulement 0,1 dollar. Il est facile de fidéliser les utilisateurs avec de l'IA gratuite, mais il est difficile de gagner de l'argent avec de l'IA gratuite.
L'ampleur des pertes côté B2C est bien plus grave que son absence du classement des revenus. Une référence possible : OpenAI a réalisé un chiffre d'affaires de 5,7 milliards de dollars au premier trimestre, mais une perte d'exploitation de 7 milliards de dollars, perdant 1,22 dollar pour chaque dollar de revenu, avec un taux de paiement d'environ 5,5 % de ses utilisateurs B2C. En Chine, le taux de conversion payant des applications d'IA B2C est généralement inférieur à 1 %. Certaines institutions estiment que même si Doubao atteignait le taux de paiement de 5,6 % de ChatGPT, ses revenus annualisés ne pourraient que couvrir à peine ses coûts opérationnels ; avec le taux de conversion réel inférieur à 1 % en Chine, les revenus annuels pourraient être inférieurs à 10 milliards de yuans, alors que le champ de bataille B2C brûle souvent des dizaines de milliards de yuans de coûts par trimestre, ces revenus sont une goutte d'eau dans l'océan.
Une question plus pertinente est de savoir si ByteDance est en "révolution active" ou en "défense passive" dans cette course à l'IA. L'Assistant Mobile Doubao tente de prendre le contrôle des opérations utilisateur au niveau système — c'est précisément la problématique la plus anxiogène pour ByteDance : lorsque les utilisateurs n'ouvrent plus Douyin pour faire défiler des vidéos, mais disent directement à l'IA "trouve-moi quelque chose d'intéressant", les fondations de revenus publicitaires de l'ancien empire s'effondreront-elles avant que le nouvel empire ne soit construit ? De plus, le mode "démarrer d'abord, puis réparer les barrières" érode un actif plus précieux que le trafic — la confiance. Une erreur d'un Agent IA pourrait divulguer votre mot de passe bancaire.
Une fissure plus grave est sa culture organisationnelle interne qui se déforme progressivement. Zhang Chi, ancien chercheur de l'équipe Seed de ByteDance, a quitté l'entreprise et a publiquement critiqué la culture du benchmaxxing (optimisation pour les benchmarks) au sein de Seed : les chefs d'équipe évaluent la performance en fonction des benchmarks dont ils sont responsables, tout le monde se concentre sur l'amélioration des scores, "mais cela ne se traduit pas par une bonne expérience dans l'utilisation réelle". De plus, ByteDance a besoin d'environ six mois pour terminer un cycle de formation d'un grand modèle (pré-formation plus post-formation), alors que Google, selon la rumeur, n'en a besoin que de trois, ce qui signifie que l'écart pourrait s'accroître plutôt que se combler.
La ligne de ravitaillement de ByteDance est le trafic et la trésorerie de son activité principale, mais cette ligne de ravitaillement se rétrécit — le bénéfice net a chuté de plus de 70 % en glissement annuel en 2025, les investissements dans l'IA dévorant follement les bénéfices. Entre l'open source et le propriétaire, ByteDance est la plus unique : Doubao n'est pas open source, mais parvient à une large adoption par les développeurs mondiaux grâce à des prix extrêmement bas. C'est la logique du propriétaire à bas prix : ne pas être open source, mais utiliser la guerre des prix pour atteindre l'effet de l'open source. Mais la guerre des prix a une fin, lorsque la trésorerie est continuellement dévorée par les investissements dans l'IA, sans avoir la barrière de l'écosystème open source, ni la capacité de prime des clients haut de gamme du propriétaire, jusqu'où peut aller une stratégie coincée au milieu ?
La performance internationale du portefeuille de produits d'IA de ByteDance est également solide. Dola a été téléchargé plus de 72 millions de fois au T1 2026, avec un cumul dépassant 200 millions, se classant parmi les principales applications d'assistants IA mondiaux. AnyGen, positionné comme un concurrent de Manus, teste un abonnement payant, Trae se concentre sur les outils de programmation IA, mais ils font face au même test de la ligne de ravitaillement : plus Dola a d'utilisateurs, plus les coûts d'appel des modèles externes sont élevés ; plus les produits payants sont approfondis, plus la concurrence avec OpenAI et Meta est féroce. La contribution actuelle des produits payants à l'étranger à la ligne de ravitaillement est presque négligeable — le chiffre d'affaires annuel de Gauth n'est que de 14 millions de dollars, AnyGen brûle encore de l'argent pour acquérir des utilisateurs, Dola est entièrement gratuit. La volonté de payer est plus élevée sur les marchés étrangers, ce qui pourrait être une variable à l'avenir, mais pour l'instant, l'étranger est loin d'être un grenier, c'est un autre gouffre sans fond qui brûle de l'argent.
Une ligne de ravitaillement, aussi longue soit-elle, ne peut remplacer l'efficacité de la monétisation par "vivre sur l'ennemi" — la première détermine combien de temps vous pouvez tenir, la seconde détermine si vous pouvez gagner.
Tencent perçoit des loyers, Alibaba construit des routes, ByteDance mesure les terres. La différence essentielle entre ces trois modèles n'est pas seulement la distance de l'IA par rapport à l'argent, mais aussi le choix stratégique basé sur leurs dotations en ressources propres.
L'IA de Tencent se cache derrière la publicité et le cloud, c'est la plus proche de l'argent ; l'IA d'Alibaba vend des infrastructures, la consommation de jetons explose, mais pour transformer la puissance de calcul en bénéfices, il faut franchir le seuil des effets d'échelle ; l'IA de ByteDance fait face directement aux utilisateurs, c'est la plus éloignée de l'argent. Être loin de l'argent signifie le plus grand risque, mais aussi le plus grand espace d'imagination — mais pour que l'imagination se transforme en revenus, cela teste précisément le temps, et la capacité à boucler un cycle payant.
Outre l'efficacité de la monétisation, le super-portail d'IA auquel ByteDance accorde le plus d'importance, outre les utilisateurs, la valeur de l'écosystème pourrait être une variable encore plus importante, et à cet égard, les avantages de Tencent et d'Alibaba sont plus marqués — Celui qui pourra transformer le dialogue IA en une boucle transactionnelle réelle pourra véritablement convertir la "valeur du trafic" du portail en "capacité de percevoir un loyer". Cela ne teste pas la volonté de payer des utilisateurs, mais la capacité de l'IA à orchestrer les chaînes de services du monde réel.
L'Agent Intelligent WeChat détient les meilleures cartes. L'écosystème des mini-programmes WeChat abrite les capacités de service de millions de commerçants — commander des repas, prendre un taxi, prendre un rendez-vous médical, payer des factures — en théorie, un portail de dialogue IA pourrait appeler toutes ces capacités et accomplir une boucle complète du besoin à la livraison dans l'interface de discussion. Appeler un mini-programme n'est pas difficile, la difficulté réside dans la capacité de l'IA à comprendre précisément l'intention réelle de l'utilisateur dans un scénario spécifique et à faire le bon choix parmi des centaines de mini-programmes similaires. Une mauvaise recommandation, l'utilisateur perd du temps et de la patience ; un paiement erroné, c'est la confiance qui est perdue. La prudence de Tencent n'est pas tant un problème technique qu'une conscience claire du taux d'erreur toléré par 1,4 milliard d'utilisateurs.
L'Assistant Mobile Doubao de ByteDance tente d'emprunter une autre voie — sauter par-dessus les mini-programmes et prendre directement le contrôle des opérations utilisateur au niveau système. Cela semble plus radical, mais aussi plus fragile. La bulle flottante au niveau système peut identifier le contenu de l'écran, simuler des clics, remplir des formulaires, mais elle fait face à deux obstacles fondamentaux : premièrement, les barrières d'autorisation des fabricants de téléphones — aucun système d'exploitation ne laissera facilement une application tierce prendre le contrôle des interactions au niveau système ; deuxièmement, le désavantage naturel en matière de confiance et de sécurité — une IA qui peut lire votre écran et simuler vos clics est aussi celle qui peut le plus vous faire peur.
Après l'interconnexion bidirectionnelle entre Tongyi Qianwen et Taobao, les utilisateurs peuvent sélectionner des produits, comparer les prix et passer des commandes dans le dialogue, le paiement et la logistique étant pris en charge de manière transparente par Taobao. C'est actuellement la solution la plus proche d'une boucle "IA + transaction" parmi les trois, mais son plafond est tout aussi clair : la portée des services que Qwen peut orchestrer est presque limitée à l'écosystème interne d'Alibaba.
Celui qui occupera le super-portail de l'interaction homme-machine de demain — cette nouvelle couche qui remplacera le navigateur, les applications et la barre de recherche — aura la plus grande valeur d'option.
Mais l'imagination doit également être mise à l'épreuve. Ses conditions de falsification sont tout aussi claires : si l'Assistant Mobile Doubao ne parvient pas à augmenter significativement la dépendance des utilisateurs aux instructions IA dans les 12 mois, si l'Agent Intelligent WeChat n'a toujours pas de calendrier de lancement clair fin 2026, si, après l'intégration de Tongyi Qianwen à l'écosystème d'Alibaba, le volume des commandes et le taux de réachat des transactions effectuées par les utilisateurs dans le dialogue ne continuent pas à augmenter — alors la valeur d'option de ces "super-portails" sera fortement réévaluée.
L'imagination n'est pas un talisman éternel, ce n'est qu'une option avec une date d'expiration. Si elle n'est pas exercée à l'échéance, la prime tombe à zéro. Le prix d'une option, avant son exercice, est toujours un art, pas une science.
Ligne de front Ouest : La divergence stratégique entre "conserver le territoire" et "conserver les personnes"
Alors que Tencent progresse dans l'open source des modèles, qu'Alibaba utilise Qwen pour capturer plus de 50 % des téléchargements open source mondiaux, que DeepSeek et Kimi submergent les développeurs mondiaux avec des prix extrêmement bas, les choix stratégiques des entreprises du front Est convergent vers le jeu de stratégie du front Ouest. Le jeu des lignes de ravitaillement sur le premier front soutient mutuellement la lutte pour les standards sur le second front.
En mars 1947, l'armée de Hu Zongnan forte de 250 000 hommes attaqua Yan'an par surprise. À ce moment, le Corps d'Armée du Nord-Ouest ne comptait que 26 000 hommes. Mao Zedong décida de se retirer activement. La veille du retrait, Mao Zedong laissa une déclaration qui fut citée à plusieurs reprises par la suite : "Notre armée combat, il ne s'agit pas de gagner ou de perdre une ville ou un territoire. Conserver les personnes et perdre le territoire, et les personnes et le territoire seront conservés ; conserver le territoire et perdre les personnes, et les personnes et le territoire seront perdus." Il fit également une analogie vivante : "L'ennemi entre à Yan'an en serrant le poing, une fois à Yan'an, il devra étendre les doigts, ce qui nous permettra de les couper un par un." Un an plus tard, Yan'an fut repris. Moins de deux ans plus tard, la nouvelle Chine naquit.
L'industrie chinoise de l'IA se trouve à une bifurcation historique similaire. Le volume d'appels dépasse la moitié du monde, les revenus sont comprimés à un chiffre unique — la racine de cette contradiction réside dans le fait que l'IA chinoise a choisi un modèle commercial radicalement différent de celui des États-Unis. Qwen est open source, DeepSeek est open source, Kimi est open source, Hunyuan est open source. Kimi K2.6 coûte seulement 4 dollars par million de jetons, six à huit fois moins cher que Claude ; Tongyi Qianwen capture plus de 50 % des téléchargements de modèles open source mondiaux. Le propriétaire à bas prix et l'open source à coût encore plus bas font essentiellement la même chose : encercler les villes par les campagnes.
Les États-Unis suivent la voie du propriétaire avec prime. Anthropic verrouille le marché haut de gamme des entreprises avec un ARPU de 16,2 dollars. Le jugement de Foreign Policy est révélateur : "La vraie course à l'IA n'est pas une course aux armements matériels que l'on peut gagner avec les puces les plus avancées, mais une question de savoir qui peut faire de son modèle l'option par défaut des marchés émergents."
C'est la divergence stratégique entre "conserver le territoire" et "conserver les personnes". Le "conserver le territoire" à l'américaine érige des murs élevés, s'accrochant aux hauteurs rentables des clients de tête du B2B avec des performances monopolistiques. Le "conserver les personnes" à la chinoise considère les développeurs mondiaux comme l'actif le plus central, utilise l'open source et les bas prix pour attirer les personnes dans les vastes marchés émergents, les PME et parmi les développeurs indépendants, accumulant l'énergie potentielle de l'écosystème dans d'innombrables interstices de scénarios de longue traîne.
Le poing serré des modèles propriétaires sur le marché haut de gamme s'ouvrira un par un sur le marché bas de gamme, tandis que les modèles open source permettront aux développeurs de faire des ajustements fins de manière autonome dans d'innombrables scénarios de longue traîne comme la santé, l'agriculture, le commerce électronique transfrontalier, coupant un par un les doigts étendus du propriétaire. Une fois que ces développeurs créeront des entreprises qui deviendront des géants, la dépendance au chemin de la pile technologique les verrouillera dans l'écosystème open source chinois. Une possibilité plus profonde réside dans le fait que les grands modèles open source pourraient devenir "Android" de l'ère de l'IA — non pas en tant que portail utilisateur directement monétisable, mais en tant qu'infrastructure sous-jacente, permettant à toutes les applications et agents supérieurs de fonctionner naturellement sur la pile technologique des modèles chinois. Celui qui contrôle la base de l'écosystème des développeurs contrôle indirectement tous les portails supérieurs créés par les développeurs. Le succès d'Android ne réside pas dans les frais de licence, mais dans le fait qu'il a fait de la recherche Google, de Gmail, du Play Store les options par défaut de milliards d'appareils dans le monde. La boucle commerciale des grands modèles open source ne viendra probablement pas des modèles eux-mêmes, mais des services cloud, des boutiques d'applications et des canaux de distribution qui se développeront sur ces modèles. Qwen est déjà utilisé par le gouvernement de Singapour pour construire une IA souveraine nationale, prouvant que l'open source peut devenir une exportation de standard.
L'érosion des bénéfices des géants propriétaires américains n'est pas un "futur", mais un "présent en cours" qui s'accélère. Après que des modèles comme DeepSeek, Tongyi Qianwen ont rattrapé le niveau de performance de GPT-4, leurs prix de jetons extrêmement bas ont directement détruit le pouvoir de fixation des prix à prime élevée des géants propriétaires. Le jour où, dans le classement des appels des principaux fournisseurs cloud mondiaux, le flux total des modèles open source dépassera définitivement celui des modèles propriétaires, ce jour marquera la chute permanente de la rentabilité des modèles propriétaires.
Mais la capacité à "conserver les personnes et le territoire" après avoir "conservé les personnes" dépend de la capacité de la boucle commerciale de l'écosystème open source à se matérialiser. La logique "modèle gratuit, taxe sur la puissance de calcul" ne tient que si les développeurs finissent par migrer leurs appels de modèles vers une même plateforme cloud pour effectuer la formation et l'inférence. La réalité est que les modèles open source peuvent être déployés sur n'importe quel cloud — le fait que plus de la moitié des téléchargements open source de Tongyi Qianwen ne signifie pas que les revenus d'Alibaba Cloud augmentent dans les mêmes proportions. Llama de Meta est également un acteur majeur du camp open source, mais Meta lui-même n'en tire pas de revenus cloud substantiels. La possession de l'écosystème est la première étape, la monétisation de l'écosystème est la deuxième, et l'écart entre ces deux étapes est précisément l'aspect le plus surestimé de la voie open source.
L'origine de l'écart ne réside pas dans la technologie, mais dans les différences structurelles de volonté de payer. Anthropic s'est introduit dans des scénarios de productivité à haute valeur ajoutée pour les entreprises — génération de code, analyse de textes longs, raisonnement profond — les clients paient pour la production, pas pour les jetons. Il en va de même pour Microsoft Copilot, derrière un ARPU de 5,0 dollars se cache la boucle de flux de travail au sein de l'écosystème Office. La monétisation de l'IA chinoise repose toujours principalement sur des scénarios gratuits grand public, la consommation de jetons B2B explose, mais la valeur unitaire n'a pas encore atteint le niveau d'une "prime pour les résultats". Passer de la "facturation à l'usage" à la "tarification à la valeur" est l'essence du fossé d'efficacité de monétisation entre la Chine et l'étranger, et aussi le kilomètre final le plus difficile à parcourir pour que l'IA chinoise passe d'une usine à jetons à un haut lieu de valeur.
Mais il faut aussi reconnaître que ce fossé ne peut être comblé par l'industrie de l'IA seule. Microsoft Copilot peut vendre un ARPU de 5,0 dollars, en s'appuyant sur les centaines de millions d'utilisateurs abonnés existants à Office 365 et sur son réseau de canaux B2B — les clients entreprises n'achètent pas de l'IA, mais une boucle de flux de travail "IA + Office". La Chine manque d'un écosystème logiciel d'entreprise de taille comparable, ce qui fait que la transition de la "facturation à l'usage" à la "tarification à la valeur" manque de tremplin crucial.
Le marché des entreprises à l'étranger bénéficie d'une inertie de paiement B2B accumulée sur des décennies — l'industrie SaaS américaine génère plus de 300 milliards de dollars de revenus annuels, les entreprises sont déjà habituées à payer pour des abonnements logiciels, l'IA ajoute simplement une nouvelle ligne de frais à cette inertie. Le marché SaaS chinois, encore aujourd'hui, stagne autour de quelques dizaines de milliards de dollars, la volonté des entreprises de payer pour des logiciels est loin d'être généralisée, la monétisation de l'IA laboure un sol plus mince.
Mais l'efficacité de la monétisation n'est pas toute l'histoire du récit de l'IA. L'ARPU d'OpenAI n'est que de 2,2 dollars, mais sa valorisation a un moment dépassé de loin celle d'Anthropic — le marché financier paie la valeur d'option de ChatGPT en tant que "nouveau portail d'interaction homme-machine", et non pour ses revenus d'abonnement actuels. De même, Doubao de ByteDance n'apparaît pas dans le classement, mais ses 345 millions d'utilisateurs actifs mensuels et le positionnement au niveau système de son assistant mobile sont actuellement les actifs les plus agressifs et les plus proches de l'imagination d'un "super-portail" parmi toutes les entreprises d'IA chinoises. L'efficacité de la monétisation mesure "qui gagne de l'argent aujourd'hui", l'imagination du portail répond à la question "qui aura le droit de définir les règles demain". Les deux ne sont pas une relation de compromis. Pour que l'IA chinoise passe d'une usine à jetons à un haut lieu de valeur, elle a besoin à la fois de la discipline de monétisation du type Anthropic et de l'ambition de portail du type OpenAI — sans la première, elle ne tiendra pas jusqu'à la fin ; sans la seconde, même en arrivant à la fin, elle ne pourra que percevoir des loyers, et non définir les règles.
La grande jonction des deux fronts : De l'usine à jetons au haut lieu de valeur
Les entreprises chinoises ne manquent pas de technologie, ni d'utilisateurs, ni de scénarios, elles manquent de la capacité à relier ces trois éléments — rendre les modèles suffisamment puissants, les scénarios suffisamment profonds, et les utilisateurs suffisamment prêts à payer pour les résultats. Sur ce point, Anthropic et Microsoft ont déjà donné une réponse provisoire.
Plusieurs signaux détermineront l'évolution de la situation dans les 12 prochains mois : L'augmentation des prix de l'API lancée par Tencent en mars pourra-t-elle porter l'ARPU vers la barre des 5,0 dollars de Microsoft au T2 ? Comment se traduira le trafic B2C généré par l'intégration de Tongyi Qianwen et Taobao lors du premier 618, en termes de transactions effectives et de fidélisation ? Les tests payants de ByteDance lui permettront-ils d'échapper à la catégorie "Autres" dans le prochain classement mondial ?
Mais le destin final de l'industrie chinoise de l'IA dépend de la somme des capacités de ces entreprises et des DeepSeek, dépend de la capacité de la stratégie "encercler les villes par les campagnes" du front Ouest à parcourir le "dernier kilomètre" : faire en sorte que les développeurs mondiaux non seulement utilisent les jetons chinois, mais soient aussi prêts à payer pour l'IA chinoise. "Conserver les personnes" est la première étape, "conserver les personnes et le territoire" est l'issue finale. Si ce kilomètre n'est pas parcouru, l'IA chinoise restera toujours une usine, pas une marque.
Pour parcourir ce kilomètre, au moins trois conditions sont nécessaires. Premièrement, au moins une entreprise chinoise doit réussir à boucler une boucle payante pour les entreprises — les clients doivent être prêts à payer continuellement pour l'amélioration de la productivité tirée par l'IA. Alibaba est limité par le plafond du scénario de l'e-commerce, ByteDance n'a pas encore franchi le fossé entre "utilisateur gratuit" et "client payant". Deuxièmement, l'avantage écosystémique des modèles open source chinois doit se transformer en avantage de standard — lorsque les développeurs mondiaux se seront habitués à la chaîne d'outils de Qwen ou DeepSeek, le passage aux services cloud chinois ne sera plus une "expérimentation" mais une option "par défaut". Troisièmement, la présence d'acteurs chinois sur le marché mondial des logiciels d'entreprise, pour fournir à la monétisation de l'IA un tremplin du type Microsoft Copilot. Le "dernier kilomètre" de l'IA chinoise, les cinq cents premiers mètres peuvent être parcourus par les entreprises d'IA elles-mêmes, les cinq cents derniers mètres dépendent de la capacité du marché global des services aux entreprises à réaliser une mise à niveau générationnelle simultanée.
Midway n'est que le début du renversement de la situation offensive/défensive, pas la fin. Après cela, les forces américaines ont traversé l'âpre bataille d'usure de Guadalcanal, les lourdes pertes d'Iwo Jima. Les vainqueurs de 1942 ont mis deux ans et demi pour atteindre la baie de Tokyo. De même, pour l'industrie chinoise de l'IA, entre "entrer dans une phase de stabilisation" et "gagner la guerre", il reste une longue navigation.
Lors de la bataille de Guadalcanal qui suivit, les futurs vainqueurs durent non seulement affronter les forces japonaises, mais aussi lutter contre le paludisme, les pluies tropicales torrentielles et la rupture des lignes d'approvisionnement. Le duc de Wellington, vainqueur de la bataille de Waterloo, a déclaré : "La victoire, c'est la capacité de se battre cinq minutes de plus que n'importe quelle autre armée au monde." Sur une échelle de temps plus longue, cette guerre teste non seulement l'efficacité et la robustesse des lignes de ravitaillement, l'efficacité de la monétisation par "vivre sur l'ennemi", mais aussi la détermination stratégique et la patience.







