Auteur : Black Lobster, Deep Tide TechFlow
Titre original : L'exportation de Tokens, vendre l'électricité chinoise au monde entier
À l'été 1858, un câble en cuivre a traversé le fond de l'océan Atlantique, reliant Londres à New York.
L'importance de cet événement n'a jamais résidé dans la vitesse de transmission, mais dans la structure du pouvoir : celui qui pose le câble sous-marin peut prélever sa part sur le flux d'informations. L'Empire britannique, grâce à ce réseau télégraphique mondial, a maintenu le contrôle sur les renseignements de ses colonies, le prix du coton et les nouvelles de la guerre.
La puissance de l'Empire ne tenait pas seulement à sa flotte, mais aussi à ce câble.
Plus de cent soixante ans plus tard, cette logique se répète d'une manière inattendue.
En 2026, les grands modèles chinois d'IA sont en train de conquérir discrètement le marché mondial des développeurs. Les dernières données d'OpenRouter montrent que parmi les dix premiers modèles de la plateforme en termes de consommation de Tokens, les modèles chinois représentent 61 %, les trois premiers étant tous originaires de Chine. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin et Singapour traversent les câbles sous-marins du Pacifique pour atteindre les centres de données chinois, où la puissance de calcul est consommée, l'électricité circule, et les résultats sont renvoyés.
L'électricité n'a jamais quitté le réseau électrique chinois, mais sa valeur a été livrée de manière transfrontalière via les Tokens.
La grande migration des modèles d'IA
Le 24 février 2026, OpenRouter a publié des données hebdomadaires : la consommation totale de Tokens des dix premiers modèles de la plateforme était d'environ 8,7 billions, les modèles chinois en représentant 5,3 billions, soit 61 %. MiniMax M2.5 a atteint la première place avec 2,45 billions de Tokens, suivi par Kimi K2.5 et Zhipu GLM-5, les trois premiers étant tous originaires de Chine.
Dernières données du 26 février
Ce n'est pas un hasard, une étincelle a tout déclenché.
Début de cette année, OpenClaw est apparu, un outil open source qui permet à l'IA de vraiment « travailler », capable de contrôler directement un ordinateur, d'exécuter des commandes et de réaliser des flux de travail complexes en parallèle. Le nombre d'étoiles sur GitHub a dépassé les 210 000 en quelques semaines.
John, un professionnel de la finance, a immédiatement installé OpenClaw et l'a connecté à l'API d'Anthropic pour surveiller automatiquement les informations boursières et fournir des signaux de trading. Quelques heures plus tard, il a regardé le solde de son compte, stupéfait : quelques dizaines de dollars avaient disparu.
C'est la nouvelle réalité apportée par OpenClaw. Auparavant, discuter avec l'IA consommait quelques milliers de Tokens par conversation, un coût négligeable. Avec OpenClaw, l'IA exécute une dizaine de sous-tâches en arrière-plan, rappelant constamment le contexte et itérant en boucle. La consommation de Tokens n'est pas linéaire, elle est exponentielle. La facture ressemble à une voiture qui accélère avec le capot ouvert, le compteur d'essence baisse sans s'arrêter.
Une « astuce » a alors circulé dans la communauté des développeurs : utiliser des jetons OAuth pour connecter directement les comptes d'abonnement d'Anthropic ou Google à OpenClaw, transformant le forfait mensuel « illimité » en carburant gratuit pour les agents IA, une méthode adoptée par de nombreux développeurs.
La contre-mesure officielle n'a pas tardé.
Le 19 février, Anthropic a mis à jour ses conditions, interdisant explicitement l'utilisation des identifiants d'abonnement Claude avec des outils tiers comme OpenClaw. Pour accéder aux fonctionnalités de Claude, il faut passer par la facturation API. Google a quant à lui massivement bloqué les comptes d'abonnement utilisant OpenClaw pour accéder à Antigravity et Gemini AI Ultra.
« La patience a ses limites », John s'est alors tourné vers les grands modèles chinois.
Sur OpenRouter, le modèle chinois MiniMax M2.5 obtient un score de 80,2 % pour les tâches de génie logiciel, contre 80,8 % pour Claude Opus 4.6, une différence presque négligeable. Mais les prix sont radicalement différents : le premier coûte 0,3 dollar par million de Tokens en entrée, le second 5 dollars, soit environ 17 fois plus.
John a fait le changement, son flux de travail fonctionne toujours, et sa facture a été divisée par un ordre de grandeur. Cette migration se produit simultanément à l'échelle mondiale.
Le COO d'OpenRouter, Chris Clark, l'a dit clairement : la raison pour laquelle les modèles open source chinois capturent une part de marché importante est leur présence exceptionnellement élevée dans les flux de travail des agents exécutés par les développeurs américains.
L'exportation d'électricité
Pour comprendre la nature de l'exportation de Tokens, il faut d'abord comprendre la structure de coût d'un Token.
Il semble léger, un Token équivaut à environ 0,75 mot anglais, une conversation normale avec l'IA n'en consomme que quelques milliers. Mais lorsque ces Tokens s'accumulent par billions, la réalité physique sous-jacente devient pesante.
Décomposons le coût d'un Token, il n'y a que deux éléments clés : la puissance de calcul et l'électricité.
La puissance de calcul correspond à l'amortissement de la dépréciation des GPU. Vous achetez un NVIDIA H100 pour environ trente mille dollars, sa durée de vie convertie en chaque inférence représente le coût d'amortissement. L'électricité est le carburant du fonctionnement continu des centres de données. Un GPU à pleine charge consomme environ 700 watts, et en ajoutant les coûts des systèmes de refroidissement, la facture d'électricité d'un grand centre de données d'IA peut facilement dépasser plusieurs centaines de millions de dollars par an.
Maintenant, traçons ce processus physique sur une carte.
Un développeur américain à San Francisco envoie une requête API. Les données partent de Californie, passent par les câbles sous-marins du Pacifique pour atteindre un centre de données en Chine. Le cluster GPU se met au travail, l'électricité du réseau chinois alimente ces puces, l'inférence est terminée, les résultats sont renvoyés. L'ensemble du processus ne prend peut-être qu'une ou deux secondes.
L'électricité n'a jamais quitté le réseau électrique chinois, mais la valeur de l'électricité, via les Tokens, a été livrée de manière transfrontalière.
Il y a ici un aspect merveilleux que le commerce ordinaire ne peut atteindre : les Tokens n'ont pas de forme physique, n'ont pas besoin de passer par les douanes, ne sont pas soumis aux droits de douane, et ne figurent même pas dans les statistiques commerciales actuelles. La Chine exporte massivement des services de calcul et d'électricité, mais dans les données officielles du commerce de marchandises, c'est presque invisible.
Les Tokens sont devenus un produit dérivé de l'électricité, l'exportation de Tokens est essentiellement une exportation d'électricité.
Cela est également dû au prix relativement bas de l'électricité en Chine, environ 40 % moins cher qu'aux États-Unis en moyenne. C'est une différence de coût au niveau physique, que les concurrents ne peuvent pas facilement reproduire.
De plus, les grands modèles d'IA chinois bénéficient d'avantages algorithmiques et d'une « concurrence féroce ».
L'architecture MoE de DeepSeek V3 n'active qu'une partie des paramètres lors de l'inférence, des tests indépendants montrent que son coût d'inférence est environ 36 fois inférieur à celui de GPT-4o. MiniMax M2.5 active également seulement 10B paramètres sur un total de 229B.
Au sommet se trouve la concurrence féroce : Alibaba, ByteDance, Baidu, Tencent, Moon Dark Side, Zhipu, MiniMax... une dizaine d'entreprises sur la même piste se marchent sur les pieds, les prix sont déjà tombés en dessous de la marge bénéficiaire raisonnable, perdre de l'argent pour gagner des parts de marché est déjà la norme dans le secteur.
En y regardant de plus près, c'est similaire à l'exportation des produits manufacturés chinois : utiliser les avantages de la chaîne d'approvisionnement et la concurrence interne pour faire chuter brutalement le prix des Tokens.
Du Bitcoin aux Tokens
Avant les Tokens, il y a eu une première exportation d'électricité.
Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à recevoir des visiteurs étranges.
Ces personnes louaient des usines abandonnées, y installaient des machines dense et complexes, les alimentaient en électricité 24 heures sur 24. Les machines ne produisaient rien, elles résolvaient simplement un problème mathématique sans fin, et occasionnellement, de ce problème mathématique infini, émergeait un Bitcoin.
C'était la première forme d'exportation d'électricité : convertir l'énergie hydroélectrique et éolienne bon marché, via le hachage des mineurs, en actifs numériques circulant globalement, puis les monétiser en dollars sur les exchanges.
L'électricité n'a traversé aucune frontière, mais sa valeur, portée par le Bitcoin, s'est écoulée vers le marché mondial.
Pendant ces années, la puissance de calcul chinoise représentait plus de 70 % de la puissance minière mondiale de Bitcoin. L'hydroélectricité et l'énergie au charbon chinoises, de manière détournée, participaient à une redistribution du capital global.
En 2021, tout s'est arrêté net. Le marteau réglementaire est tombé, les mineurs se sont dispersés, la puissance de calcul a migré vers le Kazakhstan, le Texas aux États-Unis et le Canada.
Mais cette logique en elle-même n'a jamais disparu, elle attendait juste une nouvelle enveloppe, jusqu'à l'apparition fracassante de ChatGPT, la course aux grands modèles d'IA. Les anciennes fermes minières de Bitcoin se sont transformées en centres de données d'IA, les mineurs en GPU de calcul, le Bitcoin produit autrefois est devenu des Tokens, seule l'électricité est restée la même.
L'exportation de Bitcoin et l'exportation de Tokens sont structurellement similaires dans leur logique sous-jacente, mais les Tokens ont actuellement plus de valeur commerciale.
Le minage de Bitcoin est un pur calcul mathématique, le Bitcoin produit est un actif financier, sa valeur vient de sa rareté et du consensus du marché, et n'a rien à voir avec « ce qui a été calculé ». La puissance de calcul elle-même n'est pas productive, c'est plutôt un sous-produit d'un mécanisme de confiance.
L'inférence des grands modèles est différente. Les GPU consomment de l'électricité et produisent de véritables services cognitifs : code, analyse, traduction, créativité. La valeur des Tokens provient directement de leur utilité pour l'utilisateur. C'est un ancrage plus profond ; une fois que le flux de travail d'un développeur dépend d'un certain modèle, le coût de migration augmente exponentiellement avec le temps.
Bien sûr, il y a une différence clé : le minage de Bitcoin a été expulsé de Chine, tandis que l'exportation de Tokens est activement choisie par les développeurs du monde entier.
La guerre des Tokens
Le câble sous-marin posé en 1858 représentait la souveraineté de l'Empire britannique sur l'autoroute de l'information ; celui qui possède l'infrastructure définit les règles du jeu.
L'exportation de Tokens est également une guerre non déclarée, pleine d'obstacles.
La souveraineté des données est le premier mur. Une requête API d'un développeur américain traitée par un centre de données chinois signifie que les données transitent physiquement par la Chine. Pour les développeurs individuels et les petites applications, ce n'est pas un problème, mais pour les données sensibles des entreprises, les informations financières, les scénarios de conformité gouvernementale, c'est un obstacle majeur. C'est pourquoi la pénétration des modèles chinois est la plus élevée dans les outils de développement et les applications personnelles, et presque inexistante dans les systèmes centraux des entreprises.
L'interdiction des puces est le deuxième mur. Le développement de l'IA en Chine est confronté aux restrictions à l'exportation des GPU haut de gamme de NVIDIA. L'architecture MoE et l'optimisation algorithmique ne peuvent que partiellement compenser ce désavantage, le plafond existe toujours.
Mais les obstacles actuels ne sont que le prologue, un champ de bataille plus vaste est en train de se former.
Les Tokens et les modèles d'IA sont devenus une nouvelle dimension de la rivalité stratégique entre la Chine et les États-Unis, comparable aux semi-conducteurs et à Internet du XXe siècle, voire plus proche d'une métaphore plus ancienne : la course à l'espace.
En 1957, l'URSS a lancé Spoutnik 1, provoquant une onde de choc aux États-Unis, qui a immédiatement lancé le programme Apollo, investissant l'équivalent de milliers de milliards de dollars aujourd'hui pour ne pas perdre la course spatiale.
La logique de la course à l'IA est étonnamment similaire, mais son intensité dépassera de loin celle de la course spatiale. L'espace est après tout un espace physique, que les gens ordinaires ne ressentent pas, tandis que l'IA s'infiltre dans les capillaires de l'économie. Derrière chaque ligne de code, chaque contrat, chaque système de décision gouvernementale, peut tourner le grand modèle d'un certain pays. Le modèle qui devient l'option par défaut de l'infrastructure pour les développeurs du monde entier acquiert无形中 une influence structurelle sur l'économie numérique mondiale.
C'est ce qui inquiète vraiment Washington dans l'exportation de Tokens par la Chine.
Lorsque la base de code d'un développeur, son flux de travail d'agent, la logique de son produit sont tous construits autour de l'API d'un modèle chinois, le coût de migration augmentera de manière exponentielle avec le temps. À ce moment-là, même si les États-Unis légifèrent pour restreindre, les développeurs résisteront avec leurs pieds, tout comme aucun programmeur ne peut abandonner GitHub aujourd'hui.
L'exportation de Tokens d'aujourd'hui n'est peut-être que le prologue de ce long jeu. Les grands modèles chinois ne prétendent pas vouloir bouleverser quoi que ce soit, ils se contentent de proposer leurs services à un prix inférieur à tous les développeurs du monde disposant d'une clé API.
Cette fois, ceux qui posent le câble sont les équipes d'ingénieurs qui codent à Hangzhou, Pékin et Shanghai, et les clusters GPU qui fonctionnent 24 heures sur 24 dans une province du sud de la Chine.
Cette course n'a pas de compte à rebours, elle se déroule 24 heures sur 24, son unité est le Token, son champ de bataille est le terminal de chaque développeur.
Twitter : https://twitter.com/BitpushNewsCN
Groupe Telegram BiTui : https://t.me/BitPushCommunity
Abonnement Telegram BiTui : https://t.me/bitpush






