Auteur :Black Lobster, Deep潮 TechFlow
À l'été 1858, un câble en cuivre traversa le fond de l'océan Atlantique, reliant Londres et New York.
L'importance de cet événement n'a jamais résidé dans la vitesse de transmission, mais dans la structure de pouvoir : celui qui a posé le câble sous-marin pouvait prélever sa part sur le flux d'informations. L'Empire britannique, grâce à ce réseau télégraphique mondial, tenait entre ses mains les renseignements des colonies, le prix du coton et les nouvelles de la guerre.
La puissance de l'Empire ne reposait pas seulement sur sa flotte, mais aussi sur ce câble.
Cent soixante ans plus tard, cette logique se répète d'une manière inattendue.
En 2026, les grands modèles chinois sont en train de conquérir discrètement le marché mondial des développeurs. Les dernières données d'OpenRouter montrent que parmi la consommation de Tokens des dix premiers modèles de la plateforme, les modèles chinois représentent 61 % à eux seuls, les trois premiers étant tous originaires de Chine. Les requêtes API quotidiennes des développeurs de San Francisco, Berlin et Singapour traversent les câbles sous-marins de l'océan Pacifique pour atteindre les centres de données chinois, où la puissance de calcul est consommée, l'électricité circule, et les résultats sont renvoyés.
L'électricité n'a jamais quitté le réseau électrique chinois, mais sa valeur a été livrée à l'étranger via les Tokens.
La grande migration des modèles d'IA
Le 24 février 2026, OpenRouter a publié des données hebdomadaires : la consommation totale de Tokens des dix premiers modèles de la plateforme était d'environ 8,7 billions, les modèles chinois en représentant 5,3 billions, soit 61 %. MiniMax M2.5 a atteint la première place avec 2,45 billions de Tokens, suivi par Kimi K2.5 et Zhipu GLM-5, les trois premiers étant tous originaires de Chine.
Données du 26 février
Ce n'est pas un hasard, une mèche a tout déclenché.
Début de cette année, OpenClaw est apparu, un outil open source qui permet à l'IA de vraiment "travailler", capable de contrôler directement un ordinateur, d'exécuter des commandes et de réaliser des flux de travail complexes en parallèle, obtenant plus de 210 000 étoiles sur GitHub en quelques semaines.
John, un professionnel de la finance, a immédiatement installé OpenClaw et connecté l'API Anthropic pour surveiller automatiquement les informations boursières et fournir des signaux de trading. Quelques heures plus tard, il a regardé le solde de son compte, stupéfait : des dizaines de dollars, partis.
C'est la nouvelle réalité apportée par OpenClaw. Auparavant, discuter avec une IA consommait quelques milliers de Tokens par conversation, un coût négligeable. Avec OpenClaw, l'IA exécute une douzaine de sous-tâches en arrière-plan, invoquant反复 le contexte, itérant en boucle. La consommation de Tokens n'est pas linéaire, elle est exponentielle. La facture ressemble à une voiture qui accélère avec le capot ouvert, le compteur d'essence descend, impossible à arrêter.
Une "astuce" a ensuite circulé dans la communauté des développeurs : utiliser les jetons OAuth pour connecter directement les comptes d'abonnement Anthropic ou Google à OpenClaw, transformant le forfait mensuel "illimité" en carburant gratuit pour les Agents IA, une méthode adoptée par de nombreux développeurs.
La riposte officielle n'a pas tardé.
Anthropic a mis à jour ses conditions le 19 février, interdisant explicitement l'utilisation des identifiants d'abonnement Claude avec des outils tiers comme OpenClaw ; pour accéder aux fonctionnalités de Claude, il faut passer par le canal de facturation de l'API. Google a massivement bloqué les comptes d'abonnement utilisant OpenClaw pour accéder à Antigravity et Gemini AI Ultra.
"Le monde en a assez de Qin depuis longtemps", John s'est alors tourné vers les grands modèles chinois.
Sur OpenRouter, le modèle chinois MiniMax M2.5 obtient un score de 80,2 % pour les tâches de génie logiciel, contre 80,8 % pour Claude Opus 4.6, l'écart est presque négligeable. Mais les prix sont radicalement différents : 0,3 dollar par million de Tokens en entrée pour le premier, contre 5 dollars pour le second, soit environ 17 fois moins cher.
John a basculé, le flux de travail fonctionne toujours, la facture a été réduite d'un ordre de grandeur. Cette migration se produit simultanément à l'échelle mondiale.
Le COO d'OpenRouter, Chris Clark, l'a dit clairement : La raison pour laquelle les modèles open source chinois ont pu conquérir une large part de marché est leur proportion anormalement élevée dans les flux de travail d'agents exécutés par les développeurs américains.
L'exportation d'électricité
Pour comprendre la nature de l'exportation de Tokens, il faut d'abord comprendre la structure de coût d'un Token.
Il semble léger, un Token équivaut à environ 0,75 mot anglais, une conversation normale avec une IA n'en consomme que quelques milliers. Mais lorsque ces Tokens s'accumulent par billions, la réalité physique sous-jacente devient lourde.
Décomposons le coût du Token, il n'y a que deux éléments clés : la puissance de calcul et l'électricité.
La puissance de calcul est l'amortissement des GPU. Vous achetez un NVIDIA H100 pour environ trente mille dollars, sa durée de vie convertie en chaque inférence représente le coût d'amortissement. L'électricité est le carburant du fonctionnement continu du centre de données. Un GPU à pleine charge consomme environ 700 watts, ajoutez les coûts du système de refroidissement, la facture d'électricité d'un grand centre de données d'IA peut facilement dépasser des centaines de millions de dollars par an.
Maintenant, traçons ce processus physique sur une carte.
Un développeur américain à San Francisco envoie une requête API. Les données partent de Californie, via un câble sous-marin du Pacifique, atteignent un centre de données quelque part en Chine, le cluster GPU se met au travail, l'électricité du réseau chinois alimente ces puces, l'inférence est terminée, les résultats sont renvoyés. L'ensemble du processus prend peut-être une ou deux.
L'électricité n'a jamais quitté le réseau électrique chinois, mais la valeur de l'électricité, via les Tokens, a été livrée à l'étranger.
Il y a ici un aspect merveilleux qu'un commerce ordinaire ne peut atteindre : les Tokens n'ont pas de forme physique, n'ont pas besoin de passer par la douane, ne sont pas soumis à des droits de douane, et ne figurent même pas dans les statistiques commerciales actuelles. La Chine exporte massivement des services de calcul et d'électricité, mais dans les données officielles du commerce de marchandises, c'est presque invisible.
Le Token est devenu un dérivé de l'électricité, l'exportation de Tokens est essentiellement une exportation d'électricité.
Cela est également dû au prix relativement bas de l'électricité en Chine, environ 40 % moins cher qu'aux États-Unis en moyenne. C'est une différence de coût au niveau physique, que les concurrents ne peuvent pas facilement reproduire.
De plus, les grands modèles d'IA chinois ont également des avantages algorithmiques et de "concurrence intense".
L'architecture MoE de DeepSeek V3 n'active qu'une partie des paramètres lors de l'inférence, des tests indépendants montrent que son coût d'inférence est environ 36 fois inférieur à celui de GPT-4o. MiniMax M2.5 active également seulement 10B paramètres sur un total de 229B.
Au sommet se trouve la concurrence intense : Alibaba, ByteDance, Baidu, Tencent, Moonshot AI, Zhipu, MiniMax... une douzaine d'entreprises se bousculent sur la même piste, les prix sont déjà tombés en dessous de la marge de profit raisonnable, perdre de l'argent pour gagner des parts de marché est déjà la norme dans le secteur.
En y regardant de plus près, c'est similaire à l'exportation des produits manufacturés chinois : utiliser les avantages de la chaîne d'approvisionnement et la concurrence interne pour faire baisser radicalement le prix des Tokens.
Du Bitcoin au Token
Avant les Tokens, il y a eu une première exportation d'électricité.
Vers 2015, les gestionnaires de centrales électriques du Sichuan, du Yunnan et du Xinjiang ont commencé à recevoir des visiteurs étranges.
Ces personnes louaient des usines abandonnées, y installaient des machines denses, les faisaient fonctionner 24 heures sur 24. Les machines ne produisaient rien, elles résolvaient juste un problème mathématique sans fin, et occasionnellement, de ce problème mathématique infini, sortait un Bitcoin.
C'était la première forme d'exportation d'électricité : convertir l'hydroélectricité et l'éolien bon marché, via le hachage des mineurs, en actifs numériques流通 mondialement, puis les monétiser en dollars sur les交易所.
L'électricité n'a traversé aucune frontière, mais sa valeur, portée par le Bitcoin, s'est écoulée vers le marché mondial.
<极 style='font-size: 15px; font-family: "PingFang SC", system-ui, -apple-system, system-ui, "Helvetica Neue", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;'>À cette époque, la puissance de calcul chinoise représentait一度 plus de 70 % de la puissance minière mondiale de Bitcoin. L'hydroélectricité et le charbon chinois, de cette manière détournée, ont participé à une redistribution du capital mondial.
En 2021, tout s'est arrêté net. Le marteau réglementaire est tombé, les mineurs se sont dispersés, la puissance de calcul a migré vers le Kazakhstan, le Texas aux États-Unis et le Canada.
Mais cette logique en elle-même n'a jamais disparu, elle attendait juste une nouvelle enveloppe, jusqu'à l'apparition soudaine de ChatGPT, la course aux grands modèles, les anciennes fermes minières de Bitcoin se sont transformées en centres de données d'IA, les mineurs en GPU de calcul, le Bitcoin autrefois produit est devenu des Tokens, seule l'électricité est restée不变.
L'exportation de Bitcoin et l'exportation de Tokens sont structurellement similaires dans leur logique sous-jacente, mais les Tokens ont actuellement plus de valeur commerciale.
Le minage est un calcul mathématique pur, le Bitcoin produit est un actif financier, sa valeur vient de sa rareté et du consensus du marché, et n'a rien à voir avec "ce qui a été calculé". La puissance de calcul elle-même n'est pas productive, c'est更像 un sous-produit d'un mécanisme de confiance.
L'inférence des grands modèles est différente. Les GPU consomment de l'électricité et produisent de véritables services cognitifs : code, analyse, traduction, créativité. La valeur du Token provient directement de son utilité pour l'utilisateur. C'est un嵌入 plus profond, une fois que le flux de travail d'un développeur dépend d'un certain modèle, le coût de migration augmente avec le temps.
Bien sûr, il y a aussi une différence clé : le minage de Bitcoin a été expulsé de Chine, tandis que l'exportation de Tokens est activement choisie par les développeurs mondiaux.
La guerre des Tokens
Le câble sous-marin posé en 1858 représentait la souveraineté de l'Empire britannique sur l'autoroute de l'information, celui qui possède l'infrastructure peut définir les règles du jeu.
L'exportation de Tokens est également une guerre non déclarée, pleine d'obstacles.
La souveraineté des données est le premier mur. Une requête API d'un développeur américain traitée par un centre de données chinois signifie que les données transitent physiquement par la Chine. Pour les développeurs individuels et les petites applications, ce n'est pas un problème, mais pour les données sensibles des entreprises, les informations financières, les scénarios de conformité gouvernementale, c'est un obstacle majeur. C'est pourquoi la pénétration des modèles chinois est la plus élevée dans les outils de développement et les applications personnelles, et presque inexistante dans les systèmes centraux des entreprises.
L'interdiction des puces est le deuxième mur. Le développement de l'IA en Chine est confronté aux restrictions à l'exportation des GPU haut de gamme de NVIDIA, l'architecture MoE et l'optimisation des algorithmes ne peuvent que partiellement compenser cet inconvénient, le plafond existe toujours.
Mais les obstacles actuels ne sont que le prologue, un champ de bataille plus vaste est en train de se former.
Les Tokens et les modèles d'IA sont devenus une nouvelle dimension de jeu stratégique entre la Chine et les États-Unis,不比亚于 les semi-conducteurs, Internet au 20e siècle, ou même plus proche d'une métaphore plus ancienne : la course à l'espace.
En 1957, l'URSS a lancé Spoutnik 1, les États-Unis ont été stupéfaits, lançant immédiatement le programme Apollo, investissant l'équivalent de centaines de milliards de dollars aujourd'hui pour ne pas perdre la course spatiale.
La logique de la course à l'IA est étonnamment similaire, mais son intensité dépassera de loin la course spatiale. L'espace est après tout un espace physique, que les普通 gens ne ressentent pas, l'IA s'infiltre dans les capillaires de l'économie, derrière chaque ligne de code, chaque contrat, chaque système de décision gouvernementale, peut fonctionner le grand modèle d'un certain pays. Le modèle qui devient l'option par défaut de l'infrastructure pour les développeurs mondiaux acquiert无形中 une influence structurelle sur l'économie numérique mondiale.
C'est ce qui inquiète vraiment Washington concernant l'exportation de Tokens chinois.
Lorsque la base de code d'un développeur, son flux de travail d'Agent, la logique de son produit sont tous construits autour de l'API d'un certain modèle chinois, le coût de migration augmentera de manière exponentielle avec le temps. À ce moment-là, même si les États-Unis légifèrent pour限制, les développeurs résisteront avec leurs pieds, tout comme aucun programmeur ne peut abandonner GitHub aujourd'hui.
L'exportation actuelle de Tokens n'est peut-être que le début de ce long jeu. Les grands modèles chinois ne prétendent pas renverser quoi que ce soit, ils offrent simplement leurs services à un prix inférieur à tous les développeurs du monde disposant d'une clé API.
Cette fois, ceux qui posent le câble sont les équipes d'ingénieurs qui codent à Hangzhou, Pékin, Shanghai, et les clusters GPU qui fonctionnent jour et nuit dans une province du sud de la Chine.
Cette course n'a pas de compte à rebours, elle se déroule 24 heures sur 24, l'unité est le Token, le champ de bataille est le terminal de chaque développeur.







