Auteur | Astronaute du Codage
Les Tokens sont chers, et les voir brûler fait mal au cœur.
Ce n'est pas seulement le cri du cœur des adeptes du Vibe Coding actuel, même les grandes entreprises de la Silicon Valley qui prônaient auparavant avec ferveur le Tokenmaxxing commencent à imposer des limites de Tokens à leurs employés.
Mais, fait contre-intuitif, les Tokens que vous utilisez actuellement avec un abonnement IA, chers utilisateurs, ont en fait déjà été subventionnés par les grands acteurs de l'IA, avec des subventions pouvant atteindre jusqu'à 70 fois le prix de l'abonnement !
Ce qui est peut-être plus inquiétant, c'est qu'OpenAI et Anthropic, deux leaders de l'IA, sont entrés dans la dernière ligne droite avant leur introduction en bourse. Une fois les deux sociétés cotées,
vont-elles, comme après la « guerre des subventions » de l'ère Internet, commencer à augmenter leurs prix, laissant le prix des Tokens revenir à la raison ?
La bonne nouvelle, c'est que cela pourrait ne pas arriver. Récemment, Bill Maris, fondateur de Google Ventures, a posé une question dans le podcast All-in :
Si Google décidait de réduire le prix des tokens de 80 % supplémentaires, comment OpenAI et Anthropic réagiraient-elles ?
Coïncidence, peu de temps auparavant, l'équipe de startup Agnes AI, lors d'un live avec GeekPark, expliquait en détail l'ère potentielle du « Token gratuit » à venir.
Alors, à l'avenir, le prix des Tokens va-t-il augmenter ou baisser ? Et qu'est-ce que cela signifie pour les personnes déjà accros à l'IA ?
01 La guerre des subventions aux Tokens est à son paroxysme
Pourquoi dire que le prix actuel des Tokens n'est en réalité pas cher ?
Parce qu'au moins dans le modèle d'abonnement IA, les prix actuels des différentes entreprises d'IA sont déjà des « prix cassés » après subvention.
Récemment, SemiAnalysis a évalué en détail la comparaison entre la valeur réelle des Tokens consommés et les frais d'abonnement dans les modèles d'abonnement d'OpenAI et d'Anthropic.
SemiAnalysis a fait une chose simple mais efficace : utiliser réellement l'IA pour accomplir diverses tâches dans le cadre des offres d'abonnement des différentes plateformes d'IA, puis calculer rétroactivement la valeur en tokens de ces tâches en utilisant la tarification publique des API. Les résultats sont les suivants :
Notez une régularité : plus l'offre est chère, plus le multiplicateur de subvention est élevé. Cela montre en soi que ces offres haut de gamme ne visent pas à générer des bénéfices - elles constituent une « tarification inversée », utilisant les pertes les plus agressives pour retenir les utilisateurs les plus intensifs. Car les utilisateurs intensifs sont des développeurs, des décideurs d'entreprise ; une fois qu'ils sont liés à une plateforme, ils peuvent entraîner toute une équipe et toute une ligne de produits.
Pourquoi continuer alors que les pertes sont si importantes ? La réponse standard est : brûler de l'argent d'abord pour acquérir de l'échelle, puis augmenter les prix une fois l'échelle atteinte pour récupérer l'investissement. C'est ainsi que l'Internet mobile a fonctionné - DiDi et Uber ont subventionné des dizaines de milliards de yuans de courses, et les tarifs ont augmenté après la fin des subventions ; Meituan a subventionné d'innombrables repas, et les frais de livraison ont augmenté après la fin des subventions. Pour que cette logique tienne, une condition préalable est cruciale : l'effet de verrouillage créé pendant la période de subvention.
DiDi peut augmenter ses prix parce que les chauffeurs ne peuvent pas se passer du flux de commandes sur la plateforme, et les passagers ne peuvent pas se passer des chauffeurs sur la plateforme. Meituan peut augmenter ses prix parce que les commerçants ne peuvent pas se passer de son trafic et de son réseau logistique. À la fin des subventions, les utilisateurs sont déjà « verrouillés » dans l'écosystème, avec des coûts de changement extrêmement élevés.
Mais la guerre de l'IA diffère fondamentalement de celle d'Internet sur un point : le Token n'a pratiquement aucun effet de verrouillage.
Si Claude augmente ses prix, les développeurs peuvent migrer les appels d'API vers GPT ou Gemini en une journée - les interfaces des différents acteurs sont de plus en plus standardisées, de nombreux frameworks de développement intègrent même des fonctionnalités de basculement multi-modèles. Pour l'utilisateur lambda, c'est encore plus simple : il suffit de changer d'URL. L'IA n'a pas, comme le transport de personnes, un réseau local de chauffeurs, ni comme la livraison de repas un système de distribution, ni comme les médias sociaux un réseau d'amis. Un Token est un token, quel que soit son producteur, c'est la même chose.
Cela signifie qu'une fois les subventions arrêtées, les utilisateurs peuvent fuir instantanément. Les subventions ne « construisent pas une barrière », elles ressemblent plus à un « maintien en vie » - dès qu'un concurrent propose un prix inférieur, les utilisateurs partent.
Et cela sans même prendre en compte une nouvelle variable qui fait exploser les factures de tout le monde : l'Agent IA.
Lorsque vous discutez avec ChatGPT, une conversation peut consommer quelques milliers de tokens. Mais lorsque vous demandez à un Agent IA d'exécuter une tâche complexe - écrire un code puis le déboguer automatiquement, analyser un document de plusieurs dizaines de pages puis générer un rapport - la consommation de tokens pour une session peut être de 5 à 30 fois supérieure à celle d'une conversation normale. Des développeurs ont testé en conditions réelles : sur le plan Claude Max à 100 dollars, une seule session de programmation avec Agent peut brûler pour près de 100 dollars de tokens. Le CTO d'Uber a récemment révélé que l'entreprise avait épuisé son budget IA pour toute l'année 2026 en seulement quatre mois.
La question est : cette guerre des subventions aux Tokens peut-elle durer ? Qui pourrait être encore debout à la fin de cette mêlée générale ?
Bill Maris pense que la réponse est évidemment les géants traditionnels.
02 Le Token comme arme
Pour comprendre la véritable cruauté de cette guerre de subventions, il faut d'abord percevoir une asymétrie structurelle : les sources de munitions des différents combattants sont totalement différentes.
Les revenus publicitaires annuels de Google dépassent 300 milliards de dollars. Ce n'est pas de l'argent donné par des investisseurs, ce n'est pas de l'argent brûlé après un financement, c'est une véritable machine à imprimer de l'argent qui fonctionne automatiquement chaque jour. Des milliards de personnes dans le monde ouvrent quotidiennement le moteur de recherche, regardent YouTube, utilisent Gmail, et l'argent de la publicité s'écoule automatiquement sur le compte. Google n'a pas besoin de présenter son projet, de séduire des analystes, d'expliquer à qui que ce soit pourquoi il dépense cet argent.
Google utilisant ses bénéfices publicitaires pour subventionner les tokens d'IA, c'est comme si une personne possédant des puits de pétrole déclenchait une guerre des prix sur les stations-service - son pétrole sort de son propre sol, tandis que celui de ses adversaires est acheté avec des prêts bancaires.
OpenAI et Anthropic sont précisément ceux qui achètent du pétrole à crédit.
OpenAI a levé plus de 1800 milliards de dollars cumulés, avec une valorisation récente dépassant 8500 milliards de dollars. Anthropic a levé plus de 1300 milliards de dollars. Cet argent provient de capital-risque et d'investisseurs stratégiques - ils ne donnent pas cet argent par charité, ils espèrent que ces entreprises entreront en bourse et obtiendront un retour sur investissement substantiel à la sortie.
Et c'est après l'introduction en bourse que les vrais ennuis commencent. Être coté signifie que les états financiers sont publics pour le monde entier. Chaque trimestre, les analystes de Wall Street scrutent les revenus, les bénéfices, le coût d'acquisition des clients, le coût marginal. Lorsqu'ils calculent que vous perdez réellement 70 dollars pour chaque dollar de frais d'abonnement reçu - même l'histoire de croissance la plus brillante ne soutiendra pas le cours de l'action.
Bill Maris a exposé cette logique très clairement dans le podcast. Ses propres mots étaient : « Si j'étais Google, et que je décidais de baisser arbitrairement le prix des tokens de 80 %, qu'arriverait-il au modèle économique d'OpenAI et d'Anthropic ? »
L'animateur a demandé quelle était la probabilité que cela arrive. Maris n'a pas hésité : « 100 %. Le capital comme arme, les tokens comme arme. »
Ce n'est pas une spéculation d'analyste. Bill Maris est le fondateur et PDG de Google Ventures, ancien vice-président des projets spéciaux de Google, ayant incubé Waymo et Google X. Tous les présents comprenaient : ce n'est pas une hypothèse, c'est une stratégie qu'il a vue Google employer de ses propres yeux.
Le scénario qu'il décrit est simple : Google annonce une baisse de 80 % du prix de l'API Gemini. Que feront les clients entreprises ? Si la qualité des produits est similaire - et dans de nombreux benchmarks, Gemini est déjà à peu près équivalent à Claude et GPT - mais que le prix est cinq fois moins cher, continueriez-vous à utiliser le plus cher ?
Maris a lui-même donné la réponse : « Si vous êtes une entreprise, et que vous pouvez payer 80 % de moins chez Google et Gemini pour un produit fondamentalement identique, pourquoi ne le feriez-vous pas ? Et la pression sur ces entreprises [OpenAI et Anthropic] deviendrait alors extrêmement sévère. »
Et OpenAI et Anthropic n'ont pratiquement aucun moyen de riposte symétrique. Elles ne peuvent pas suivre la baisse des prix - elles n'ont pas de machine à imprimer de l'argent, chaque dollar est l'argent de leurs investisseurs. Elles ne peuvent pas non plus maintenir une prime basée sur un écart technologique - les écarts entre les grands modèles se réduisent rapidement, si vous avez trois mois d'avance aujourd'hui, vous serez rattrapé dans trois mois. Ce n'est pas comme l'écart technologique d'une génération entre l'iPhone et Nokia. Les fossés entre les modèles d'IA ressemblent plus à des digues faites de sable, que la marée haute franchit facilement.
Dans le récit de Bill, Google a de grandes chances de gagner. Mais dans le monde de l'IA, Google peut-il vraiment monopoliser ? Meta peut à tout moment open-sourcer un modèle gratuit, la Chine a DeepSeek et ByteDance, Amazon pousse son propre modèle. Lorsque vous baissez le prix des tokens à un niveau dérisoire, les concurrents ne disparaissent pas - ils baissent aussi leurs prix.
La guerre de l'IA pourrait n'avoir aucun gagnant.
03 Le « jeu infini » du Token ?
Même les personnes les moins familiarisées avec l'histoire peuvent probablement prédire l'issue finale de la guerre actuelle de l'IA de la manière suivante :
Le premier scénario est celui du « service Internet » - l'histoire de DiDi, l'histoire d'Amazon : d'abord des subventions, puis un monopole, et enfin des augmentations de prix pour récolter les bénéfices. Dans ce scénario, la guerre des prix actuelle n'est qu'un prélude, et un ou deux gagnants finiront par dominer la plus grande partie du marché, obtenant ainsi un pouvoir de fixation des prix. Si c'est le cas, les pertes colossales actuelles constituent un investissement rentable - tout comme Amazon a perdu de l'argent pendant vingt ans avant de finalement devenir le double champion du commerce électronique et du cloud computing.
Le deuxième scénario est celui des « services publics » (eau, électricité, gaz). Le Token devient une ressource de base standardisée, comme l'électricité, la bande passante ou le stockage cloud. Personne ne peut maintenir un pouvoir de fixation des prix à long terme, car la différenciation des produits est trop faible et les coûts de changement trop bas. La concurrence pousse le prix indéfiniment vers le coût de production, et la marge bénéficiaire tend vers zéro. Finalement, les gouvernements pourraient intervenir pour réguler - comme ils l'ont fait il y a cent ans pour l'électricité et les télécommunications.
La distinction entre les deux scénarios dépend d'un mot :
Verrouillage .
DiDi peut augmenter ses prix parce que les passagers sont verrouillés dans le réseau de chauffeurs, et les chauffeurs sont verrouillés dans le flux de commandes. Amazon peut augmenter ses prix parce que les commerçants sont verrouillés dans son écosystème logistique et de trafic.
L'effet de verrouillage est la pierre angulaire du modèle « d'abord des pertes, puis des profits » .
Mais le token d'IA - comme cela a été démontré à plusieurs reprises - n'a pratiquement aucun verrouillage. Les API sont standardisées, le coût de changement est pratiquement nul. La condition centrale pour que le premier scénario se réalise n'existe pas pour le produit qu'est le token.
Si le deuxième scénario, l'aboutissement en « infrastructure de service public », est plus proche de la réalité, ce dont nous sommes témoins n'est pas une guerre qui finira par avoir un vainqueur, mais une compétition d'usure sans fin.
Wang Xing, fondateur de Meituan, a déjà décrit cet état de compétition. Sa perspicacité était la suivante : certaines compétitions n'ont pas le concept de « gagner ». L'objectif des participants n'est pas de battre l'adversaire, mais de s'assurer qu'ils restent à la table de jeu. Parce que tant que vous êtes à la table, vous pouvez continuer à lever des fonds, recruter, itérer. Quitter la table est la seule façon de perdre.
En réexaminant le paysage actuel de l'IA à travers ce cadre, beaucoup de choses apparemment contradictoires deviennent soudainement claires.
La dernière valorisation d'OpenAI à plus de 8 000 milliards de dollars n'est pas due au coût nécessaire pour entraîner les modèles. Elle a besoin de tant d'argent pour continuer la guerre des prix. Lever des fonds, ce n'est pas pour gagner, c'est pour « avoir le droit de continuer à se battre ».
Google se prépare à baisser le prix des tokens de 80 %, non pas pour éliminer OpenAI et Anthropic. C'est pour s'assurer qu'il reste un joueur central à l'ère de l'IA - tout comme il s'était assuré de ne pas être laissé en dehors de l'ère mobile grâce à Android gratuit.
Et Anthropic, en augmentant le prix de l'API de son dernier modèle phare, Fable 5, au double de la génération précédente - 10 dollars par million de tokens en entrée, 50 dollars par million en sortie - semble « augmenter les prix », mais en réalité, elle sélectionne activement les clients entreprises prêts à payer pour des capacités haut de gamme, car elle sait très bien qu'elle ne peut pas gagner la guerre des subventions du côté consommateur contre Google.
Chaque round de guerre des prix élargit l'échelle d'utilisation de l'IA. Une plus grande échelle signifie plus de données, plus de scénarios, plus de développeurs entrant dans l'écosystème. Cela renforce à son tour les modèles de tous les participants. Les combattants utilisent la guerre elle-même pour attirer des ressources et s'améliorer - ce n'est pas un jeu à somme nulle où l'un doit mourir pour que l'autre vive, mais un processus où tout le monde devient plus fort grâce à la compétition, mais où il est également peu probable que quiconque réalise des profits faramineux.
Cela ne ressemble-t-il pas à ce qu'est finalement devenu le secteur de l'électricité ?
Il y a 140 ans, Edison et Westinghouse pensaient tous deux se disputer un marché où le gagnant raflerait tout. Ils ont mis toute leur fortune en jeu, pariant sur « celui qui définirait la norme pour l'électricité posséderait l'électricité ». Mais le destin de l'électricité nous enseigne une leçon simple :
Lorsqu'une technologie est suffisamment importante, suffisamment universelle, suffisamment standardisée, elle n'appartient plus à une seule entreprise. Elle appartient aux infrastructures .
La compétition dans l'IA, en surface, semble être Google contre OpenAI contre Anthropic, une bataille de capacités des modèles, une lutte d'échelle de financement. Mais en prenant du recul, le véritable rôle de cette compétition est le suivant : elle accélère la transformation de l'IA en une couche d'infrastructure qu'aucune entreprise ne pourra monopoliser.
Lorsque Bill Maris dit « cela arrivera à 100 % », il ne prédit peut-être pas seulement que Google baissera ses prix. Il prédit peut-être, sans s'en rendre compte, une tendance plus large - dans le monde de l'IA, le token n'appartiendra finalement à personne. Tout comme aujourd'hui, personne ne « possède » l'électricité.
Pour OpenAI et Anthropic, cela signifie quelque chose de dérangeant : même avec une avance technologique, même avec des financements colossaux, l'avenir de « gagner beaucoup d'argent avec l'IA » qu'elles poursuivent pourrait ne pas avoir existé dès le départ. Elles ne font pas face à une guerre des prix temporaire, mais à un destin structurel - ce qu'elles s'efforcent de construire est, par nature, peut-être la prochaine génération d'eau, d'électricité et de routes.
Et pour les utilisateurs, dans une certaine mesure, c'est peut-être une bonne nouvelle. Car tant que la guerre des subventions aux Tokens continue, les gens peuvent toujours profiter de la « bonne affaire » d'une puissance de calcul de 400 dollars pour un coût de 20 dollars.






