Les Tokens sont chers, et les brûler est douloureux pour le portefeuille.
Ce n’est pas seulement le sentiment des adeptes actuels du Vibe Coding, même les grandes entreprises de la Silicon Valley qui prônaient auparavant frénétiquement le Tokenmaxxing ont commencé à imposer des limites de tokens à leurs employés.
Mais un point contre-intuitif est qu’actuellement, pour les utilisateurs d’abonnements d’IA, les tokens que vous utilisez ont déjà été subventionnés par les grands acteurs de l’IA, et la subvention maximale pourrait même être jusqu’à 70 fois le prix de l’abonnement !
Ce qui est encore plus inquiétant, c’est qu’OpenAI et Anthropic, deux leaders de l’IA, sont entrés dans la phase de course à l’introduction en bourse. Une fois que ces deux sociétés seront cotées en bourse,
se pourrait-il, comme après la « guerre des subventions » de l’ère internet, que les entreprises restantes commencent à augmenter leurs prix, ramenant le prix des tokens à un niveau « rationnel » ?
La bonne nouvelle, c’est que cela pourrait ne pas se produire. Récemment, Bill Maris, fondateur de Google Ventures, a posé une question dans le podcast All-in :
Si Google décidait de réduire le prix des tokens de 80 %, comment OpenAI et Anthropic réagiraient-elles ?
De manière coïncidente, peu de temps auparavant, l’équipe de la start-up Agnes AI, lors d’un direct avec GeekPark, a expliqué en détail l’ère possible du « token gratuit » qui pourrait arriver.
Alors, le prix des tokens va-t-il monter ou baisser à l’avenir ? Et qu’est-ce que cela signifie pour les personnes déjà accros à l’IA ?
01 La guerre des subventions de tokens fait rage
Pourquoi dire que le prix actuel des tokens n’est pas vraiment élevé ?
Parce qu’au moins dans le modèle d’abonnement à l’IA, les prix actuels des différentes entreprises d’IA sont déjà des « prix cassés » après subvention.
Récemment, SemiAnalysis a mené une analyse détaillée comparant la valeur réelle des tokens consommés avec les frais d’abonnement dans les modèles d’abonnement d’OpenAI et d’Anthropic.
SemiAnalysis a fait quelque chose de simple mais efficace : utiliser l’IA pour accomplir diverses tâches dans le cadre des plans d’abonnement de différentes plateformes d’IA, puis utiliser les tarifs publics de l’API pour calculer la valeur en tokens de ces tâches. Voici les résultats :
Remarquez une règle : plus le forfait est cher, plus le multiple de subvention est élevé. Cela montre en soi que ces forfaits haut de gamme ne visent pas à générer des profits – ils sont une forme de « tarification inversée », utilisant les pertes les plus agressives pour retenir les utilisateurs les plus intensifs. Car ces utilisateurs intensifs sont des développeurs, des décideurs d’entreprise ; une fois qu’ils sont liés à une plateforme, ils peuvent y amener toute leur équipe et toute leur chaîne de produits.
Si les pertes sont si importantes, pourquoi continuer ? La réponse standard est : d’abord perdre de l’argent pour gagner en taille, puis augmenter les prix une fois la taille atteinte pour se refinancer. C’est ainsi que l’internet mobile a fonctionné – Didi et Uber ont subventionné des milliards de yuans de courses, et après la fin des subventions, les prix des courses ont augmenté ; Meituan a subventionné d’innombrables livraisons de repas, et après la fin des subventions, les frais de livraison ont augmenté. Pour que cette logique tienne, une condition clé est : l’effet de verrouillage s’est établi pendant la période de subvention.
Didi a pu augmenter ses prix parce que les chauffeurs dépendent des commandes sur la plateforme, et les passagers dépendent des chauffeurs sur la plateforme. Meituan a pu augmenter ses prix parce que les commerçants dépendent de son flux de clients et de son réseau de livraison. À la fin des subventions, les utilisateurs sont déjà « verrouillés » dans l’écosystème, et le coût de basculement est extrêmement élevé.
Mais la grande différence entre la guerre de l’IA et celle de l’internet est la suivante – les tokens n’ont pratiquement aucun effet de verrouillage.
Si Claude augmente ses prix, les développeurs peuvent migrer leurs appels API vers GPT ou Gemini en une journée – les interfaces des différents acteurs sont de plus en plus standardisées, de nombreux frameworks de développement intègrent même des fonctionnalités de basculement multi-modèles. Pour les utilisateurs ordinaires, c’est encore plus simple : il suffit de changer d’adresse web. L’IA n’a pas de réseau local de chauffeurs comme le covoiturage, pas de système de livraison comme la restauration à emporter, pas de réseau social avec une chaîne de relations amicales. Un token est un token, quel que soit son producteur, c’est la même chose.
Cela signifie qu’une fois les subventions arrêtées, les utilisateurs peuvent se volatiliser instantanément. Les subventions ne servent pas à « construire des barrières », mais ressemblent plus à « maintenir un battement de cœur » – dès que quelqu’un propose un prix inférieur, les utilisateurs partent.
Et cela sans compter une nouvelle variable qui fait perdre le contrôle des factures à tout le monde : les Agents IA.
Lorsque vous discutez avec ChatGPT, une conversation peut consommer quelques milliers de tokens. Mais lorsque vous demandez à un Agent IA d’exécuter une tâche complexe – écrire un code et le déboguer automatiquement, analyser un document de plusieurs dizaines de pages puis générer un rapport – une seule session peut consommer 5 à 30 fois plus de tokens qu’une conversation ordinaire. Des développeurs ont testé : sur le plan Claude Max à 100 dollars, une seule session de programmation par Agent peut brûler des tokens d’une valeur proche de cent dollars. Le CTO d’Uber a récemment révélé que l’entreprise a épuisé le budget annuel 2026 dédié à l’IA en seulement quatre mois.
La question est : une telle guerre des subventions de tokens peut-elle durer ? Qui pourrait être celui qui reste debout à la fin du chaos ?
Bill Maris pense que la réponse est clairement les géants traditionnels.
02 Le Token comme arme
Pour comprendre la véritable brutalité de cette guerre des subventions, il faut d’abord voir une asymétrie structurelle – les sources de munitions des différents belligérants sont totalement différentes.
Les revenus publicitaires annuels de Google dépassent 300 milliards de dollars. Ce n’est pas de l’argent fourni par des investisseurs, pas de l’argent brûlé suite à un financement, mais une presse à billets qui fonctionne automatiquement chaque jour. Des milliards de personnes dans le monde ouvrent chaque jour le moteur de recherche, regardent YouTube, utilisent Gmail, et l’argent de la publicité s’écoule automatiquement sur le compte. Google n’a pas besoin de faire de roadshow, de plaire aux analystes, ni d’expliquer à quiconque pourquoi il dépense cet argent.
Que Google subventionne les tokens d’IA avec ses bénéfices publicitaires, c’est comme si une personne possédant un puits de pétrole menait une guerre des prix dans les stations-service – son pétrole sort de son propre sol, tandis que le pétrole de ses concurrents est acheté avec des prêts bancaires.
OpenAI et Anthropic sont ces personnes qui achètent du pétrole à crédit.
OpenAI a levé plus de 180 milliards de dollars au total, avec une dernière valorisation dépassant 850 milliards de dollars. Anthropic a levé plus de 130 milliards de dollars. Cet argent provient de capital-risque et d’investisseurs stratégiques – ils ne donnent pas cet argent par charité, ils comptent sur l’introduction en bourse de ces entreprises, sur un retour sur investissement lucratif lors de leur sortie.
Et une fois cotées en bourse, les ennuis commencent vraiment. Être coté signifie que les états financiers sont publics pour le monde entier. Chaque trimestre, les analystes de Wall Street scrutent les revenus, les bénéfices, le coût d’acquisition des clients, les coûts marginaux. Quand ils calculent que vous perdez réellement 70 dollars pour chaque dollar de frais d’abonnement perçu – même la plus brillante histoire de croissance ne pourra soutenir le cours de l’action.
Bill Maris a exprimé cette logique très clairement dans le podcast. Ses propres mots étaient : « Si j’étais Google et que je décidais de réduire arbitrairement le prix des tokens de 80 %, que se passerait-il pour le modèle économique d’OpenAI et d’Anthropic ? »
L’animateur a demandé quelle était la probabilité. Maris n’a pas hésité : « 100 %. Le capital comme une arme, les tokens comme une arme. »
Ce n’est pas une spéculation d’analyste. Bill Maris est le fondateur et CEO de Google Ventures, et également vice-président des projets spéciaux chez Google, ayant incubé Waymo et Google X. Tous les présents comprennent : ce n’est pas une hypothèse, c’est quelque chose qu’il a vu Google faire en temps de guerre.
Le scénario qu’il décrit est simple : Google annonce une baisse de prix de 80 % pour l’API Gemini. Que feront les clients entreprises ? Si la qualité des produits est similaire – dans de nombreux tests de référence, Gemini est déjà au coude-à-coude avec Claude et GPT – mais que le prix est cinq fois moins cher, continueriez-vous à utiliser celui qui est plus cher ?
Maris donne lui-même la réponse : « Si vous êtes une entreprise et que vous pouvez payer 80 % de moins chez Google et Gemini pour acheter un produit essentiellement identique, pourquoi ne le feriez-vous pas ? Et alors la pression sur ces entreprises deviendra très sévère. »
Et OpenAI et Anthropic n’ont pratiquement aucun moyen de riposte symétrique. Elles ne peuvent pas suivre la baisse des prix – elles n’ont pas de presse à billets, chaque dollar est l’argent des investisseurs. Elles ne peuvent pas non plus maintenir une prime grâce à un écart technologique – l’écart entre les grands modèles se réduit rapidement, aujourd’hui vous avez trois mois d’avance, et dans trois mois vous serez rattrapés. Ce n’est pas comme l’écart générationnel entre l’iPhone et Nokia. Les douves entre les modèles d’IA ressemblent plus à des digues de sable, que la marée submerge à la première montée.
Dans le récit de Bill, Google a de grandes chances de gagner, mais dans le monde de l’IA, Google peut-il vraiment monopoliser ? Meta peut à tout moment ouvrir un modèle gratuit, la Chine a DeepSeek et ByteDance, Amazon pousse son propre modèle. Lorsque vous réduisez le prix des tokens à celui d’un bien de première nécessité, les concurrents ne disparaissent pas – eux aussi baissent leurs prix.
Dans la guerre de l’IA, il se pourrait qu’il n’y ait pas de gagnant.
03 Le « jeu infini » du Token ?
Même ceux qui ne connaissent pas bien l’histoire peuvent plus ou moins tirer la conclusion suivante sur l’issue finale de la guerre actuelle de l’IA :
Le premier scénario est celui des « services internet » – l’histoire de Didi, l’histoire d’Amazon : d’abord des subventions, puis un monopole, puis une augmentation des prix pour récolter les bénéfices. Dans ce scénario, la guerre des prix actuelle n’est que le prologue, et finalement un ou deux gagnants occuperont la plus grande part du marché et obtiendront un pouvoir de fixation des prix. Si c’est le cas, les pertes énormes actuelles sont un investissement rentable – tout comme Amazon a perdu de l’argent pendant vingt ans avant de devenir le double champion du e-commerce et du cloud computing.
Le deuxième scénario est celui des « services publics » (eau, électricité, gaz). Le token devient une ressource de base standardisée, comme l’électricité, la bande passante, le stockage cloud. Personne ne peut maintenir un pouvoir de fixation des prix à long terme, car la différenciation des produits est trop faible et le coût de basculement trop bas. La concurrence pousse les prix vers le niveau des coûts, et les marges bénéficiaires tendent vers zéro. Finalement, le gouvernement pourrait intervenir pour réguler – comme il l’a fait il y a cent ans avec l’électricité et les télécommunications.
La différence entre les deux scénarios dépend d’un mot :
Verrouillage.
Didi peut augmenter ses prix parce que les passagers sont verrouillés dans le réseau de chauffeurs, et les chauffeurs sont verrouillés dans le flux de commandes. Amazon peut augmenter ses prix parce que les commerçants sont verrouillés dans son écosystème logistique et de flux de clients.
L’effet de verrouillage est la pierre angulaire du modèle « d’abord perdre, puis gagner ».
Mais le token d’IA – comme argumenté à plusieurs reprises – n’a pratiquement pas de verrouillage. Les API sont standardisées, le coût de basculement est proche de zéro. La condition centrale pour que le premier scénario se réalise n’existe pas pour le produit qu’est le token.
Si le deuxième scénario, l’issue finale d’infrastructure de type « services publics », est plus proche de la réalité, ce que nous sommes en train de vivre n’est pas une guerre qui finira par avoir un vainqueur, mais une course d’usure sans fin.
Wang Xing, le fondateur de Meituan, a un jour décrit cet état de concurrence. Sa perspicacité était : certaines concurrences n’ont pas de concept de « victoire ». L’objectif des participants n’est pas de battre l’adversaire, mais de s’assurer de rester à la table de jeu. Parce que tant que vous êtes à la table, vous pouvez continuer à lever des fonds, recruter, itérer. Quitter la table est la seule façon de perdre.
En réexaminant le paysage actuel de l’IA à travers ce cadre, beaucoup de choses apparemment contradictoires deviennent soudain claires.
La dernière valorisation d’OpenAI dépasse 800 milliards de dollars, non pas parce qu’entraîner un modèle coûte autant d’argent. Elle a besoin de tant d’argent pour continuer la guerre des prix. Lever des fonds n’est pas pour gagner, c’est pour « avoir le droit de continuer à se battre ».
Que Google envisage de réduire le prix des tokens de 80 % n’est pas pour éliminer OpenAI et Anthropic. C’est pour s’assurer de rester un joueur central à l’ère de l’IA – tout comme il avait assuré de ne pas être exclu de l’ère mobile grâce à Android gratuit.
Et qu’Anthropic ait augmenté le prix de l’API de son dernier modèle phare, Fable 5, à deux fois celui de la génération précédente – 10 dollars par million de tokens en entrée, 50 dollars par million en sortie – semble être une « augmentation de prix », mais en réalité, c’est un filtrage actif des clients entreprises prêts à payer pour des capacités haut de gamme, car ils savent pertinemment : la guerre des subventions pour les consommateurs finaux est une bataille qu’ils ne peuvent gagner contre Google.
Chaque tour de guerre des prix élargit l’échelle d’utilisation de l’IA. Une échelle élargie signifie plus de données, plus de scénarios, plus de développeurs entrant dans l’écosystème. Cela rend à son tour les modèles de tous les participants plus forts. Les belligérants utilisent la guerre elle-même pour attirer des ressources et s’améliorer – ce n’est pas un jeu à somme nulle où l’un gagne et l’autre perd, mais un processus où tout le monde devient plus fort grâce à la concurrence, mais où il est peu probable que quiconque réalise des profits faramineux.
Cela ne ressemble-t-il pas à ce qu’est finalement devenu le secteur de l’électricité ?
Il y a 140 ans, Edison et Westinghouse pensaient tous deux qu’ils se disputaient un marché où le gagnant raflait tout. Ils ont mis toutes leurs économies, pariant sur « celui qui définit la norme de l’électricité possède l’électricité ». Mais le destin de l’électricité nous apprend une leçon simple :
Lorsqu’une technologie est suffisamment importante, suffisamment générique, suffisamment standardisée, elle n’appartient plus à une seule entreprise. Elle appartient aux infrastructures.
La concurrence dans l’IA, en apparence, est Google contre OpenAI contre Anthropic, c’est une compétition de capacités des modèles, une comparaison d’échelles de financement. Mais en reculant la caméra, le véritable effet de cette compétition est : elle accélère la poussée de l’IA vers un niveau d’infrastructure qu’aucune entreprise ne pourra monopoliser.
Lorsque Bill Maris dit « 100 % de chances que cela se produise », il ne prédit peut-être pas seulement que Google baissera ses prix. Il prédit peut-être inconsciemment une tendance plus large – dans le monde de l’IA, le token n’appartiendra finalement à personne. Comme aujourd’hui, personne ne « possède » l’électricité.
Pour OpenAI et Anthropic, cela signifie une chose inquiétante : même avec une avance technologique, même avec des financements colossaux, le futur qu’elles poursuivent – « gagner beaucoup d’argent avec l’IA » – pourrait ne jamais avoir existé. Elles ne font pas face à une guerre des prix temporaire, mais à un destin structurel – ce qu’elles s’efforcent de construire est, par nature, peut-être la prochaine génération d’eau, d’électricité et de routes.
Et pour les utilisateurs, dans une certaine mesure, c’est peut-être une bonne nouvelle. Car tant que la guerre des subventions de tokens continue, les gens pourront toujours profiter de la « bonne affaire » d’une puissance de calcul de 400 dollars pour un coût de 20 dollars.
Cet article provient du compte WeChat officiel « GeekPark » (ID : geekpark), auteur : Astronaute







