Le modèle d'abonnement sera vidé de sa substance, profitez-en tant qu'il est là.
Le 9 juin, Anthropic a publié son modèle public le plus puissant à ce jour, Claude Fable 5. Comme d'habitude, cela aurait dû être une fête pour les utilisateurs payants – l'argent que vous payez chaque mois vous donne enfin le droit de toucher le modèle phare en première main.
Mais une ligne dans l'annonce a immédiatement suscité une énorme controverse après sa publication : après le 22 juin, Fable 5 sera retiré de tous les plans d'abonnement, et son utilisation continue nécessitera l'achat séparé de crédits de consommation.
En d'autres termes, même si vous avez acheté un abonnement, le modèle phare ne vous est accessible que pendant 14 jours.
Un modèle livré avec une « notice d'expulsion » dès le jour de sa sortie, c'est une première dans l'industrie des grands modèles.
Beaucoup l'ont pris pour une erreur d'Anthropic, ou un acte d'arrogance. Mon avis est tout le contraire : ce n'est pas une erreur, c'est un avant-goût.
L'abonnement à l'IA se dirige vers une disparition inévitable – non pas à cause de la cupidité d'une entreprise, mais parce que la prémisse sur laquelle repose le modèle d'abonnement est en train d'être démantelée par l'IA elle-même.
01 Un modèle phare avec un compte à rebours de 14 jours
Commençons par les faits. Selon le calendrier officiel d'Anthropic (9 juin 2026), Fable 5 est inclus gratuitement dans les formules Pro, Max, Team et les versions Entreprise par siège à partir de sa date de sortie, jusqu'au 22 juin ; à partir du 23 juin, il sera retiré de ces plans, et chaque token utilisé par la suite sera facturé sur des crédits de consommation prépayés, au tarif exactement identique à celui de l'API.
Ce tarif n'est pas bon marché : 10 dollars par million de tokens en entrée, 50 dollars en sortie, soit exactement le double du précédent modèle phare, Opus 4.8. Plus subtil encore, même pendant la période d'accès gratuit, Fable 5 compte pour environ le double dans les quotas d'abonnement – pour la même tâche, il consomme le quota deux fois plus vite qu'Opus.
La réaction des utilisateurs est prévisible. Sur Hacker News, quelqu'un a déclaré sans détour que cette opération « donner puis reprendre » était inquiétante, soupçonnant qu'Anthropic voulait profiter de l'occasion pour pousser les utilisateurs abonnés vers la facturation à l'usage ; un développeur a même testé et constaté que sur le plan Max à 100 dollars par mois, une seule session de programmation avec agent avait consommé pour près de 100 dollars de tokens.
Et ce n'est pas l'action d'Anthropic seule. Au cours des huit dernières semaines, toute l'industrie a fait la même chose : OpenAI a changé le 2 avril la facturation de Codex de « par message » à « par token » aligné sur l'API, puis l'a étendu à toute sa clientèle entreprise existante.
GitHub a gelé le 20 avril les nouvelles inscriptions à la version personnelle de Copilot, annonçant une semaine plus tard le passage généralisé à une facturation par « AI Credits », effective au 1er juin – la formule Pro à 10 dollars de frais mensuels comprend désormais 10 dollars de crédits.
Les actions d'Anthropic ont été les plus nombreuses : à partir du 4 avril, interdiction aux frameworks d'agents tiers comme OpenClaw de consommer les quotas d'abonnement, ces usages passant à la facturation à l'usage ; le 21 avril, la colonne « Claude Code » sur la page tarifaire du plan Pro est discrètement devenue une croix rouge, provoquant un tollé dans la communauté avant d'être retirée sous 24 heures, l'explication officielle étant « un petit test sur environ 2% des nouveaux utilisateurs inscrits » ; annonce officielle le 14 mai qu'à partir du 15 juin, l'Agent SDK et les appels sans interface seraient retirés du pool d'abonnement et facturés via des crédits indépendants alignés sur les tarifs API.
Trois entreprises, huit semaines, la même direction – ce n'est pas une coïncidence, c'est toute l'industrie qui, face au même problème mathématique, a rendu la même réponse.
À quoi ressemble ce problème mathématique ?
02 Ce qui est tarifé, ce n'est jamais la puissance de calcul
L'institut de recherche SemiAnalysis a récemment exposé ce problème. Ils ont acheté chaque niveau d'abonnement d'Anthropic et d'OpenAI, ont exécuté des tâches de programmation longues jusqu'à épuisement des limites hebdomadaires, puis ont converti cette consommation au tarif API officiel : combien valait cette consommation.
La perception générale dans le secteur était qu'un forfait mensuel de 200 dollars pouvait tout au plus permettre de consommer pour environ 2000 dollars de tokens. Les résultats réels sont bien supérieurs : le Claude Pro à 20 dollars, une limite d'environ 400 dollars ; le Max 20x à 200 dollars, environ 8000 dollars.
Du côté d'OpenAI, c'est encore plus frappant – le ChatGPT Plus à 20 dollars peut atteindre environ 700 dollars, le Pro 20x à 200 dollars, environ 14000 dollars.
Deux remarques équitables doivent être faites : il s'agit de la valeur maximale « à limite atteinte », pas du niveau quotidien d'un utilisateur moyen ; le tarif API inclut une marge brute, et le chiffre converti n'est pas non plus égal au coût réel de la puissance de calcul.
Mais la tarification doit couvrir le maximum – une compagnie d'assurance ne peut pas supposer que personne n'aura d'accident.
Les subventions en elles-mêmes ne sont pas fatales. Les services de streaming en ont offert, les applications de VTC aussi, brûler de l'argent pour la croissance est un art ancestral d'Internet. Ce qui est vraiment fatal, c'est qu'il existe une différence fondamentale entre l'abonnement à l'IA et ces modèles.
Netflix peut vendre un abonnement mensuel grâce à deux choses : le coût marginal d'ajouter un film tend vers zéro, et une personne ne dispose au maximum que de 24 heures par jour pour regarder. Il en va de même pour Spotify. La prémisse implicite de l'abonnement mensuel, c'est que le volume de consommation est verrouillé par les limites physiologiques humaines – ce qui est réellement tarifé, ce n'est jamais le contenu, mais le temps des gens.
L'IA de l'ère des chatbots correspondait à peu près à cette prémisse. Une personne, aussi bavarde soit-elle, a une capacité limitée à taper au clavier en une journée ; les quotas largement inutilisés des utilisateurs légers suffisaient à couvrir la surconsommation des utilisateurs intensifs.
Puis, les Agents sont arrivés.
À quoi ressemble une tâche d'agent ? Elle lit 20 fichiers, planifie, modifie du code, exécute des tests, lit les erreurs, itère – en un seul cycle, la consommation de tokens est de 5 à 30 fois celle d'une conversation normale. Pire encore, elle n'a pas besoin de votre présence.
J'en ai fait l'expérience moi-même : récemment, j'ai demandé à un agent de compiler les données de vols de deux aéroports, je suis allé prendre une douche, à mon retour la tâche était terminée, et mon quota était épuisé. Vous dormez, le compteur tourne.
L'agent ne supprime pas le plafond de prix, mais le plafond de consommation. Et toute la direction de l'évolution de l'industrie de l'IA – des tâches plus longues, plus d'autonomie, plusieurs instances en parallèle – court vers le même point final :
Retirer complètement l'humain de la boucle de consommation.
GitHub l'a dit très clairement dans son annonce, l'usage par agent « devient la norme ». Autrement dit, la partie du scénario où l'abonnement pouvait encore à peine tenir, c'est-à-dire l'humain assis devant l'écran dialoguant phrase par phrase, ne représentera qu'une part de plus en plus faible dans la carte de valeur de l'IA.
À ce stade, certains demanderont : si la subvention est trop profonde, il suffit d'augmenter les prix, non ?
Ils l'ont fait, et ont obtenu un résultat encore pire. En regardant à nouveau le tableau de SemiAnalysis, il y a un détail anormal : plus le niveau tarifaire est élevé, plus le multiple de subvention est important.
Du côté de Claude, le multiple du niveau à 20 dollars est de 20 fois, celui du niveau à 200 dollars de 40 fois ; du côté d'OpenAI, il passe de 35 à 70 fois. La moitié est due à la conception tarifaire – les niveaux élevés amplifient les quotas par un multiple, ce qui équivaut à une remise pour les gros clients ; l'autre moitié est due au comportement des utilisateurs – ceux qui dépensent 200 dollars pour un forfait 20x, c'est justement pour l'utiliser à fond, les utilisateurs légers n'apparaissent tout simplement pas à ce niveau.
Cela a un nom dans le secteur de l'assurance : la sélection adverse. Lorsque la tarification d'une police d'assurance n'attire que les assurés présentant le risque le plus élevé, cette police n'a aucune chance de survie actuarielle. Tout prix fixe va filtrer avec précision les utilisateurs dont la consommation le dépasse – ce n'est pas un problème de gestion, c'est un problème structurel, ajuster les prix ne fera qu'affiner le filtre.
Pendant toute l'année 2025, l'industrie a en fait essayé tous les correctifs possibles. En janvier, Sam Altman a reconnu sur X que le ChatGPT Pro à 200 dollars par mois était déficitaire, car la consommation dépassait largement les attentes – l'augmentation des niveaux de prix a échoué.
Au milieu de l'année, Cursor est passé d'une facturation par requête à une facturation par puissance de calcul, provoquant des désabonnements massifs, le PDG s'est excusé publiquement – changer les règles en cours de route a échoué ; en été, Anthropic a ajouté des limites hebdomadaires à Claude Code, invoquant le fait que certains utilisateurs faisaient tourner des agents 24h/24, la puissance de calcul consommée par une seule personne atteignant des dizaines de milliers de dollars – la limitation du débit n'a attiré que la colère.
Après l'échec de tous les correctifs, est venu ce règlement de comptes collectif des huit dernières semaines. Nick Turley, responsable de ChatGPT chez OpenAI, a été clair dans le podcast BG2 : « À l'ère actuelle, proposer un forfait illimité, c'est probablement comme proposer un forfait illimité d'électricité. »
03 L'enveloppe est là, le noyau est déjà mort
Bien sûr, il existe également une objection qui semble solide : l'abonnement se porte apparemment très bien. ChatGPT Plus reste à 20 dollars par mois, Claude Pro est toujours en vente, même l'autocomplétion de code de GitHub conserve un forfait mensuel. Cette prétendue disparition, ne serait-ce pas de l'alarmisme ?
Cette objection mérite d'être prise au sérieux, car le phénomène qu'elle décrit est réel. Mais elle se trompe sur ce qui est en train de mourir.
L'âme de l'abonnement n'a jamais été la forme « un prélèvement mensuel », mais la promesse « prix fixe, utilisation tranquille » – vous n'avez pas à calculer le coût de chaque utilisation, c'était précisément tout l'argument qui lui a permis de vaincre le paiement à l'acte à l'époque.
Et ce qui se passe maintenant, c'est que : la périodicité de paiement reste, mais la promesse est retirée.
Dans les 10 dollars de frais mensuels du GitHub Pro, il y a 10 dollars de crédits, épuisables – ce n'est pas un abonnement, c'est une carte prépayée habillée en abonnement. Les crédits d'Anthropic sont débités au tarif API, ceux d'OpenAI supportent le rechargement automatique. L'abonnement ne sera pas supprimé, il sera vidé : l'enveloppe est là, le noyau est déjà mort.
Il reste un véritable îlot : la conversation pure. La raison pour laquelle elle peut encore être en forfait mensuel, c'est qu'elle est le dernier scénario de l'IA où la consommation est encore verrouillée par le temps humain. Mais une douve ne protège pas un îlot – chaque centime investi en R&D dans cette industrie pousse l'IA de « vous posez une question, elle répond » vers « elle vous aide activement à accomplir ».
L'abonnement à la conversation ne sera pas tué, il sera marginalisé : il restera sur place, regardant la valeur réelle et les revenus réels migrer petit à petit vers le monde de la facturation à l'usage.
Il est aussi difficile d'ignorer une coïncidence temporelle : selon un rapport de TechCrunch (juin 2026), au moment de la sortie de Fable 5, Anthropic se préparait à entrer en bourse en même temps qu'OpenAI. Au cours des trois dernières années, les subventions ont été payées par le capital-risque ; les investisseurs du marché public n'accepteront pas un compte de résultats où « chaque utilisateur intensif supplémentaire engendre une perte supplémentaire ». Le calendrier de retrait des capitaux détermine que le règlement de comptes ne peut être repoussé indéfiniment.
Cela signifie différentes choses pour différentes personnes. Pour les entreprises, les dépenses en IA devront désormais être gérées comme les dépenses cloud – selon un rapport de The Information, le CTO d'Uber a déclaré dans une note interne que la société avait épuisé en quatre mois le budget IA prévu pour toute l'année 2026. Établir des budgets, installer des outils de monitoring, router les modèles par tâche, deviendra un savoir-faire obligatoire pour chaque équipe.
Pour les utilisateurs individuels, auparavant les utilisateurs légers subventionnaient les utilisateurs intensifs, maintenant, chacun paie pour son propre compteur.
Pour être honnête, ce n'est pas forcément une mauvaise chose. Une fois le signal prix revenu, « cette tâche vaut-elle la peine de faire tourner l'IA ? » devient pour la première fois une vraie question – et lorsqu'une industrie commence à répondre sérieusement à cette question, c'est souvent le début de son détachement du récit de la « croissance à tout prix » et de son évolution vers une activité normale.
En écrivant cela, je veux ajouter une phrase : Avant que le compteur ne soit installé, l'abonnement actuel est probablement le moment où l'industrie est la plus généreuse envers les utilisateurs – profitez-en, et chérissez-le.
La logique est cachée dans le tableau de SemiAnalysis. Lu du point de vue de l'utilisateur, ce n'est absolument pas un arrêt de mort, mais une liste d'avantages encore en vigueur : vous payez 200 dollars par mois, la plateforme vous laisse consommer jusqu'à 14000 dollars de puissance de calcul.
Une subvention aussi forte, on l'a vue pour la dernière fois lors des guerres des VTC et de la livraison de repas – et nous nous souvenons tous de l'issue de ces deux batailles, une fois les subventions parties, les prix ne sont jamais revenus à ce qu'ils étaient avant.
Alors, les tâches lourdes à exécuter, faites-le maintenant. Par exemple, la fenêtre d'accès à Fable 5 dans l'abonnement ne dure que jusqu'au 22 juin. Plutôt que d'attendre l'ère des crédits pour compter chaque token, mieux vaut planifier dès maintenant ces longues tâches que vous avez toujours voulu exécuter mais trouviez trop chères. Ce n'est pas tirer profit abusivement – c'est simplement être un bénéficiaire conscient d'une erreur de tarification vouée à être corrigée.
La métaphore de Turley va peut-être plus loin qu'il ne l'entendait. Le vrai signe que l'électricité devient une infrastructure, ce n'est pas qu'elle arrive dans chaque foyer, mais que chaque foyer installe un compteur – à partir de ce moment, plus personne ne discute de « l'électricité en forfait illimité », on ne discute que du prix du kWh.
Il n'y aura pas de faire-part de décès pour l'abonnement. Il disparaîtra simplement un jour de facturation tranquille, pour devenir une petite ligne appelée « frais d'entrée » dans le détail de vos dépenses.
D'ici là – profitez-en, et chérissez-le.












