14 mai 2026, Microsoft a commencé à supprimer la licence interne Claude Code pour la majorité de ses employés. La date limite est le 30 juin – le dernier jour de l’exercice fiscal de Microsoft.
Il y a à peine 6 mois, Microsoft faisait exactement le contraire – en décembre 2025, il a ouvert l’accès à Claude Code à des milliers d’employés, ingénieurs, chefs de produit, designers inclus, encourageant tout le monde à repenser son flux de travail grâce au « vibe coding ». Les employés adoraient cet outil, peut-être même trop.
Mais 6 mois plus tard, Microsoft fait lui-même marche arrière.
Et quasiment la même semaine, Tom Blomfield, partenaire chez Y Combinator, a prononcé une autre phrase lors d’un « batch talk » : « Si votre facture API ne vous fait pas mal au cœur, c’est que vous ne brûlez pas assez. »
Ce même printemps, la Silicon Valley donne deux réponses diamétralement opposées à la même question – l’IA, utilisée, coûte-t-elle plus ou moins cher qu’un humain ?
01 L’échec sur le terrain du « vibe coding »
Ce que Microsoft annule, ce n’est pas le modèle Claude en soi. Les modèles d’Anthropic continueront d’être disponibles pour les employés Microsoft via Copilot CLI. C’est l’accès au produit Claude Code lui-même qui est supprimé.
Le département le plus touché est « Experiences + Devices » – l’équipe d’ingénieurs derrière Windows, Microsoft 365, Outlook, Teams et Surface. L’EVP Rajesh Jha a présenté cette décision dans un mémo interne comme une « unification de la chaîne d’outils » (toolchain unification), mais les sources internes citées par The Verge sont plus directes : les employés considèrent généralement Claude Code comme plus performant que Copilot CLI, et la popularité de l’outil d’Anthropic au sein de Microsoft a même conduit à une certaine « mise à l’écart » du Copilot CLI maison.
En d’autres termes, Microsoft retire Claude Code non pas parce qu’il est mauvais, mais parce qu’il est trop bon.
Cette date limite du 30 juin n’est pas non plus un hasard – c’est le dernier jour de l’exercice fiscal de Microsoft. Retirer un outil que les employés préfèrent largement, le remplacer par le produit maison, le timing calé sur la clôture fiscale – la part de jugement produit et la part de calcul financier, tout le monde comprend.
Microsoft n’est pas un cas isolé.
Il y a un mois, le CTO d’Uber, Praveen Neppalli Naga, a révélé à The Information : le budget annuel 2026 de l’entreprise pour les outils d’IA de programmation a été entièrement consommé en seulement 4 mois. Uber avait même mis en place un classement interne, encourageant les employés à utiliser davantage l’IA par le biais de concours – résultat : explosion du budget.
Encore plus direct, la déclaration de Bryan Catanzaro, vice-président du Deep Learning appliqué chez Nvidia, lors d’un entretien avec Axios : « Pour mon équipe, le coût de la puissance de calcul dépasse de loin le coût des employés. » Cette phrase sort de la bouche d’un cadre d’une entreprise de matériel – dont le produit principal est justement de vendre de la puissance de calcul.
Fortune a relié ces indices et a donné un titre très Fortune à son article : « Le rapport de Microsoft révèle le vrai problème de coût de l’IA – utiliser ce truc coûte plus cher que de payer des employés ».
Si l’on s’arrête à cette première lecture, la conclusion est simple : le vibe coding a échoué, l’histoire du remplacement de l’humain par l’IA peut être rangée au placard.
Mais cette conclusion est prématurée.
02 Le mode « Copilot » a déjà « buté sur un mur »
Pour expliquer la retraite de Microsoft, il faut d’abord définir ce qu’est le « vibe coding ».
Ce terme a été proposé par Andrej Karpathy début 2025 – il décrit une nouvelle façon de programmer : le développeur n’écrit plus le code ligne par ligne, mais décrit son intention en langage naturel, laissant le LLM générer le code. Le développeur ne lit même pas le code, il ne regarde que le résultat – s’il fonctionne, il l’accepte, sinon, il demande à l’IA de le modifier.
C’est l’une des promesses de productivité les plus séduisantes de l’ère de l’IA. Cela signifie : un ingénieur qui ne sait pas écrire en Rust peut faire écrire du Rust par l’IA ; un chef de produit peut faire créer un prototype par l’IA ; un designer peut faire écrire du code fonctionnel par l’IA. Les personnes ciblées par l’ouverture de Claude Code par Microsoft en décembre 2025 – ingénieurs, chefs de produit, designers – correspondent exactement à ces trois profils. Ce n’est pas une coïncidence, c’est la posture classique d’implémentation du vibe coding.
Mais lorsque le vibe coding s’implante dans une grande entreprise, cela devient structurellement problématique.
Imaginons un ingénieur chez Microsoft, avec un salaire annuel de 300 000 dollars. Une fois équipé de Claude Code, sa productivité augmente de 20% – c’est l’état idéal du vibe coding. Mais parallèlement, son coût mensuel en tokens est-il de 200, 500 ou 2000 dollars ? Ce chiffre augmente de manière monotone avec sa dépendance croissante à l’IA.
Plus gênant encore, il ne sera pas licencié parce qu’il « utilise l’IA » – son salaire de 300k reste, ses avantages sociaux restent, son poste de travail reste.
Autrement dit, la structure de coût totale pour Microsoft est « salaire existant des employés + nouvelle facture de tokens ». Cette équation n’a qu’une direction – l’explosion des coûts.
Et cette « productivité de l’employeur +20% » se traduit-elle financièrement par « chiffre d’affaires +20% » ? Non. C’est « chiffre d’affaires stable, mais structure de coût augmentée d’une facture IA » – car la productivité de la majorité des employés ne se traduit pas directement par des revenus additionnels ; écrire plus vite ne signifie pas que l’entreprise vend plus.
C’est le sens véritable de la phrase de Catanzaro « la puissance de calcul coûte plus cher que les employés ». Il ne s’agit pas de dire que l’IA est stupide, mais que lorsque vous greffez l’IA sur des employés existants, la rentabilité devient impossible.
Cette logique est étayée par des données.
Dans une récente prédiction, Gartner affirme que d’ici 2030, le coût d’inférence des modèles à mille milliards de paramètres aura chuté de près de 90% par rapport à 2025. On pourrait croire que l’IA devient moins chère, mais la véritable conclusion de Gartner est : cela ne rendra pas la facture IA totale des entreprises moins élevée. Will Sommer, analyste directeur principal chez Gartner, a déclaré : « Les DPO ne doivent pas confondre “déflation des tokens de commodité” et “démocratisation des capacités d’inférence de pointe”. »
La prédiction de Goldman Sachs est plus directe : d’ici 2030, l’IA agentique entraînera une multiplication par 24 de la consommation de tokens, atteignant 120 quadrillions par mois. Prix unitaire du token divisé par 10, consommation multipliée par 24 – résultat : la facture totale continue d’augmenter.
Jensen Huang a une version plus radicale. Il y a quelques mois, en public, il a déclaré qu’à l’avenir, chaque employé de Nvidia travaillerait aux côtés de 100 agents IA.
Cela semble beau. Mais si vous êtes CFO, qu’entendez-vous ? 100 fournaises à tokens, brûlant 24h/24.
Le problème n’est pas que l’IA est trop chère. Le problème est l’hypothèse de base : « donner un copilote IA à chaque employé ».
Cette posture a un nom populaire dans la tech – le « mode copilote » (copilot mode). Son postulat central est : l’humain reste aux commandes, l’IA est sur le siège passager pour donner des conseils. Elle ne vous remplace pas, elle vous rend juste plus rapide.
Cette hypothèse est très douce sur le papier – « l’IA ne vous volera pas votre travail, elle vous aidera seulement ». Mais financièrement, sa signification implicite est : tous les salaires existants restent inchangés, mais s’ajoute un coût supplémentaire en tokens.
Or, les tokens ne sont pas un coût fixe, ils sont facturés à la consommation. Plus les employés utilisent, plus l’entreprise paie – c’est exactement la structure de coût que les entreprises détestent : variable, sans plafond, amplifiée à l’inverse de la capacité de production.
Lorsque Microsoft a ouvert l’accès à Claude Code en décembre 2025, il n’avait peut-être pas pleinement conscience de cela. L’idée était probablement : laisser les employés essayer, voir dans quelle mesure l’IA peut améliorer l’efficacité. Mais 6 mois plus tard, les employés sont vraiment devenus accros, Claude Code est devenu trop populaire en interne – résultat : la facture de tokens a largement dépassé les attentes, dépassant ce que Microsoft pouvait récupérer en productivité grâce à cette popularité.
Microsoft se retire. Mais ce n’est pas l’IA qu’il retire – c’est la structure « employé aux commandes, IA en siège passager ».
C’est un échec structurel. Il ne disparaîtra pas parce que les modèles deviennent moins chers, ni parce que les employés deviennent plus compétents – il s’aggravera au fur et à mesure que les employés deviendront plus habiles avec l’IA.
03 Brûler des tokens, parce qu’on ne brûle pas des têtes
Presque la même semaine que la retraite de Microsoft, Tom Blomfield, lors du batch talk de YC, a proposé une perspective totalement différente. Il n’a pas discuté de « comment utiliser l’IA » – il a discuté de « à quoi devrait ressembler une entreprise à l’ère de l’IA ».
Le jugement de Blomfield est direct : aujourd’hui, la plupart des entreprises conservent une structure de « légion romaine » – l’information remonte niveau par niveau, les ordres descendent niveau par niveau, l’humain est le cœur de la coordination. Greffer l’IA sur cette structure, c’est comme donner des armes à feu à des légionnaires romains – ils les utiliseront plus intensément, mais la tactique ne changera pas.
Une véritable entreprise AI-native devrait avoir une autre forme.
Blomfield utilise une description très concrète : chaque action devrait produire un artefact enregistrable et invocable, rendant tout clairement lisible par l’IA (legible to AI) ; l’entreprise devrait être conçue comme une « boucle d’IA auto-améliorante », le système pouvant percevoir l’environnement, prendre des décisions, invoquer des outils, recevoir des retours, s’auto-corriger.
Dans une telle entreprise, l’humain ne garde que deux rôles. Premièrement, celui de contributeur individuel – chaque personne, quel que soit son département, est un « builder » et un « operator », apportant des prototypes en réunion, pas seulement des idées. Deuxièmement, celui de DRI (Directly Responsible Individual) – chaque production a un responsable clairement identifié, « on ne peut pas se cacher derrière l’IA ».
Puis Blomfield a prononcé cette phrase d’or : « Si votre facture API ne vous fait pas mal au cœur, c’est que vous ne brûlez pas assez. »
Si cette phrase apparaissait dans le bureau du CFO de Microsoft, elle serait prise pour une plaisanterie ; mais face à une salle pleine de fondateurs de startups de YC, personne ne la trouve folle.
Pourquoi ?
Diana Hu, une autre partenaire de YC, a donné la réponse début mai lors de la Startup School. Elle a dit : « Maximisez non pas le nombre de têtes, mais la consommation de tokens. » Elle a une version encore plus directe : « Une personne équipée d’outils IA équivaut à une grande équipe d’ingénieurs d’autrefois. »
Remarquez le mot-clé ici : « équivaut ». Pas « équivaut à peu près », pas « similaire à » – remplacement.
Dans le batch de printemps 2026 P26 de YC, plusieurs entreprises font déjà avec 5 ou 6 personnes ce qui en nécessitait 20 ou 30 auparavant. Leur facture de tokens est évidemment élevée, mais leur masse salariale est extrêmement faible – au global, le calcul est bénéficiaire.
Un cas plus radical est Block. Cette entreprise de fintech de Jack Dorsey a récemment licencié 40% de ses effectifs. Il ne s’agit pas d’une « rationalisation des coûts » traditionnelle – Block a simultanément augmenté ses investissements internes en outils IA. La nouvelle structure est exactement celle décrite par Diana Hu : IC + DRI + agent IA.
Brûler des tokens, dans le contexte de YC, n’est pas une dépense, c’est un remplacement. Il ne remplace pas des coûts hors IA, il remplace des salaires. Le calcul devient viable parce que l’entreprise supprime en parallèle les postes qui devaient initialement générer ces salaires.
C’est la raison fondamentale pour laquelle Microsoft et YC, observant la même situation, donnent des réponses opposées – ils ne brûlent pas du tout le même type de tokens. Les tokens de Microsoft font le plein du copilote de l’équipe existante, les tokens de YC remplacent le pilote d’origine.
04 Le véritable actif est en train d’être redéfini
Dans son entretien, Tom Blomfield a également prononcé une autre phrase plus intrigante – « Les humains sont éphémères, la documentation contextuelle est importante. »
C’est un jugement au niveau comptable.
Comment est structuré le bilan d’une entreprise traditionnelle ? À l’actif : immobilisations, créances, fonds commerciaux, propriété intellectuelle. Au passif : dettes et capitaux propres. Les employés ne figurent pas à l’actif – les employés sont un coût. Mais chaque entreprise sait au fond d’elle-même que les employés sont le véritable actif : les relations clients sont dans la tête des commerciaux, l’intuition métier dans celle des chefs de produit, le savoir-faire technique dans celle des ingénieurs.
La caractéristique de cet « actif » est qu’il peut partir. Un employé quitte l’entreprise, l’actif s’envole.
Et l’entreprise AI-native décrite par Blomfield fait une chose : extraire tous ces actifs qui n’existaient que dans les cerveaux humains pour les transformer en « actifs contextuels » lisibles, invocables et itérables par l’IA.
Sous quelle forme concrète ? Une documentation détaillée des besoins ; la capitalisation des processus de chaque décision, chaque échange d’emails, chaque discussion Slack ; des interfaces MCP et API ouvertes ; chaque artefact produit par les outils internes – tous ces éléments constituent une nouvelle couche d’actifs pour l’entreprise, héritable, qui ne s’évapore pas avec le départ d’un employé.
Dans une telle entreprise, l’humain devient au contraire une « variable » – il peut s’intégrer rapidement, ou partir rapidement, car le cœur de l’actif de l’entreprise n’est pas dans son cerveau, mais dans la documentation.
Si cette structure tient, elle signifie non seulement un nouveau modèle organisationnel – elle signifie que le bilan comptable des entreprises est en train d’être réécrit. Une entreprise AI-native de 6 personnes, avec une facture de tokens astronomique, peut sembler financièrement malsaine, mais son véritable actif est peut-être plus solide que celui d’une entreprise traditionnelle de 60 personnes – simplement, les normes comptables actuelles ne savent pas encore comment calculer cet actif.
En d’autres termes, le vibe coding n’est pas mort. Il n’appartient simplement pas aux entreprises traditionnelles.
Le jour où Microsoft a retiré Claude Code n’est pas un jour d’échec de l’économie de l’IA – c’est le jour où une posture consistant à greffer l’IA sur une organisation ancienne s’est auto-démentie.
Et dans cette salle pleine de startups de YC, une autre posture est en train d’émerger – elles sont petites, elles brûlent des tokens, elles n’ont pas de « taux d’utilisation de l’IA par les employés » dans leurs tableaux de bord, leur CFO ne panique pas face à l’explosion de la facture de tokens – car ce qu’elles brûlent n’est pas le « copilote de l’employé », mais bien le « substitut à l’employé ».
Dans les années à venir, toutes les entreprises de taille moyenne qui continuent d’encourager leurs employés à « utiliser un peu plus l’IA » se heurteront au même mur que Microsoft – la facture de tokens structurellement vouée à augmenter.
Mais la vraie raison de ce choc n’est pas que l’IA est trop chère – c’est que l’organisation n’a pas encore changé.
Et la grande majorité des entreprises ne changeront probablement pas de sitôt.









