Note de la rédaction : Alors que l'IA commence à écrire du code, traiter des tickets d'assistance, examiner des documents juridiques, une question plus fondamentale émerge : ce que les entreprises achètent vraiment, est-ce des tokens, des heures de GPU, ou du travail accompli ?
Cet article propose un cadre de réflexion intéressant : la commercialisation de l'IA ne devrait pas être comprise uniquement comme un « marché de la puissance de calcul » ou un « marché d'appels de modèles », mais évolue plutôt vers un nouveau « marché de la main-d'œuvre machine ». Dans ce marché, le token n'est qu'une unité de mesure, le GPU un intrant, le modèle un outil de production, et le véritable objet tarifé et échangé est le travail économique directement accompli par le logiciel.
Le jugement central de l'article est que le mécanisme de tarification de l'IA évoluera, passant du token brut et des capacités de modèles standardisées, à la main-d'œuvre sectorielle, puis à un marché de résultats programmables. Autrement dit, à l'avenir, les entreprises ne se soucieront peut-être plus de savoir quel modèle ou quel type de GPU a accompli une tâche, mais plutôt de savoir si celle-ci a été livrée dans les délais, avec un taux de précision, une fiabilité et un coût conformes aux standards attendus.
Cela signifie aussi que l'impact de l'IA sur le marché du travail humain n'est pas nécessairement une simple substitution. Alors que les machines assumeront davantage de travaux standardisables et vérifiables, le rôle des humains pourrait évoluer vers la relecture, l'assumation des responsabilités, la gestion du contexte et l'arbitrage final. Dans certains scénarios, le jugement humain des derniers 1% pourrait même gagner en valeur, car il peut libérer les 99% de l'automatisation à grande échelle.
Sous cet angle, la compétition de la prochaine phase du marché de l'IA ne sera peut-être plus seulement une course aux performances des modèles, ni une simple guerre des prix sur la puissance de calcul, mais une course pour savoir qui, le premier, saura standardiser, rendre vérifiable et tarifable le « travail », et finalement transformer la main-d'œuvre machine en un nouveau facteur de production qui peut être acheté, facturé et échangé.
Voici l'article original :
Les vagues de productivité passées provenaient toujours de la création d'outils et de logiciels pour les humains, afin d'optimiser la façon dont le travail était accompli. Les tableurs aidaient les comptables et les analystes, les convoyeurs augmentaient le débit, les marteaux amplifiaient le levier humain. Mais le véritable travail venait toujours des humains.
Désormais, l'IA produit des résultats de travail de bout en bout, exécutant directement le travail lui-même. Elle peut écrire du code, traiter des tickets d'assistance, examiner des documents juridiques. L'extrémité de toute la pile technologique est en train de se comprimer : l'ancienne pile soutenait le travail, la nouvelle commence à le produire.
Si vous avez récemment entendu parler des discussions sur la financiarisation de l'IA, vous avez probablement entendu Jensen et d'autres dire que les tokens de LLM et/ou les heures de GPU deviennent les nouvelles matières premières. Cette intuition est compréhensible, car les tokens sont mesurables, facturables et faciles à représenter en graphiques ; les heures de GPU attirent aussi des milliards de dollars d'investissements. Mais les tokens ne sont encore qu'un compteur, les heures de GPU ne sont que des intrants, personne n'en achète pour les posséder en tant que tels. Ce que les gens veulent vraiment, c'est que le travail soit fait. L'IA est en train de transformer la pile technologique elle-même en source de main-d'œuvre.
Main-d'œuvre machine : Travail exécuté par un logiciel, à usage économique, et vendu dans le processus de production.
Le marché évolue déjà dans cette direction. Sarah Tavel de Benchmark a tendance à comprendre cette opportunité à travers le marché du travail externalisé, plutôt que par les catégories logicielles. Si une tâche répétable est traditionnellement accomplie par une équipe offshore spécialisée ou une société de services professionnels, alors elle est souvent aussi un travail adapté à la livraison par l'IA. Alex Rampell de a16z appelle cela « le logiciel qui dévore le travail » : le prochain acte du logiciel est d'accomplir le travail lui-même. Julien Bek de Sequoia décrit le même changement sous un autre angle : les services se transforment en logiciel, les copilots vendent des outils, et les autopilotes vendent du travail.
Le marché manquant derrière la tarification au résultat
La tarification par siège facture l'accès, la tarification au token facture l'utilisation. La tarification au résultat, elle, facture lorsque le travail est accompli. La tarification au résultat nous fait faire un pas en avant, mais elle ne répond toujours pas à une question : qui décide du prix ?
Si la main-d'œuvre machine peut être achetée directement, le prix devrait provenir de la concurrence entre fournisseurs. Ces fournisseurs doivent être capables de satisfaire au même type de tâche ou aux mêmes standards d'accomplissement du travail, ce qui nécessite d'établir une standardisation au sein de différents secteurs et tâches.
La pratique actuelle utilise les tokens de LLM, mais le token brut n'est que la couche la plus basse. Un baril de pétrole n'est qu'une unité de mesure, ce qui est réellement échangé, c'est un baril d'une qualité spécifique, avec des caractéristiques de qualité, des conditions de livraison et un prix de marché clairs. Un baril de Brent et un baril de pétrole lourd à haute teneur en soufre ne sont pas la même marchandise. Il en va de même pour les tokens de LLM. Le token n'est qu'une unité de mesure, ce qui compte vraiment est l'intelligence qu'il véhicule : qualité du modèle, performances de référence minimales, latence, fenêtre contextuelle, fiabilité et garanties de livraison. Un million de tokens provenant d'un modèle de code de pointe, et un million de tokens provenant d'un modèle générique bon marché, ne sont pas la même marchandise. Le marché a besoin de niveaux de raisonnement standardisés, tout comme le marché de l'énergie a besoin de qualités de pétrole standardisées.
Anjali Shriva le souligne directement : le token n'est pas une unité de coût fixe. Son économie varie avec la longueur du contexte, la structure de la tâche, le ratio entrée/sortie, le nombre de tentatives, les appels d'outils et les flux de travail d'agent. Un token dans une invite courte et un token enfoui dans une longue boucle d'agent ne sont pas le même objet économique.
Nous faisons cela depuis longtemps sur le marché du travail humain. Personne n'embauche un radiologue comme des « heures humaines » génériques. On regarde la formation, les certifications, la spécialisation, les années d'expérience, la disponibilité, la réputation, la responsabilité, etc. Différentes spécifications de contrats humains correspondent à différentes normes et attentes de niveau minimales.
Le marché du travail humain fonctionne déjà avec ces spécifications, mais elles sont souvent mélangées, qualitatives et remplies de divers indicateurs indirects. La main-d'œuvre machine rendra ces spécifications plus explicites et quantifiables.
Pour un LLM ou un Agent, des indicateurs comme les compétences, l'expérience, la vitesse et la fiabilité peuvent être directement inscrits dans un contrat : scores de référence, latence, débit, fenêtre contextuelle, longueur de sortie maximale, précision d'utilisation des outils, temps de fonctionnement, taux d'erreur. Nous pouvons acheter de la main-d'œuvre selon des attentes et des résultats quantifiables.
La spécification contractuelle de TheGrid.ai est essentiellement un filtre de qualification, couplé à une concurrence sur les prix pour la sortie des LLM. Les fournisseurs peuvent entrer en concurrence tant qu'ils satisfont aux spécifications :
Test de référence d'intelligence ≥ seuil minimal
Latence ≤ seuil maximal
Débit ≥ seuil minimal
Temps de fonctionnement ≥ seuil minimal
Taux d'erreur ≤ seuil maximal
Une fois que les fournisseurs atteignent le même seuil minimum, ils commencent à rivaliser sur les prix. L'acheteur se demande : quel fournisseur peut livrer la main-d'œuvre nécessaire au meilleur prix ?
Le recrutement d'un radiologue, dans le contexte des LLM, devient un problème mesurable : quels LLM peuvent lire des radiographies avec une haute compétence, et accomplir la tâche dans des délais, une fenêtre contextuelle et d'autres spécifications contractuelles basées sur des résultats clairement définis.
Le résultat est la façon dont l'acheteur mesure le succès ; le travail est l'activité économique fournie ; le token est le carburant que la machine consomme en accomplissant le travail.
The Grid est le marché de la main-d'œuvre machine.
Du token au marché de la main-d'œuvre machine
Le marché peut tarifer les intrants de la pile technologique, mais s'il veut tarifer les extrants, il a besoin d'un marché de la main-d'œuvre machine. L'acheteur ne se soucie pas des heures de GPU. Les points de terminaison de modèles sont eux-mêmes instables : ils peuvent être renommés, abandonnés, encapsulés ou simplement retirés.
Les utilisateurs et la liquidité détestent les changements fréquents. Les GPU et les modèles évolueront continuellement, mais l'unité stable est le travail lui-même.
Je pense que le marché évoluera le long du chemin suivant. À chaque palier supérieur, ce qui est acheté est plus abstrait, plus précieux, mais aussi plus difficile à vérifier. The Grid devrait progressivement gravir cette échelle :
Token brut → Marché de capacités LLM standardisées → Marché de main-d'œuvre standardisé → Marché de résultats programmables
Première phase : Token brut
Claude 4.7, GPT 5.5, Kimi 2.6, DeepSeek V4, GLM 5, etc.
Aujourd'hui, les acheteurs achètent des sorties de modèles brutes auprès de fournisseurs de raisonnement. Ils envoient leurs propres invites, reçoivent des résultats de raisonnement et paient à l'usage. C'est facile à vérifier, mais ce n'est encore que de la matière première. Ce que l'acheteur veut vraiment, ce ne sont pas des tokens, mais de l'intelligence utile au meilleur prix.
Deuxième phase : Marché de capacités LLM standardisées
Par exemple text/usd, code/usd, agent/usd, etc.
L'acheteur ne choisit plus un modèle spécifique, mais la catégorie d'intelligence dont il a besoin. L'acheteur conserve toujours le contrôle du flux de travail, des invites, des données et de la logique applicative. The Grid se contente d'acheminer chaque requête vers le modèle qualifié qui satisfait aux spécifications contractuelles et a le prix le plus bas.
Note : C'est la première véritable couche d'abstraction au-dessus du token brut, et c'est là où se trouve actuellement TheGrid.ai.
Troisième phase : Marché de main-d'œuvre standardisé
Par exemple accounting/usd, support_agent/usd, legal/usd, healthcare/usd, radiology/usd, etc.
À mesure que les modèles deviennent plus spécialisés, le marché des capacités peut évoluer davantage vers des marchés spécifiques à des secteurs. C'est similaire à la spécialisation du travail humain sur différents marchés.
À ce niveau, nous vendons des capacités de raisonnement adaptées aux flux de travail de secteurs verticaux de main-d'œuvre spécifiques. À mesure que les modèles sectoriels spécialisés deviendront plus courants, ce type de marché se développera rapidement. Des exemples incluent le Composer de Cursor, Harvey pour le travail juridique, et EvidenceOpen pour la santé.
Quatrième phase : Marché de RFQ et de résultats programmables pour Agents
Par exemple support_ticket_resolved/usd, pr_merged/usd, claim_processed/usd, etc.
Le dernier niveau est celui où The Grid passe du marché du raisonnement au marché de la main-d'œuvre machine.
Ce niveau nécessite des mécanismes de RFQ (demande de prix), comptes gérés, règlements différés, confirmation de l'acheteur, réputation des fournisseurs, mécanismes de retenue, résolution de litiges, etc. Il commencera probablement par des RFQ plutôt que par un carnet d'ordres direct. L'acheteur définit le travail, les contraintes, les critères d'acceptation et les conditions de règlement, et les Agents soumissionnent pour accomplir la tâche. The Grid aide à acheminer, tarifer, vérifier et régler ces travaux.
C'est le niveau le plus précieux, mais aussi le plus difficile à vérifier, car les résultats peuvent être différés, subjectifs et facilement manipulables. Un ticket d'assistance peut être rouvert ; une PR (Pull Request) peut passer les tests mais introduire une mauvaise architecture.
Prix total = Coût d'accomplissement du travail + Coût de prise de risque
Un flux de travail ne devient pas automatiquement un marché simplement parce que l'intelligence a un marché ou devient moins chère. Certains travaux dépendent fortement d'un contexte privé, comme l'historique client ou les politiques internes. Plus un travail dépend du contexte, moins il est probable qu'il soit liquidé proprement sur un marché ouvert. [@hypersoren https://hypersoren.xyz/posts/cybernetic-arbitrage/]
Le marché doit révéler quelles catégories de main-d'œuvre vont s'étendre et lesquelles vont se contracter.
« Main-d'œuvre machine vs main-d'œuvre humaine », ou « main-d'œuvre machine & main-d'œuvre humaine »
Anjali Shriva, dans son ébauche de conception de mécanismes, note que le récit sur l'IA est trop souvent décrit comme une substitution. En réalité, cela ressemble plus à un problème de coordination : lorsque les humains et les machines participent tous deux à la production, comment le travail, l'attribution, les incitations et la valeur sont-ils réorganisés.
Aujourd'hui, une grande partie de l'utilisation de l'IA dans les entreprises reste bloquée, car les employés l'utilisent en privé, les flux de travail restent enfermés au niveau individuel, et les entreprises ne peuvent pas tarifer ces gains de productivité ni les mettre à l'échelle.
La plupart des travaux automatisables seront probablement transférés aux machines. Une partie du travail deviendra de la relecture humaine, de l'assumation de responsabilités, de la formation et de la gestion du contexte. Dans certains cas, le jugement humain des derniers 1% deviendra plus précieux, car il peut débloquer à grande échelle les 99% de travail automatisé.
Rachel Su Park, dans son article « Brave New World of AI Markets », souligne que le TAM (Total Adressable Market) de l'IA ne devrait pas être modélisé simplement comme une substitution aux dépenses actuelles en main-d'œuvre humaine, car il change à la fois les prix et les volumes. À mesure que le coût du travail diminue, le prix unitaire peut baisser, mais la quantité consommée peut augmenter, car les travaux existants seront consommés plus fréquemment et de nouveaux travaux, autrefois non économiques, deviendront viables. L'article le résume ainsi :
P × Q : Taille du marché = Prix unitaire du travail × Quantité de travail consommée
Si l'IA rend les interactions avec le service client moins chères, les entreprises peuvent offrir une capacité de service 24h/24 et 7j/7. Ce marché ne sera pas seulement une version moins chère de l'ancien marché du travail d'assistance, il pourrait devenir un marché d'interaction client beaucoup plus vaste.
L'IA est un marché expansionniste, car lorsque le coût du travail baisse, la demande ne reste pas constante.
La couche travail
Le marché de la main-d'œuvre machine devrait commencer par les travaux dont les spécifications peuvent être clairement définies. Les heures de GPU contiennent trop d'informations sur les intrants, elles ne font que dire ce qui soutient le travail ; et tarifer un résultat complet est trop complexe, trop dépendant du contexte. Ce n'est qu'à mesure que la vérification, la réputation et la tarification du risque/l'assurance seront progressivement prises en charge par les machines, que le marché évoluera vers la couche des résultats purs.
La main-d'œuvre machine peut devenir négociable, car les acheteurs se soucieront de moins en moins de savoir quel modèle ou quel type de GPU a produit le travail, et se soucieront davantage de savoir si le travail lui-même a atteint, au bon prix, les normes et niveaux minimaux stipulés dans les spécifications contractuelles. Les Agents se soucieront encore moins de ces sources sous-jacentes.
Les machines peuvent maintenant exécuter directement un travail ayant une utilité économique, et ce travail peut être défini, mesuré, tarifé, acheté et finalement échangé. L'électricité, la puissance de calcul, les modèles et les tokens restent évidemment importants, mais ils sont tous encore en amont.
C'est en aval que le travail est réellement accompli, et le marché évolue vers un objet plus simple : la main-d'œuvre machine.








