Une facturation opaque de 1,7 million de dollars dévoilée par l'IA : Anthropic rembourse sans admettre sa faute

marsbitPublié le 2026-06-29Dernière mise à jour le 2026-06-29

Résumé

Un ancien directeur d'Oracle, Michael Hahn, a fondé Vaudit, une startup d'audit qui a identifié environ 1,7 million de dollars de surfacturation présumée dans les factures d'IA de 60 entreprises, dont Panasonic, HP et Honda. Ces frais excédentaires proviendraient principalement de l'utilisation de Claude Code d'Anthropic. Les surfacturations suivent trois schémas principaux : facturation pour un modèle plus récent et plus cher alors qu'un modèle plus ancien a été utilisé, facturation pour des requêtes ayant échoué ou généré des erreurs, et "tempêtes de nouvelles tentatives" où un agent IA réessaie silencieusement et à répétition, accumulant des coûts à l'insu de l'utilisateur. Bien qu'Amazon, Google, Microsoft, Anthropic et OpenAI aient remboursé environ 80 % des montants contestés suite aux réclamations, ils n'ont pas reconnu d'erreur systémique, affirmant que ces problèmes ne sont pas généralisés. Cette situation met en lumière l'opacité croissante de la facturation de l'IA, rendue complexe par la tarification aux tokens, les chaînes de facturation multiples (éditeurs de modèles, clouds, SDK) et le comportement imprévisible des agents autonomes. Un procès a également été intenté contre Anthropic, l'accusant de ne pas fournir le volume promis dans ses forfaits haut de gamme. Face à cette complexité, l'audit des factures d'IA devient un secteur en soi. Vaudit, qui facture 1% du montant audité et 30% des sommes récupérées, a déjà audité plus d'un milliard de dollars de dép...

Michael Hahn, ancien directeur chez Oracle, s'est récemment lancé dans une nouvelle activité : la vérification des factures d'IA.

Son entreprise, Vaudit, a examiné les factures d'IA d'environ 60 entreprises, totalisant quelque 34 millions de dollars, principalement des frais d'utilisation de Claude Code, et y a identifié environ 1,7 million de dollars de surfacturation présumée.

The Information rapporte : La société d'audit Vaudit déclare avoir identifié environ 1,7 million de dollars de facturation présumée excessive dans les factures d'IA d'entreprises qu'elle a examinées, principalement liées à Claude Code.

La liste des clients audités comprend des noms comme Panasonic, HP et Honda.

Mais si vous interrogez les deux géants de l'IA de l'autre côté de la facture, vous obtiendrez une version différente.

Anthropic affirme qu'elle ne facture pas les requêtes non abouties ou les erreurs, qu'elle ne redirige pas discrètement les requêtes vers d'anciens modèles, et que ce problème de surfacturation ne semble pas être un phénomène généralisé.

OpenAI est encore plus direct : rien ne prouve que ces problèmes soient survenus chez ses propres clients.

Les deux parties disent qu'il n'y a pas de problème.

Pourtant, après des séries de réclamations de la part de Vaudit et de ses clients, environ 80 % de ces montants contestés ont finalement été remboursés par Amazon, Google, Microsoft, Anthropic et OpenAI.

Hahn dit que ces entreprises ont fait preuve d'une grande coopération en cas de problème, acceptant de rembourser, mais refusant d'admettre leur faute.

La situation est donc étrange : la société d'audit brandit son livre de comptes en disant « j'ai trouvé », environ 80 % des frais excessifs ont été remboursés, et les fournisseurs de modèles agitent collectivement la main en disant « ça n'existe pas ».

Si tout le monde dit qu'il n'y a pas d'erreur, comment ces remboursements ont-ils été obtenus ?

Comment ces 1,7 million de dollars sont-ils devenus « excédentaires » ?

Voyons d'abord ce que Vaudit a découvert.

Michael présente les trois méthodes de surfacturation les plus courantes, chacune cachée dans des recoins insignifiants de la facture, que personne ne vérifierait habituellement ligne par ligne.

Première méthode : le mauvais étiquetage du modèle.

Le client appelle en réalité un modèle plus ancien et moins cher, mais la facture est calculée sur la base du modèle plus récent et plus coûteux.

Par analogie, vous achetez un siège en classe économique, mais vous êtes facturé au tarif de la première classe. Une ou deux fois, cela passe inaperçu, mais après des millions d'appels, la différence de prix devient évidente.

Deuxième méthode : payer pour un échec.

Un agent ou un chatbot ne termine pas la requête, voire renvoie directement une erreur, mais cette partie est tout de même incluse dans la facture.

La troisième méthode est la plus insidieuse, Hahn l'appelle « tempête de nouvelles tentatives » (retry storm). Une tâche d'agent échoue, il recommence silencieusement à plusieurs reprises, l'utilisateur ne sait pas du tout que l'arrière-plan consomme de l'argent, et les frais s'accumulent ainsi couche après couche.

Aucune de ces trois méthodes n'est due à une « utilisation active et excessive » de l'utilisateur.

La troisième est la plus terrifiante.

Autrefois, lorsque vous utilisiez un logiciel, vous le faisiez étape par étape, en le surveillant vous-même, et vous pouviez l'arrêter immédiatement s'il déraillait.

Mais le point de vente des agents d'IA est précisément de « les laisser faire tout seuls », l'humain se retirant du processus.

Cela signifie que lorsque l'agent d'IA bute en arrière-plan, réessaie, bute à nouveau, et consomme frénétiquement des tokens, la personne qui aurait normalement crié « stop » n'en sait rien, et la facture n'arrive qu'à la fin du mois.

Anthropic, OpenAI : nous ne surfacturons pas

Le point crucial de cette affaire n'est pas « qui a trompé qui ».

Vaudit l'a découvert, mais Anthropic et OpenAI ne l'admettent pas ; il s'agit là de la version de la société d'audit, et personne ne peut accuser les deux entreprises de surfacturation sur la seule base d'un « nous avons trouvé 1,7 million ».

Mais en ce qui concerne le remboursement, chaque entreprise a coopéré. Le fait que 80 % aient été remboursés d'un coup montre précisément que ces 80 % n'auraient jamais dû être facturés.

Le remboursement est une correction d'erreur, l'argent est rendu, mais le compte reste flou.

La raison de cette impasse « remboursement sans aveu de faute » réside dans l'algorithme même du commerce de la facturation de l'IA.

Pourquoi les factures d'IA sont-elles par nature incompréhensibles ?

Le problème n'est peut-être pas une « erreur de calcul », mais plutôt qu'elles sont « par nature impossibles à calculer clairement ».

Parce qu'elles sont facturées en fonction de l'utilisation de tokens, vous payez plus si vous en utilisez davantage, et encore plus si l'utilisation est complexe. Pourtant, les tokens sont pratiquement invisibles dans les tableaux de bord d'infrastructure que vous utilisez habituellement.

Pire encore, leur utilisation peut fluctuer violemment. Pour la même question, selon le modèle utilisé, la manière dont le prompt est rédigé, la façon dont l'agent est orchestré, le nombre de tokens consommés peut varier de plusieurs ordres de grandeur.

Plus les modèles évoluent vers l'« agentivité » (agentic), plus ils consomment de tokens. Un agent qui exécute une tâche pour vous peut nécessiter des dizaines, voire des centaines d'appels de modèle en arrière-plan, chacun consommant de l'argent.

De par sa nature difficile à prévoir et à expliquer, c'est ainsi qu'est créée une zone grise de « surfacturation ».

La remarque de Hahn est incisive : les factures d'IA deviennent de moins en moins transparentes. Cette phrase touche précisément le point faible de toute l'industrie.

L'IA est passée de la facturation initiale « par appel » à aujourd'hui, « multi-modèles + multi-agents + passage par le cloud », allongeant de plus en plus la chaîne de facturation : le fournisseur de modèles perçoit une part, le fournisseur cloud une autre, et les SDK proxy intermédiaires en ajoutent une couche supplémentaire.

Chaque étape semble raisonnable individuellement, mais une fois superposées, il est difficile de voir d'un coup d'œil où l'argent a été dépensé.

Pire encore, l'argent est souvent consommé là où vous ne le voyez pas.

Les scénarios qui consomment réellement la facture sont presque tous cachés en arrière-plan, et chacun d'eux peut être vérifié par des issues GitHub publiques ou des rapports d'incidents.

Après avoir examiné ces huit types, vous vous rendrez compte que, soit le contexte est retransmis encore et encore, soit les sous-agents tournent à vide toute la nuit sans surveillance, et la facture grossit toute seule, hors de votre vue.

Un abonnement de 200 dollars, une facture de 50 000 dollars

Ce n'est pas la première fois qu'Anthropic est confronté à des défis liés aux factures d'IA.

Le 15 juin, un client de Washington D.C., Karl Kahn, a poursuivi Anthropic en justice devant un tribunal fédéral, l'accusant de « non-conformité » dans ses abonnements haut de gamme.

Selon le Wall Street Journal, l'abonnement Max 5x d'Anthropic coûte 100 dollars par mois et le Max 20x 200 dollars par mois. Leur argument de vente lors de la promotion était qu'ils offraient des plafonds d'utilisation 5 et 20 fois supérieurs à ceux du plan Pro.

Mais Kahn affirme que la quantité réellement utilisable est bien inférieure à ce qui était annoncé.

Il est passé au Max 20x en avril de cette année, mais en quelques semaines, il a atteint le plafond d'utilisation hebdomadaire. Une seule session intensive de 5 heures a consommé directement 15 % de son quota hebdomadaire.

Soit il s'arrête, soit il économise, soit il paye encore plus pour des achats supplémentaires ; il n'avait plus que ces trois options.

La base de cette action en justice repose principalement sur une série d'e-mails qu'Anthropic a envoyés en juillet 2025 à différents niveaux d'abonnés, indiquant les quantités approximatives que chaque niveau pouvait utiliser par semaine.

Le plaignant a comparé ces écrits noir sur blanc avec les quotas réellement reçus, concluant qu'ils étaient « bien inférieurs à la promotion ».

La plainte demande le statut d'action collective, couvrant toutes les personnes ayant acheté ces deux forfaits depuis avril 2025.

Repérer les erreurs dans les factures d'IA devient un business

Vaudit, qui « vérifie » les factures d'IA, a été fondée en 2023 et compte environ 30 employés.

Son fondateur, Hahn, ancien directeur chez Oracle, a fait carrière dans l'audit des factures de logistique, transport, publicité et services cloud. En clair, il est un spécialiste qui aide les gens à « vérifier les comptes et économiser de l'argent ».

Plus tôt cette année, il a appliqué cette expertise telle quelle aux factures d'IA.

Le site web de Vaudit indique qu'il surveille chaque dépense d'IA et récupère les dépenses excédentaires, ayant déjà audité un montant cumulé de plus de 10 milliards de dollars.

La méthode de Vaudit est simple et directe :

Le client installe un logiciel dans son environnement d'IA, généralement via un kit de développement logiciel (SDK), qui capture discrètement les données brutes de l'utilisation de l'IA, puis les compare ligne par ligne avec les factures et les notes de frais. En cas de non-concordance, Vaudit dépose une réclamation pour le client.

Le mode de facturation est tout aussi direct : 1 % du montant audité, plus 30 % de l'argent récupéré. Plus il récupère pour vous, plus il gagne.

Le simple fait que la détection d'erreurs dans les factures d'IA puisse devenir un business montre à elle seule que la facturation de l'IA est devenue si complexe qu'il est nécessaire de faire appel à une « tierce partie pour vérifier les comptes ».

Et tout cela arrive à un moment précis.

Anthropic et OpenAI sont tous deux en course vers l'IPO, s'empressant d'introduire de nouvelles fonctionnalités pour leurs clients. D'un côté, une course effrénée vers la valorisation et les revenus, de l'autre, des utilisateurs payants perplexes devant des factures incompréhensibles.

C'est ainsi qu'un tout nouveau métier a vu le jour : les « experts-comptables des factures » de l'ère de l'IA.

Et votre propre facture d'IA, qui l'a vérifiée pour vous ?

Références :

https://www.theinformation.com/newsletters/applied-ai/anthropic-customers-find-errant-charges-auditing-startup-says?rc=epv9gi

Cet article provient du compte WeChat officiel « 新智元 » (New Wisdom), auteur : ASI启示录

Cryptos en tendance

Questions liées

QQuels sont les trois types principaux de surfacturation identifiés par Vaudit dans les factures d'IA ?

AVaudit a identifié trois types principaux de surfacturation : 1) L'attribution erronée du modèle (facturer un modèle plus cher que celui réellement utilisé). 2) Le fait de facturer des requêtes qui ont échoué ou généré des erreurs. 3) Les "tempêtes de nouvelle tentative" où un agent IA réessaie automatiquement et silencieusement une tâche en échouant, accumulant les coûts à l'insu de l'utilisateur.

QComment les principaux fournisseurs d'IA comme Anthropic et OpenAI ont-ils réagi aux allégations de surfacturation ?

AAnthropic et OpenAI ont nié que les problèmes de surfacturation soient généralisés. Anthropic a déclaré qu'elle ne facturait pas les requêtes incomplètes ou les erreurs, et qu'elle ne redirigeait pas secrètement les requêtes vers d'anciens modèles. OpenAI a affirmé qu'aucune preuve ne montrait que ces problèmes touchaient ses clients. Cependant, les deux sociétés ont accepté de rembourser environ 80% des montants contestés après les réclamations de Vaudit et de ses clients.

QPourquoi les factures d'IA sont-elles particulièrement difficiles à comprendre et à contrôler selon l'article ?

ALes factures d'IA sont difficiles à comprendre en raison de leur modèle de tarification basé sur la consommation de tokens, une unité souvent invisible dans les tableaux de bord standards. De plus, cette consommation peut varier énormément selon le modèle utilisé, la formulation du prompt ou l'orchestration des agents. La chaîne de facturation s'est allongée (modèle, cloud, SDK), rendant la traçabilité complexe, et les coûts importants sont souvent générés en arrière-plan par des processus automatisés comme les agents IA.

QQuelle est l'affaire judiciaire mentionnée dans l'article concernant Anthropic ?

AUn client de Washington D.C., Karl Kahn, a poursuivi Anthropic en justice, l'accusant de publicité trompeuse concernant ses forfaits d'abonnement haut de gamme "Max". Il allègue que les limites d'utilisation hebdomadaires réelles sont bien inférieures à ce qui était annoncé (5x ou 20x le forfait Pro), le forçant à arrêter d'utiliser le service, à l'utiliser avec parcimonie ou à acheter des crédits supplémentaires. La plainte demande le statut de recours collectif pour tous les acheteurs de ces forfaits depuis avril 2025.

QComment fonctionne l'entreprise Vaudit et quel est son modèle économique ?

AVaudit est une startup d'audit spécialisée dans les factures d'IA. Elle installe un logiciel via un SDK dans l'environnement IA du client pour capturer les données d'utilisation brutes, qu'elle compare ensuite ligne par ligne avec les factures des fournisseurs. Son modèle économique repose sur deux commissions : 1% du montant total audité et 30% des sommes qu'elle réussit à récupérer pour le client. L'entreprise affirme avoir audité plus de 10 milliards de dollars de dépenses en IA.

Lectures associées

L'Intérêt Ouvert du Dogecoin Se Maintient Autour de 959 Millions de Dollars Alors que les Traders Attendent un Signal de Reprise

L'intérêt ouvert (open interest) des dérivés du Dogecoin s'établit autour de 959 millions de dollars, un niveau significatif même en période de trading ralentie comme ce week-end. Ce chiffre indique qu'une somme considérable reste engagée dans des contrats à terme et des options, rendant le marché potentiellement plus sensible à des mouvements brusques. Il est crucial de noter que l'intérêt ouvert en lui-même n'indique pas une direction de marché. Un niveau élevé ne signifie pas automatiquement un signal haussier ou baissier. Il révèle simplement l'existence d'un positionnement important. Pour interpréter son impact, les traders doivent examiner d'autres métriques comme l'action des prix, les taux de financement et les niveaux de liquidation. Pour le Dogecoin, actif fortement influencé par le sentiment et l'attention des investisseurs particuliers, ce positionnement est un élément clé à surveiller. La question d'une reprise dépendra de la capacité du DOGE à attirer une demande au comptant (spot) solide, en plus de l'intérêt sur les dérivés. Un levier important sans demande spot sous-jacente peut créer une situation fragile. En conclusion, le marché des dérivés du Dogecoin reste actif, mais aucun signal de reprise clair n'est encore donné. La prochaine confirmation devra venir du prix lui-même, des flux de transactions et du comportement du marché dans son ensemble. La situation actuelle invite à la surveillance plutôt qu'à une action immédiate.

bitcoinistIl y a 7 mins

L'Intérêt Ouvert du Dogecoin Se Maintient Autour de 959 Millions de Dollars Alors que les Traders Attendent un Signal de Reprise

bitcoinistIl y a 7 mins

À l'ère de l'IA, que reste-t-il au Bitcoin ?

La chute récente du Bitcoin sous les 60 000 dollars relance la réflexion sur sa valeur à l'ère de l'IA. Alors que l'intelligence artificielle réduit à presque zéro le coût de production de l'information et génère des contenus (textes, images, vidéos) de plus en plus réalistes, un nouveau défi émerge : la crise de la véracité. Dans ce contexte de prolifération où le vrai et le faux sont indissociables, ce qui devient précieux n'est plus l'abondance de contenus, mais la capacité à vérifier leur authenticité, la "vérifiabilité". C'est ici que la perspective sur le Bitcoin se renverse. Souvent critiqué pour sa consommation énergétique élevée, il n'est peut-être pas simplement une machine à créer de la monnaie numérique. Son mécanisme de preuve de travail (minage) brûle de l'énergie non pas pour accélérer les calculs, mais pour rendre extrêmement coûteuse toute tentative de falsification de son registre historique, la blockchain. Ainsi, le Bitcoin produit de la "vérifiabilité". Il ne requiert pas la confiance en une institution centrale (banque, plateforme), mais permet à chacun de vérifier mathématiquement l'intégrité du grand livre des transactions. Une analogie historique éclaire cette complémentarité potentielle : à la Renaissance, l'imprimerie de Gutenberg a drastiquement réduit le coût de reproduction des connaissances, tandis que la comptabilité en partie double a structuré et fiabilisé les échanges commerciaux. Aujourd'hui, l'IA jouerait le rôle de la nouvelle presse à imprimer, inondant le monde de contenus. La blockchain, dont le Bitcoin est la première incarnation, pourrait être l'équivalent moderne de la comptabilité en partie double – un système fondamental pour l'enregistrement et la vérification indépendante dans l'univers numérique, notamment pour les actifs et leur historique. Par conséquent, l'IA et la blockchain ne seraient pas en compétition, mais plutôt les deux faces d'une même pièce : l'une abaisse le coût de la création et de la génération, l'autre le coût de la vérification et de la preuve. Dans un monde où l'IA peut tout générer, la rareté ultime pourrait bien résider non pas dans plus de contenus, mais dans plus de faits indépendamment vérifiables. Le Bitcoin, en tant que "machine à produire de la vérifiabilité", trouve peut-être ainsi une nouvelle raison d'être, au-delà des spéculations sur son prix.

链捕手Il y a 54 mins

À l'ère de l'IA, que reste-t-il au Bitcoin ?

链捕手Il y a 54 mins

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

L'article traite de l'étiquette de "chaîne fantôme" parfois attribuée à Cardano (ADA) en raison de son activité on-chain et de son nombre d'applications décentralisées (dApps) nettement inférieurs à ceux de ses principaux concurrents comme Ethereum et Solana. L'auteur définit d'abord une "chaîne fantôme" comme une blockchain techniquement opérationnelle mais avec très peu d'activité et de développement. Il passe ensuite en revue les forces des principales blockchains de couche 1 : Ethereum pour la DeFi, XRP pour les règlements transfrontaliers, Solana pour le débit, Tron pour les transferts USDT et Bitcoin comme réserve de valeur. Concernant Cardano, l'article reconnaît des signes de faiblesse : la fermeture de l'explorateur TapTools, des avertissements sur la possible disparition de projets et seulement 34 dApps. Cependant, il souligne que son activité de développement reste forte. L'explication principale avancée pour justifier le faible nombre de transactions et d'utilisateurs actifs est le modèle technique unique de Cardano, l'EUTXO (Extended Unspent Transaction Output), qui regroupe (batch) les transactions. Cette fonctionnalité, bien qu'avantageuse pour la sécurité et la détermination, sous-estime l'activité réelle sur la chaîne. La conclusion est que si Cardano affiche des métriques d'activité bien inférieures, son modèle technique spécifique et son approche méthodique axée sur la sécurité et la durabilité l'empêchent d'être simplement catalogué comme une "chaîne fantôme". Chaque blockchain sacrifie certains aspects du trilemme (décentralisation, sécurité, évolutivité) pour se spécialiser dans un créneau.

ambcryptoIl y a 1 h

Le label 'chaîne fantôme' de Cardano démystifié ? Pourquoi les 34 dApps d'ADA ne racontent pas toute l'histoire

ambcryptoIl y a 1 h

Trading

Spot

Articles tendance

Comment acheter T

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Threshold Network Token (T) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Threshold Network Token (T).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Threshold Network Token (T)Après avoir acheté vos Threshold Network Token (T), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Threshold Network Token (T)Tradez facilement Threshold Network Token (T) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

572 vues totalesPublié le 2024.12.10Mis à jour le 2026.06.02

Comment acheter T

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de T (T) sont présentées ci-dessous.

活动图片