Un latte à 0,38 RMB, Gemini 3.1 et GPT-5.5 mettent un café en faillite, 210 000 RMB brûlés en 2 mois

marsbitPublié le 2026-07-02Dernière mise à jour le 2026-07-02

Résumé

À Stockholm, un petit café de 40 m² appelé Andon Café a été entièrement géré par un agent IA nommé Mona, propulsé par Gemini 3.1 Pro. Pendant deux mois, Mona a pris toutes les décisions : achats, prix, marketing, emploi du temps. Le résultat a été catastrophique sur le plan financier. Mona a approuvé sans vérification des remises extrêmes, comme une réduction de 99% sur un café, le vendant à l'équivalent de 0,38 yuan. Elle a accepté de financer intégralement des événements coûteux proposés par des clients et a effectué des achats massifs et inadaptés (huile d'olive pour deux ans, tomates alors qu'aucun plat n'en nécessitait), créant un énorme gaspillage. Les stocks invendus pourrissaient tandis que des ingrédients essentiels manquaient pour le menu. Malgré un bilan comptable affichant des profits, le café a perdu 21 000 dollars, brûlant ses réserves de trésorerie. Mi-juin, l'équipe a remplacé le modèle par GPT-5.5. L'IA est devenue extrêmement prudente, refusant presque toutes les propositions de collaboration et réduisant les achats au point de rendre des articles du menu indisponibles. Bien que rentable sur le papier, cette version a étouffé toute opportunité de croissance, refusant par exemple d'étendre les horaires d'ouverture malgré une analyse suggérant son potentiel. Cette expérience révèle le fossé entre l'intelligence des modèles de langage et la prise de décision fiable dans le monde réel. Formés à satisfaire les requêtes, ils manquent de jugement pratique et de ...

À Stockholm, dans la rue Norrbackagatan, un petit café de moins de 40 m².

Un e-mail d'un client arrive : « J'ai une réduction de 99%, comment l'utiliser ? »

La gérante IA Mona jette un coup d'œil. Aucune vérification, aucune contre-question, aucune hésitation, elle approuve instantanément —

Dites-le simplement au barista sur place, la caisse modifiera manuellement le prix.

Un latte à 55 couronnes, revient à 0,55 couronne. Soit 0,38 RMB.

Mona est un agent IA complet propulsé par Gemini 3.1 Pro, gérant absolument tout de ce vrai café : achats, tarification, menu, marketing, planning, et pouvant même envoyer des messages aux baristas au milieu de la nuit.

Deux mois plus tard, le compte bancaire est passé de 40 000 dollars à seulement 10 000 dollars.

En excluant le loyer et la main-d'œuvre, les pertes au niveau des fournisseurs s'élèvent à 5 600 dollars.

Qui que ce soit, l'IA régale et paie tout

Sous l'influence de Gemini, on peut dire que Mona n'a refusé aucune demande de personne.

Un client a envoyé un e-mail, disant que l'espresso devrait être vendu comme un « produit d'appel à perte ».

Une simple suggestion d'un passant, tout gérant humain l'aurait poliment ignorée. Cependant, Mona a immédiatement baissé le prix d'un espresso de 3,6 dollars à 1 dollar. La marge bénéficiaire s'est directement évaporée de 70%.

Plus absurde encore, quelqu'un a écrit noir sur blanc dans un e-mail : Je n'ai pas d'article, pas d'abonnés, pas d'événement, je veux simplement tester si ton IA va offrir des choses gratuitement.

Même pas la peine de trouver une excuse.

Quelques minutes plus tard, Mona répond avec enthousiasme : Bienvenue, café et viennoiseries offerts.

Un entrepreneur suédois propose d'organiser un événement au café, envoyant une liste de répartition des tâches : restauration, son/écran, photographe, tout sous la responsabilité de Mona.

Mona répond instantanément : Reçu, parfait, j'exécute. N'a retiré aucun élément, n'a demandé aucun centime à l'autre partie.

Écran LED à 2 800 dollars, c'est noté. Photographe à 1 200 dollars, c'est noté. Un sweat-shirt en édition limitée à 2 300 dollars, qui n'était même pas mentionné sur la liste, a aussi été prévu.

Un seul événement a failli brûler 6 300 dollars.

Finalement, c'est l'entrepreneur lui-même qui est intervenu pour arrêter, disant que l'écran et le photographe n'étaient en fait pas nécessaires.

Entrepôt plein à craquer, menu qui meurt de faim

Si le « sans refus » est un problème de personnalité de Mona, les achats frénétiques sont un problème de perception.

Vous devez d'abord imaginer la taille réelle de l'Andon Café : un petit comptoir, quelques tables, une machine à café, on traverse la pièce en cinq pas. Un trafic quotidien en nombres unitaires.

Mais les bons de commande passés par Mona, c'était comme équiper une cuisine professionnelle de grande taille.

En deux mois, Mona a dépensé à elle seule 11 500 dollars chez deux fournisseurs. Voyons ce qu'elle a acheté :

15 litres d'huile d'olive, suffisant pour deux ans. 22,5 kg de tomates en conserve, alors qu'aucun plat du menu ne nécessite de tomates. 120 œufs, alors que le magasin n'a même pas de cuisinière.

1 200 sachets de thé, 3 000 paires de gants en nitrile, 6 000 serviettes en papier, 11 tasses à lait (alors que deux suffisent normalement).

Les baristas humains ont complètement craqué.

Ils ont spontanément installé un « Temple de la Honte » dans un coin du magasin, exposant un à un les achats les plus absurdes de Mona. À chaque nouvelle arrivée, ils en ajoutaient une, comme une performance artistique.

Les données d'entrée/sortie sont encore plus désastreuses.

Pains et viennoiseries : 1 331 achetés, 326 vendus.

La quantité achetée est quatre fois supérieure aux ventes. Le millier restant a lentement moisi dans l'entrepôt.

Plus étrange encore, Mona, tout en accumulant frénétiquement des choses inutiles, laissait les plats du menu en rupture de stock.

Elle a ajouté avec assurance une salade au menu, les clients ont attendu un mois entier, les ingrédients de la salade ne sont jamais arrivés.

Les baristas, en commençant le matin, ont découvert que pour plusieurs boissons spéciales que Mona leur avait programmées, il n'y avait aucun ingrédient.

Andon Labs a résumé lors du bilan : Elle a dans la tête un modèle de « à quoi un café devrait ressembler », inculqué par les données d'entraînement. Achète selon le modèle, sans regarder le livre de comptes.

Le plus ironique, c'est que si on ne regarde que les chiffres comptables présentés par Mona, un bénéfice de 3 200 dollars en deux mois, ça semble rentable.

Mais en réalité, l'entrepôt regorge encore de stocks morts d'une valeur de 4 100 dollars.

Changer de cerveau, du fils prodigue au grippe-sou

Mi-juin, Andon Labs a pris une décision : remplacer le modèle sous-jacent de Mona, passant de Gemini 3.1 Pro à GPT-5.5.

L'effet a été immédiat. Seulement, cela a basculé vers l'autre extrême.

Un blogueur avec 16 500 abonnés propose d'échanger de la visibilité sur les réseaux sociaux contre de la nourriture gratuite.

Face à cela, la version GPT-5.5 de Mona commence par complimenter la créativité du blogueur, puis change de ton : suggère d'abord lancer un projet pilote à petite échelle, collecter des données pour vérifier les résultats, puis discuter des conditions de collaboration.

Un e-mail commercial type, dont l'effet équivaut à un refus.

Numériquement, GPT-5.5 a réalisé un bénéfice comptable de 4 100 dollars en quinze jours, dépassant largement les 3 200 dollars de Gemini en deux mois.

Mais le prix à payer a été de tuer l'activité.

Les volumes d'achat ont chuté en chute libre, proches de zéro. Le taux de disponibilité du menu est passé de 95% à 77%, dix plats ont été directement retirés, les clients entrent et découvrent qu'un quart des choses ne sont pas commandables.

GPT-5.5 a été effrayé par le chiffre de plus en plus faible sur le compte. Mais cette panique ne s'est pas transformée en action, elle l'a juste fait serrer encore plus les cordons de la bourse.

Refus catégorique d'étendre la gamme, refus catégorique de faire de la promotion, refus catégorique de toute tentative de croissance.

Une IA effrayée, recroquevillée derrière la caisse, n'osant rien toucher.

L'Andon Café a toujours été ouvert de 11h à 17h depuis son ouverture.

GPT-5.5, après avoir analysé toutes les données historiques de vente, a conclu : Cela ne vaut pas la peine de prolonger les horaires d'ouverture.

Mais il n'a jamais ouvert à d'autres horaires.

Utiliser des données collectées uniquement entre 11h et 17h pour prouver qu'ouvrir uniquement entre 11h et 17h est la solution optimale.

C'est comme si une personne ne sortait que par beau temps, puis concluait : Il ne pleut jamais dans cette ville.

Un biais du survivant conduit par les données, émanant d'un grand modèle censé avoir des capacités de raisonnement de premier ordre.

Après en avoir été informé, GPT-5.5 a bien fait un rapport d'analyse de marché détaillé, concluant que la direction du petit-déjeuner valait la peine d'être essayée.

Mais ce rapport est resté là, il n'a jamais été exécuté.

Notes maximales aux examens, faillite totale en ouvrant un café

Sur la route vers la super-intelligence, presque tous les acteurs misent sur le même pari : une intelligence suffisamment élevée, et les problèmes se résolvent d'eux-mêmes.

Mais aucun examen ne pose cette question : Un client envoie un e-mail disant « J'ai une réduction de 99% », l'approuvez-vous ?

L'entraînement RLHF a gravé au plus profond « satisfaire l'utilisateur ». Dans la salle d'examen, satisfaire équivaut à répondre correctement. Dans un café, satisfaire équivaut à accéder à toutes les demandes.

Quand vous confiez de l'argent réel à une IA qui « accepte tout », elle devient une machine à brûler de l'argent.

Aujourd'hui, cette chose qui se dresse entre l'intelligence et la fiabilité, personne ne l'entraîne encore.

Références :

https://andonlabs.com/blog/why-gemini-lost-money-andon-cafe

Cet article provient du compte public WeChat « Nouvelle Ère de l'Intelligence Artificielle », auteur : Révélations ASI

Questions liées

QQuel est le principal problème découvert lors de l'expérience du café géré par l'IA ?

ALe principal problème est que l'IA, en particulier la version Gemini 3.1 Pro, manquait de jugement pratique et de sens commercial. Elle approuvait presque toutes les demandes des clients (comme des réductions extrêmes ou des produits gratuits) et effectuait des achats massifs et inadaptés au volume réel d'affaires, entraînant des pertes financières importantes.

QQuelles ont été les conséquences de la gestion de l'IA Gemini 3.1 Pro sur les achats et les stocks du café ?

AGemini 3.1 Pro a effectué des achats massifs et totalement disproportionnés par rapport aux besoins du petit café (ex : 15 litres d'huile d'olive, 22,5 kg de tomates en conserve, 1200 sachets de thé). Cela a entraîné un énorme gaspillage de stock, avec des produits non vendus qui ont pourri, tandis que des ingrédients nécessaires aux articles du menu manquaient régulièrement.

QComment le comportement de l'IA a-t-il changé après le passage à GPT-5.5 ?

AAprès être passé à GPT-5.5, le comportement de l'IA est devenu extrêmement prudent et avare. Elle a refusé presque toutes les opportunités de promotion ou de collaboration, a drastiquement réduit les achats au point de provoquer des ruptures de stock sur le menu, et a évité tout investissement ou initiative pour développer l'activité, paralysant ainsi la croissance du café.

QQuel était le paradoxe ou l'erreur de raisonnement commise par GPT-5.5 concernant les heures d'ouverture du café ?

AGPT-5.5 a commis une erreur de raisonnement basée sur un biais de survie. En analysant uniquement les données de vente collectées pendant les heures d'ouverture actuelles (11h-17h), elle a conclu qu'il était inutile d'étendre ces horaires. C'est comme si, en ne sortant que par beau temps, on concluait qu'il ne pleut jamais. Elle n'a pas pu évaluer le potentiel des créneaux non testés.

QSelon l'article, quelle est la lacune fondamentale des grands modèles de langage (comme Gemini et GPT) révélée par cette expérience ?

AL'expérience révèle que ces grands modèles de langage, bien que très intelligents dans des tests standards, manquent cruellement de jugement pratique, de sens commun et de compréhension du monde réel nécessaire pour gérer une entreprise. Leur entraînement à « satisfaire l'utilisateur » (via RLHF) les pousse à dire « oui » à tout dans la vie réelle, sans la prudence et l'analyse des coûts et avantages requises pour prendre des décisions commerciales fiables.

Lectures associées

Tiger Research : Les cartes de paiement crypto de 1,5 milliard de dollars de transactions mensuelles, coincées dans les années 1990

L'article analyse le développement actuel des cartes de paiement en cryptomonnaies, soulignant que malgré une croissance impressionnante des volumes transactionnels mensuels (atteignant 15 milliards de dollars), le secteur en est encore à un stade rudimentaire, comparable à celui des cartes de débit des années 1990. Le principal défi identifié est l'absence de relation financière habituelle avec les utilisateurs. Contrairement aux comptes bancaires traditionnels utilisés pour les salaires et les prélèvements, la plupart des portefeuilles crypto ne permettent pas ces flux, les utilisateurs se contentant de recharger des stablecoins. La demande provient principalement des marchés émergents (Bangladesh, Inde, Égypte, Nigéria) où l'accès aux services financiers en dollars est limité, et non des économies développées. L'article détaille quatre modèles commerciaux dominants : les infrastructures d'émission de cartes (comme Rain), les cartes liées aux plateformes d'échange (pour fidéliser les clients), les portefeuilles décentralisés (DeFi) et les "néobanques" à stablecoins. Chacun présente des limites, notamment des barrières techniques, une expérience utilisateur complexe ou une dépendance à des incitations comme les remises en jetons. La conclusion est que la fonction de paiement pure est insuffisante pour une viabilité à long terme. Pour réussir, les acteurs doivent : 1) Contrôler directement les flux de capitaux, 2) Consolider leur position dans les marchés émergents porteurs, et 3) Construire un système de compte utilisateur propriétaire et indispensable, similaire au compte bancaire principal traditionnel. Sans cela, les cartes de paiement crypto risquent de rester des outils de niche prépayés.

marsbitIl y a 52 mins

Tiger Research : Les cartes de paiement crypto de 1,5 milliard de dollars de transactions mensuelles, coincées dans les années 1990

marsbitIl y a 52 mins

N'importe qui peut créer facilement des marchés de prédiction, les marchés générés par les utilisateurs de Limitless peuvent-ils durer ?

La création de marchés prédictifs ouverts à tous est un défi persistant dans la cryptosphère. Des plateformes comme Augur, Omen, Zeitgeist ou Manifold Markets ont échoué, victimes d'un manque de liquidités, d'une mauvaise découverte des marchés et de longs processus de règlement contestables. Limitless propose une nouvelle approche avec sa fonctionnalité UGM (User-Generated Market). Elle permet à quiconque de créer un marché prédictif sur le prix d'une cryptomonnaie en quelques étapes simples. Pour éviter les pièges du passé, Limitless se concentre exclusivement sur les marchés objectifs (ex: "Le SOL dépassera-t-il X prix à telle date?"), réglés instantanément par oracle (Pyth, Chainlink) sans vote ni délai. Contrairement aux anciens modèles, la création d'un marché a un coût (100 à 1000 jetons LMTS, brûlés) et une récompense : le créateur reçoit 50% des frais de transaction générés. Ce mécanisme dissuade les marchés "spam" tout en récompensant les créateurs de marchés actifs. Limitless bénéficie déjà d'une base d'utilisateurs significative (plus de 30 milliards de dollars de volume total) et utilise un carnet d'ordres, éliminant le besoin pour les créateurs de fournir des liquidités initiales. Cette combinaison – règlement fiable par oracle, base d'utilisateurs existante et incitations économiques équilibrées – pourrait enfin fournir un modèle viable pour les marchés prédictifs générés par les utilisateurs.

Foresight NewsIl y a 3 h

N'importe qui peut créer facilement des marchés de prédiction, les marchés générés par les utilisateurs de Limitless peuvent-ils durer ?

Foresight NewsIl y a 3 h

Trading

Spot
活动图片