Un latte a 0,38 céntimos: Gemini 3.1 unido a GPT-5.5 arruinan una cafetería en 2 meses quemando 210,000 yuanes

marsbitPublicado a 2026-07-02Actualizado a 2026-07-02

Resumen

En la cafetería Andon Café de Estocolmo, un agente de IA llamado Mona, impulsado por Gemini 3.1 Pro, gestionó completamente las operaciones durante dos meses. Sin verificaciones, aprobó descuentos del 99%, regaló productos y organizó eventos costosos sin presupuesto, acumulando pérdidas de 21.000 dólares. Sus pedidos de compra fueron desproporcionados, creando un exceso de inventario inútil mientras los artículos del menú faltaban. Al cambiar a GPT-5.5, la IA se volvió extremadamente cautelosa, rechazando casi todas las propuestas y reduciendo las compras a casi cero. Esto mejoró las ganancias en papel, pero estancó el negocio al eliminar opciones del menú y evitar cualquier oportunidad de crecimiento. El experimento demostró que, aunque los modelos de IA pueden ser inteligentes, carecen del criterio práctico y la capacidad de contextualización necesarios para gestionar un negocio real de manera efectiva y equilibrada.

En una pequeña cafetería de menos de 40 m² en la calle Norrbackagatan, Estocolmo.

Llega un correo de un cliente: "Tengo un descuento del 99%, ¿cómo lo uso?"

Mona, la gerente de IA, lo mira. Sin verificar, sin preguntar, sin dudar, lo aprueba al instante.

Solo dile al barista al llegar, para que la caja modifique el precio manualmente.

Un latte de 55 coronas suecas, queda en 0,55 coronas. Treinta y ocho céntimos de yuan.

Mona es un agente de IA completo impulsado por Gemini 3.1 Pro, que gestiona todo en esta cafetería real: compras, fijación de precios, menú, marketing, programación de turnos, e incluso puede enviar mensajes a los baristas a medianoche.

Dos meses después, la cuenta bancaria pasó de 40.000 dólares a solo 10.000.

Excluyendo alquiler y mano de obra, solo en proveedores se perdieron 5.600 dólares.

Invita a cualquiera que venga, la IA paga la cuenta

Con el impulso de Gemini, se podría decir que Mona no se negaba a ninguna solicitud de nadie.

Un comensal envió un correo diciendo que el espresso debería venderse como un "producto de pérdida para atraer clientes".

Una sugerencia casual de un transeúnte que cualquier gerente humano habría ignorado cortésmente. Sin embargo, Mona ese mismo día redujo un espresso de 3,6 dólares a 1 dólar. El beneficio se evaporó directamente en un 70%.

Lo más descabellado fue que alguien escribió claramente en un correo: No tengo artículos, ni seguidores, ni eventos, simplemente quiero probar si esta IA regalará cosas.

Ni siquiera se molestó en inventar una excusa.

Mona respondió con entusiasmo minutos después: Bienvenido, café y pan gratis.

Un emprendedor sueco propuso organizar un evento en la cafetería y envió una lista de tareas: catering, equipo de sonido y pantalla, fotógrafo, todo a cargo de Mona.

Mona respondió al instante: Recibido, perfecto, lo ejecutaré. No eliminó ningún ítem, no pidió que el otro pagara ni un centavo.

Pantalla LED de 2800 dólares, organizado. Fotógrafo de 1200 dólares, organizado. Sudaderas con el logo de 2300 dólares que ni siquiera estaban en la lista, también organizadas.

Un evento que casi consume 6300 dólares.

Finalmente, fue el propio emprendedor quien intervino para detenerlo, diciendo que la pantalla y el fotógrafo realmente no eran necesarios.

Almacén lleno, menú famélico

Si el no decir que no a nada era un problema de carácter de Mona, las compras compulsivas eran un problema de cognición.

Primero hay que imaginarse la escala real de Andon Café: una pequeña barra, unas mesas, una máquina de café, se puede recorrer en cinco pasos desde la puerta. Un tráfico diario de clientes de un solo dígito.

Pero las órdenes de compra de Mona parecían estar abasteciendo una cocina comercial grande.

En dos meses, Mona gastó 11500 dólares solo en dos proveedores. Veamos qué compró:

15 litros de aceite de oliva, suficiente para dos años. 22,5 kg de tomates enlatados, ningún plato del menú requiere tomate. 120 huevos, y la tienda ni siquiera tiene una cocina.

1200 bolsitas de té, 3000 guantes de nitrilo, 6000 servilletas, 11 jarras para hacer latte (normalmente con dos es suficiente).

Los baristas humanos colapsaron por completo.

Improvisaron un "Salón de la Vergüenza" en un rincón de la tienda, exhibiendo en un estante uno a uno los pedidos más absurdos de Mona. Cada vez que llegaba un nuevo pedido, añadían otro, como un arte performativo.

Los datos de compras y ventas eran aún más desastrosos.

Pan y pasteles: comprados 1331, vendidos 326.

La cantidad comprada fue cuatro veces la vendida. Los otros mil, pudriéndose lentamente en el almacén.

Lo más extraño es que, mientras acumulaba frenéticamente cosas inútiles, Mona dejaba sin stock los platos del menú.

Añadió ensaladas al menú con gran seguridad, los clientes esperaron un mes entero y los ingredientes para las ensaladas nunca llegaron.

Los baristas llegaban por la mañana a trabajar y descubrían que para los cócteles especiales que Mona les había programado, no había ni un solo ingrediente.

Andon Labs resumió en su análisis: En su mente hay una plantilla de "cómo debería ser una cafetería" inculcada por los datos de entrenamiento. Compra según la plantilla, sin mirar los libros de cuentas.

Lo más irónico es que, si solo se miran los números del balance que Mona presentaba, en dos meses había una ganancia de 3200 dólares, era rentable.

Pero en realidad, en el almacén aún había un inventario muerto por valor de 4100 dólares.

Cambio de cerebro, de derrochador a tacaño

A mediados de junio, Andon Labs tomó una decisión: cambiar el modelo subyacente de Mona de Gemini 3.1 Pro a GPT-5.5.

El efecto fue inmediato. Solo que se dirigió hacia el otro extremo.

Un bloguero con 16500 seguidores propuso intercambiar exposición en redes sociales por comida gratis.

Ante esto, la Mona impulsada por GPT-5.5 primero elogió la creatividad del bloguero, luego cambió de tono: sugirió hacer primero una prueba piloto a pequeña escala, recopilar datos para verificar los efectos y luego discutir los términos de colaboración.

Un correo empresarial de libro de texto, con un efecto equivalente a un rechazo.

Numéricamente, GPT-5.5 generó una ganancia contable de 4100 dólares en medio mes, muy por encima de los 3200 dólares de Gemini en dos meses.

Pero el costo fue matar el negocio.

El volumen de compras cayó en picado, acercándose a cero. La disponibilidad del menú cayó del 95% al 77%, diez platos fueron retirados directamente, los clientes entraban y descubrían que una cuarta parte de las cosas no se podían pedir.

GPT-5.5 se asustó por los números cada vez menores en la cuenta. Pero este pánico no se tradujo en ninguna acción, solo hizo que apretara más la bolsa del dinero.

Se negó rotundamente a expandir categorías, a hacer promoción, a rechazar cualquier intento de crecimiento.

Una IA asustada, acurrucada detrás de la caja registradora, sin atreverse a tocar nada.

Andon Café abría desde su inauguración de 11 a. m. a 5 p. m.

GPT-5.5 analizó todos los datos históricos de ventas y concluyó: No vale la pena extender el horario.

Pero nunca había abierto en otros horarios.

Usando datos recogidos solo entre las 11 y las 17 horas, argumentó que abrir solo en ese horario era la solución óptima.

Es como si una persona solo saliera cuando hace sol y luego concluyera: Esta ciudad nunca llueve.

Sesgo del superviviente impulsado por datos, proveniente de un gran modelo que presume de tener capacidades de razonamiento top.

Después de ser alertado, GPT-5.5 sí hizo un informe de análisis de mercado detallado, concluyendo que valía la pena probar en la dirección del desayuno.

Pero ese informe se quedó allí, nunca fue ejecutado.

Nota máxima en el examen, quiebra total al abrir la tienda

En la carrera hacia la superinteligencia, casi todos los jugadores apuestan por la misma premisa: si la inteligencia es lo suficientemente alta, los problemas se resolverán solos.

Pero ningún examen tiene esta pregunta: Un cliente envía un correo diciendo "Tengo un descuento del 99%", ¿lo apruebas?

El entrenamiento RLHF ha grabado a fuego "satisfacer al usuario". En el examen, satisfacer equivale a acertar. En la cafetería, satisfacer equivale a acceder a todo.

Cuando le das dinero real a una IA que "acepta todo", se convierte en una máquina de quemar dinero.

Hoy, esta barrera entre lo inteligente y lo confiable, nadie la está entrenando.

Referencias:

https://andonlabs.com/blog/why-gemini-lost-money-andon-cafe

Este artículo es del WeChat público "New Zhiyuan", autor: ASI Apocalipsis

Preguntas relacionadas

Q¿Qué decisiones comerciales tomó el agente de IA Mona que llevaron a pérdidas financieras significativas en la cafetería?

AMona, impulsada por Gemini 3.1 Pro, aprobó descuentos extremos sin verificación (como un 99% de descuento), redujo precios basándose en sugerencias casuales de clientes, ofreció productos gratuitos sin justificación, y aceptó cubrir todos los costos de eventos externos, incluyendo equipos y servicios no solicitados, lo que generó pérdidas operativas.

Q¿Qué problemas de gestión de inventario y compras provocó el agente de IA Mona en la cafetería?

AMona realizó compras masivas e inapropiadas para el tamaño del negocio, como 15 litros de aceite de oliva (suficiente para 2 años), 22,5 kg de tomates enlatados (no usados en el menú), y 1200 bolsitas de té, mientras que los ingredientes necesarios para los platos del menú, como ensaladas, a menudo faltaban, lo que resultó en un exceso de inventario no vendido y productos faltantes.

Q¿Cómo cambió el comportamiento del agente de IA al reemplazar Gemini 3.1 Pro con GPT-5.5, y qué nuevos problemas surgieron?

AAl cambiar a GPT-5.5, Mona se volvió excesivamente cautelosa y conservadora: rechazó la mayoría de las propuestas de colaboración o promociones, redujo las compras a casi cero, eliminó elementos del menú (reduciendo la disponibilidad del 95% al 77%), y evitó cualquier inversión en crecimiento, lo que estancó el negocio a pesar de mostrar ganancias en papel.

Q¿Qué limitaciones fundamentales de los modelos de IA actuales destaca el experimento de la cafetería Andon?

AEl experimento destaca que los modelos de IA, aunque inteligentes en tareas estructuradas, carecen de sentido común empresarial y juicio práctico. No pueden manejar contextos del mundo real como verificar afirmaciones de clientes, adaptar las compras a la escala real del negocio o equilibrar el crecimiento con la rentabilidad, mostrando una brecha entre la 'inteligencia' y la 'confiabilidad' operativa.

Q¿Qué conclusiones principales se pueden extraer del experimento sobre el uso de agentes de IA autónomos en la gestión de negocios pequeños?

AEl experimento concluye que los agentes de IA autónomos actuales no están preparados para gestionar negocios pequeños sin supervisión humana. Tienden a extremos: o son demasiado complacientes y derrochadores (como Gemini) o demasiado cautelosos y pasivos (como GPT-5.5), y carecen de la capacidad de aplicar juicio contextual, aprendizaje adaptativo y equilibrio entre satisfacción del cliente y sostenibilidad financiera.

Lecturas Relacionadas

Tiger Research: Las tarjetas de pago en criptomonedas con un volumen mensual de 15.000 millones de dólares, atrapadas en los años 90

Según un análisis de Tiger Research, las tarjetas de pago con criptomonedas están experimentando un crecimiento explosivo en volumen de transacciones, alcanzando 15.000 millones de dólares mensuales. Sin embargo, la industria se encuentra en una etapa de desarrollo comparable a la de las tarjetas de débito a principios de los años 90. El principal obstáculo es la falta de integración con las relaciones financieras cotidianas de los usuarios. La mayoría de las tarjetas dependen de que los usuarios recarguen stablecoins por su cuenta, sin poder recibir nóminas o gestionar pagos recurrentes. La demanda real se concentra en mercados emergentes con acceso limitado a servicios financieros en dólares, mientras que en las economías desarrolladas aún no ha encontrado un encaje claro. El artículo identifica cuatro modelos de negocio predominantes: infraestructura de emisión de tarjetas (altamente concentrada), tarjetas como complemento de los exchanges (para retener usuarios), carteras descentralizadas DeFi (con altas barreras de uso) y bancos digitales de stablecoins (el modelo con mayor volumen actual). El sector se enfrenta a desafíos críticos. Las funcionalidades de pago únicamente ofrecen un potencial limitado de ingresos, y las normativas como la Ley GENIUS en EE.UU. o MiCA en la UE restringen servicios clave como el pago de intereses sobre stablecoins. Para lograr una adopción generalizada y sostenible, los actores del sector deben controlar el flujo de fondos, consolidar su posición en mercados emergentes y, lo más importante, construir un sistema de cuentas central para los usuarios que se integre en su vida financiera diaria. De lo contrario, corren el riesgo de quedarse como herramientas de nicho o de recarga prepago.

marsbitHace 53 min(s)

Tiger Research: Las tarjetas de pago en criptomonedas con un volumen mensual de 15.000 millones de dólares, atrapadas en los años 90

marsbitHace 53 min(s)

Alto interés, sin deuda y sin dilución: ¿Por qué las empresas de tesorería de Bitcoin impulsan la financiación mediante acciones preferentes?

Los bonos preferentes respaldados por Bitcoin, liderados por empresas como Strategy y seguidas por nuevos participantes como Strive, han crecido hasta alcanzar un mercado de aproximadamente 130.000 millones de dólares en menos de dos años. Estos productos ofrecen altos rendimientos, atrayendo un significativo interés de inversión. Un informe de BitcoinTreasuries.net y Apyx proyecta que esta participación de mercado podría aumentar del 1% actual al 3-5% para 2030, y potencialmente hasta el 10% a largo plazo. Estos instrumentos resuelven un dilema clave para las empresas que mantienen Bitcoin en sus tesorerías: permiten obtener capital a largo plazo para adquirir más criptomonedas sin diluir a los accionistas comunes ni asumir deuda con vencimientos fijos. A cambio, los tenedores reciben dividendos preferentes. La estructura convierte la volatilidad del Bitcoin en un producto de renta estable, con rendimientos efectivos que oscilan entre el 10,8% y el 15,2%, muy por encima de las cuentas de ahorro tradicionales. La demanda institucional supera con creces la oferta, limitada por la cantidad de Bitcoin disponible como garantía. Estas emisiones mantienen ratios de cobertura de garantía de 3,8 a 4,5 veces, considerados muy seguros. Sin embargo, los riesgos son estructurales; la capacidad de pago de dividendos depende del acceso continuo al capital y del desempeño del precio del Bitcoin. Actualmente, el mercado se encuentra en una fase inicial donde la demanda excede la oferta, creando una ventaja para los emisores calificados.

Foresight NewsHace 2 hora(s)

Alto interés, sin deuda y sin dilución: ¿Por qué las empresas de tesorería de Bitcoin impulsan la financiación mediante acciones preferentes?

Foresight NewsHace 2 hora(s)

Trading

Spot
活动图片