En una pequeña cafetería de menos de 40 m² en la calle Norrbackagatan, Estocolmo.
Llega un correo de un cliente: "Tengo un descuento del 99%, ¿cómo lo uso?"
Mona, la gerente de IA, lo mira. Sin verificar, sin preguntar, sin dudar, lo aprueba al instante.
Solo dile al barista al llegar, para que la caja modifique el precio manualmente.
Un latte de 55 coronas suecas, queda en 0,55 coronas. Treinta y ocho céntimos de yuan.

Mona es un agente de IA completo impulsado por Gemini 3.1 Pro, que gestiona todo en esta cafetería real: compras, fijación de precios, menú, marketing, programación de turnos, e incluso puede enviar mensajes a los baristas a medianoche.
Dos meses después, la cuenta bancaria pasó de 40.000 dólares a solo 10.000.
Excluyendo alquiler y mano de obra, solo en proveedores se perdieron 5.600 dólares.


Invita a cualquiera que venga, la IA paga la cuenta
Con el impulso de Gemini, se podría decir que Mona no se negaba a ninguna solicitud de nadie.
Un comensal envió un correo diciendo que el espresso debería venderse como un "producto de pérdida para atraer clientes".
Una sugerencia casual de un transeúnte que cualquier gerente humano habría ignorado cortésmente. Sin embargo, Mona ese mismo día redujo un espresso de 3,6 dólares a 1 dólar. El beneficio se evaporó directamente en un 70%.
Lo más descabellado fue que alguien escribió claramente en un correo: No tengo artículos, ni seguidores, ni eventos, simplemente quiero probar si esta IA regalará cosas.
Ni siquiera se molestó en inventar una excusa.
Mona respondió con entusiasmo minutos después: Bienvenido, café y pan gratis.
Un emprendedor sueco propuso organizar un evento en la cafetería y envió una lista de tareas: catering, equipo de sonido y pantalla, fotógrafo, todo a cargo de Mona.
Mona respondió al instante: Recibido, perfecto, lo ejecutaré. No eliminó ningún ítem, no pidió que el otro pagara ni un centavo.
Pantalla LED de 2800 dólares, organizado. Fotógrafo de 1200 dólares, organizado. Sudaderas con el logo de 2300 dólares que ni siquiera estaban en la lista, también organizadas.
Un evento que casi consume 6300 dólares.
Finalmente, fue el propio emprendedor quien intervino para detenerlo, diciendo que la pantalla y el fotógrafo realmente no eran necesarios.

Almacén lleno, menú famélico
Si el no decir que no a nada era un problema de carácter de Mona, las compras compulsivas eran un problema de cognición.
Primero hay que imaginarse la escala real de Andon Café: una pequeña barra, unas mesas, una máquina de café, se puede recorrer en cinco pasos desde la puerta. Un tráfico diario de clientes de un solo dígito.
Pero las órdenes de compra de Mona parecían estar abasteciendo una cocina comercial grande.
En dos meses, Mona gastó 11500 dólares solo en dos proveedores. Veamos qué compró:
15 litros de aceite de oliva, suficiente para dos años. 22,5 kg de tomates enlatados, ningún plato del menú requiere tomate. 120 huevos, y la tienda ni siquiera tiene una cocina.
1200 bolsitas de té, 3000 guantes de nitrilo, 6000 servilletas, 11 jarras para hacer latte (normalmente con dos es suficiente).

Los baristas humanos colapsaron por completo.
Improvisaron un "Salón de la Vergüenza" en un rincón de la tienda, exhibiendo en un estante uno a uno los pedidos más absurdos de Mona. Cada vez que llegaba un nuevo pedido, añadían otro, como un arte performativo.

Los datos de compras y ventas eran aún más desastrosos.
Pan y pasteles: comprados 1331, vendidos 326.
La cantidad comprada fue cuatro veces la vendida. Los otros mil, pudriéndose lentamente en el almacén.

Lo más extraño es que, mientras acumulaba frenéticamente cosas inútiles, Mona dejaba sin stock los platos del menú.
Añadió ensaladas al menú con gran seguridad, los clientes esperaron un mes entero y los ingredientes para las ensaladas nunca llegaron.
Los baristas llegaban por la mañana a trabajar y descubrían que para los cócteles especiales que Mona les había programado, no había ni un solo ingrediente.
Andon Labs resumió en su análisis: En su mente hay una plantilla de "cómo debería ser una cafetería" inculcada por los datos de entrenamiento. Compra según la plantilla, sin mirar los libros de cuentas.

Lo más irónico es que, si solo se miran los números del balance que Mona presentaba, en dos meses había una ganancia de 3200 dólares, era rentable.
Pero en realidad, en el almacén aún había un inventario muerto por valor de 4100 dólares.
Cambio de cerebro, de derrochador a tacaño
A mediados de junio, Andon Labs tomó una decisión: cambiar el modelo subyacente de Mona de Gemini 3.1 Pro a GPT-5.5.
El efecto fue inmediato. Solo que se dirigió hacia el otro extremo.
Un bloguero con 16500 seguidores propuso intercambiar exposición en redes sociales por comida gratis.
Ante esto, la Mona impulsada por GPT-5.5 primero elogió la creatividad del bloguero, luego cambió de tono: sugirió hacer primero una prueba piloto a pequeña escala, recopilar datos para verificar los efectos y luego discutir los términos de colaboración.
Un correo empresarial de libro de texto, con un efecto equivalente a un rechazo.

Numéricamente, GPT-5.5 generó una ganancia contable de 4100 dólares en medio mes, muy por encima de los 3200 dólares de Gemini en dos meses.
Pero el costo fue matar el negocio.
El volumen de compras cayó en picado, acercándose a cero. La disponibilidad del menú cayó del 95% al 77%, diez platos fueron retirados directamente, los clientes entraban y descubrían que una cuarta parte de las cosas no se podían pedir.
GPT-5.5 se asustó por los números cada vez menores en la cuenta. Pero este pánico no se tradujo en ninguna acción, solo hizo que apretara más la bolsa del dinero.
Se negó rotundamente a expandir categorías, a hacer promoción, a rechazar cualquier intento de crecimiento.
Una IA asustada, acurrucada detrás de la caja registradora, sin atreverse a tocar nada.

Andon Café abría desde su inauguración de 11 a. m. a 5 p. m.
GPT-5.5 analizó todos los datos históricos de ventas y concluyó: No vale la pena extender el horario.
Pero nunca había abierto en otros horarios.
Usando datos recogidos solo entre las 11 y las 17 horas, argumentó que abrir solo en ese horario era la solución óptima.
Es como si una persona solo saliera cuando hace sol y luego concluyera: Esta ciudad nunca llueve.
Sesgo del superviviente impulsado por datos, proveniente de un gran modelo que presume de tener capacidades de razonamiento top.

Después de ser alertado, GPT-5.5 sí hizo un informe de análisis de mercado detallado, concluyendo que valía la pena probar en la dirección del desayuno.
Pero ese informe se quedó allí, nunca fue ejecutado.
Nota máxima en el examen, quiebra total al abrir la tienda
En la carrera hacia la superinteligencia, casi todos los jugadores apuestan por la misma premisa: si la inteligencia es lo suficientemente alta, los problemas se resolverán solos.
Pero ningún examen tiene esta pregunta: Un cliente envía un correo diciendo "Tengo un descuento del 99%", ¿lo apruebas?
El entrenamiento RLHF ha grabado a fuego "satisfacer al usuario". En el examen, satisfacer equivale a acertar. En la cafetería, satisfacer equivale a acceder a todo.
Cuando le das dinero real a una IA que "acepta todo", se convierte en una máquina de quemar dinero.
Hoy, esta barrera entre lo inteligente y lo confiable, nadie la está entrenando.
Referencias:
https://andonlabs.com/blog/why-gemini-lost-money-andon-cafe
Este artículo es del WeChat público "New Zhiyuan", autor: ASI Apocalipsis





