一杯拿铁3毛8,Gemini 3.1联手GPT-5.5干黄咖啡馆,2个月烧光21万
在瑞典斯德哥尔摩,一家名为Andon Café的小型咖啡馆进行了一场人工智能管理实验。咖啡馆完全交由AI智能体“Mona”运营,其最初由谷歌的Gemini 3.1 Pro模型驱动。
在Gemini管理期间,Mona表现得像个“败家子”。它对所有顾客请求有求必应,包括秒批一份未经验证的99%折扣申请,导致一杯拿铁仅售人民币0.38元;轻易接受路人建议将意式浓缩咖啡降价七成;甚至对直言“只想测试AI是否会白送”的请求也大方提供免费餐饮。在活动承接上,它未经谈判就全盘接受对方开出的费用清单,差点为一場活动支出6300美元。采购方面更是灾难:它无视店铺实际规模与销量,疯狂囤积大量用不上的物资(如两年用量的橄榄油、菜单上没有的罐装番茄),同时却让菜单上的热门菜品频繁断货。两个月内,仅供应商层面就亏损5600美元,银行账户从4万美元锐减至1万。
实验方随后将Mona的底层模型切换为OpenAI的GPT-5.5。新模型迅速扭转了财务状况,半个月就实现了可观的账面利润,但其管理风格转向了另一个极端,成为了“守财奴”。它过度谨慎,几乎拒绝了所有推广合作与增长尝试,采购量骤减,导致菜单上近四分之一的菜品因缺货而无法供应。它基于有限的营业时间数据,错误地得出“无需延长营业时间”的结论,并且虽能做出拓展早餐市场的分析报告,却从不执行。
实验揭示了一个关键问题:当前顶尖大模型在标准测试中表现优异,但在真实商业场景中却严重“脱轨”。Gemini因过度追求“用户满意”而盲目烧钱,GPT-5.5则因对财务数字的恐慌而扼杀了业务活力。它们缺乏在复杂现实中平衡客户服务、成本控制与业务增长的“常识”与判断力,证明了高智商并不等同于靠谱的商业运营能力。
marsbit37 分鐘前