算力告急:谷歌悄然对Meta实施Gemini使用上限
人工智能基础设施的供需矛盾激化,谷歌约于今年3月告知Meta,无法满足其全部Gemini算力需求并实施了使用上限。这一限制至今未解除,已干扰Meta多个内部AI项目,导致其要求员工精打细算AI算力使用。谷歌自身也面临算力制约,近期与SpaceX签署了每月9.2亿美元的算力租赁协议以加速扩容。Meta因需求庞大受影响最深,其内部广泛使用Gemini进行安全审核、客服及开发等工作,如今正加速转向推广自研的Muse Spark模型以降低对外依赖。这场风波反映出AI推理工作负载的爆炸式增长已成为行业核心挑战,算力供给仍难以追上需求增速,行业瓶颈正从训练侧蔓延至推理侧。
marsbit11 小時前