DeepSeek瘫痪12小时,国产大模型的算力已经跟不上野心了?
2024年3月29日晚,国内大模型厂商DeepSeek发生长达12小时的服务器故障,网页端与App均出现登录失败、对话中断等问题,引发用户对其稳定性的质疑。官方解释为用户过多导致服务器压力过大,但实际月活用户约1.5亿,并未出现爆发式增长,暗示问题可能源于更深层的算力瓶颈。
随着大模型能力快速提升,上下文长度、推理复杂度等需求持续增加,算力消耗急剧上升。行业普遍面临算力供给跟不上需求增长的问题,类似MiniMax、阿里云等厂商已在高峰期限制调用或调整价格策略。此外,“养龙虾”等高频率API调用玩法进一步放大算力压力,成为系统不稳定的潜在因素。
尽管面临故障,市场对DeepSeek下一代模型V4仍抱有高度期待。据悉,V4将支持百万级tokens上下文,并增强多模态与Agent能力,但也可能进一步加剧算力负担。此次事件反映出AI竞争正从模型能力转向基础设施稳定性与成本控制。DeepSeek的宕机不仅是技术故障,更是行业面临算力与架构挑战的早期信号。
marsbit04/03 12:22