北大与DeepSeek联合开源DSpark框架,高并发下生成速度提升超60%

06/27 08:30

火币HTX报道,6月27日,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。
bullishbullishbullishTăng giábearishbearishbearishGiảm giáThíchChia sẻ
Tuyên bố miễn trừ trách nhiệmNội dung trên không đại diện cho quan điểm của HTX.HTX không đưa ra bất kỳ lời khuyên giao dịch nào.

Tất cả bình luận0Mới nhấtPhổ biến

avatar
Mới nhấtPhổ biến