算力受限,DeepSeek-V4凭什么开源?
4月24日,DeepSeek-V4预览版正式开源,支持1M超长上下文处理,将原本属于海外大厂的高端能力推向开源社区。尽管官方坦言受高端算力限制,V4-Pro服务吞吐有限,但其通过算法优化和架构创新,在代码生成、逻辑推理等核心任务中表现突出。
V4-Pro采用稀疏化设计,总参数量达1.6T,推理时仅激活49B参数,显著降低计算开销。团队重构注意力机制,引入KV Cache滑窗和压缩算法,有效控制长序列处理资源消耗。在多项专业评测中,V4-Pro接近甚至超越部分国际顶尖模型。
同步推出的Flash版总参数量284B,激活参数仅13B,兼顾性能与成本,更适合中小企业和高频调用场景,也适配国产中低端算力芯片,推动本土算力生态发展。
华为昇腾、寒武纪等国产芯片厂商迅速完成适配,但在高精度计算和供应链方面仍面临挑战。DeepSeek在人才流失和市场竞争加剧的背景下,通过V4版本展示了其技术体系的韧性和工程化能力。
当前,DeepSeek正以超100亿美元估值寻求融资,有望创下国内大模型领域新高。此次发布不仅是一次技术开源,更是在算力受限的现实下,对模型能力分配和产业落地路径的一次深度探索。
marsbit04/26 00:27