稀疏性相关新闻 - HTX 稀疏性资讯汇总

算力受限，DeepSeek-V4凭什么开源？

4月24日，DeepSeek-V4预览版正式开源，支持1M超长上下文处理，将原本属于海外大厂的高端能力推向开源社区。尽管官方坦言受高端算力限制，V4-Pro服务吞吐有限，但其通过算法优化和架构创新，在代码生成、逻辑推理等核心任务中表现突出。 V4-Pro采用稀疏化设计，总参数量达1.6T，推理时仅激活49B参数，显著降低计算开销。团队重构注意力机制，引入KV Cache滑窗和压缩算法，有效控制长序列处理资源消耗。在多项专业评测中，V4-Pro接近甚至超越部分国际顶尖模型。同步推出的Flash版总参数量284B，激活参数仅13B，兼顾性能与成本，更适合中小企业和高频调用场景，也适配国产中低端算力芯片，推动本土算力生态发展。华为昇腾、寒武纪等国产芯片厂商迅速完成适配，但在高精度计算和供应链方面仍面临挑战。DeepSeek在人才流失和市场竞争加剧的背景下，通过V4版本展示了其技术体系的韧性和工程化能力。当前，DeepSeek正以超100亿美元估值寻求融资，有望创下国内大模型领域新高。此次发布不仅是一次技术开源，更是在算力受限的现实下，对模型能力分配和产业落地路径的一次深度探索。

marsbit04/26 00:27

marsbit04/26 00:27

# 稀疏性的所有文章

算力受限，DeepSeek-V4凭什么开源？

热门分类

热门标签

行业资讯

交易策略