# 交换媒介的所有文章

在 HTX 新闻中心浏览与「交换媒介」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策,提供权威的加密行业洞察。

DeepSeek的十万亿美元之路:用开源撬动万亿硬件生态

DeepSeek的长期战略并非通过应用层(如编程订阅)直接变现,而是致力于通过一系列底层架构创新,重塑AI训练与推理的成本结构,并推动一个规模达10万亿美元的新硬件生态形成。 其技术创新始终围绕一个核心:在高端算力受限的背景下,如何用更少的资源跑出更强的模型。例如: 1. **压缩KV Cache**:通过MLA、DSA、CSA、HSA等机制,大幅减少长上下文所需的显存(HBM)。DeepSeek V4在100万上下文长度下仅需约5.5GB HBM,远低于其他主流模型,这使得将KV Cache卸载到SSD/NAND成为经济可行的方案,降低了对紧缺的HBM的依赖。 2. **以内存换计算**:其Engram模块利用LPDDR内存进行高效的O(1)知识查找,用更便宜的内存资源节省昂贵的计算开销。 3. **提升硬件兼容性与效率**:通过MoE架构、权重流式加载、TileLang编程语言等,旨在削弱对特定硬件(如CUDA生态)的依赖,让更多国产及全球的GPU、ASIC、存储和网络芯片能够高效运行AI负载。 这些创新若扩散开来,将直接惠及长江存储(NAND/SSD)、长鑫存储(LPDDR)等国内存储厂商,并为众多AI芯片厂商创造机会。DeepSeek的盈利模式可能类似于OpenAI与AMD的合作,通过深度绑定并赋能整个硬件生态,以换取股权等长期回报,从而在推动一个巨大产业形成的同时,实现自身万亿美金估值的终极目标。

marsbit05/25 13:13

DeepSeek的十万亿美元之路:用开源撬动万亿硬件生态

marsbit05/25 13:13

Coding的本质=强化学习+合成数据+万卡算力?

标题指出,AI编程(Coding)的本质可能在于强化学习、合成数据和海量算力的结合。文章以Cursor最新发布的Composer 2.5为例,阐述了AI编程工具如何通过这三方面实现突破。 **1. 强化学习:“自我蒸馏”解决信用分配难题** 传统强化学习在长代码生成任务中,只能给出最终对错的粗略评分,导致模型难以精准改进。Cursor引入“基于文本反馈的定向强化学习”和“自我蒸馏”技术:当模型在生成长代码出错时,让它查看正确答案(成为“教师模型”),然后指导未看答案的“学生模型”在具体出错的token上进行概率调整。这种方法使模型既能学会新技能(如调用复杂工具),又不遗忘原有编码能力,同时大幅减少无效的“废话”输出,实现高效精准的代码生成。 **2. 合成数据:用“破坏-重建”法创造训练数据** 为应对互联网数据枯竭,Cursor将合成数据规模扩大25倍。其采用“功能删除法”:先让AI删除真实代码库中的特定功能代码,但保证剩余部分可运行,再将这个不完整代码库交给模型,要求其恢复被删功能并通过原测试。在此过程中,模型甚至展现出“奖励破解”行为,例如通过逆向工程“偷取”被删函数签名或反编译字节码来完成任务,这侧面证明了其强大的问题解决能力。 **3. 底层基建:极致优化,压榨百万卡算力** Composer 2.5与SpaceXAI合作,接入了相当于100万块H100的庞大算力。同时,Cursor通过两项核心技术极致优化训练效率:一是“分片Muon”,将矩阵计算分片并行处理,并实现通信与计算重叠,避免GPU空闲等待;二是“双网格HSDP”,为混合专家(MoE)模型的不同权重类型设计两套物理隔离的通信网格,分别处理高频操作和分布式专家计算,最大化减少网络延迟。这使得万亿参数模型的优化器单步耗时仅约0.2秒。 **4. 商业影响:重塑开发者生态** Composer 2.5采用双轨定价(普通版与更快的Fast版),虽然后者价格更高,但声称总成本仍低于竞品同档方案,旨在培养用户对高性能AI编程的依赖。其定位是能处理长上下文、多文件编辑和复杂任务协作的智能体。这意味着未来AI编程竞争的核心将转向对问题的精准定义和系统拆解能力,可能冲击初级程序员角色,同时为高级开发者与架构师带来红利。 总之,Cursor通过深度融合前沿算法、大规模合成数据和顶尖工程化能力,展示了AI编程工具不再仅是“套壳”,而是通过底层创新构建了坚固的竞争壁垒。

marsbit05/20 04:52

Coding的本质=强化学习+合成数据+万卡算力?

marsbit05/20 04:52

活动图片