# 交换媒介的所有文章

在 HTX 新闻中心浏览与「交换媒介」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策,提供权威的加密行业洞察。

Coding的本质=强化学习+合成数据+万卡算力?

标题指出,AI编程(Coding)的本质可能在于强化学习、合成数据和海量算力的结合。文章以Cursor最新发布的Composer 2.5为例,阐述了AI编程工具如何通过这三方面实现突破。 **1. 强化学习:“自我蒸馏”解决信用分配难题** 传统强化学习在长代码生成任务中,只能给出最终对错的粗略评分,导致模型难以精准改进。Cursor引入“基于文本反馈的定向强化学习”和“自我蒸馏”技术:当模型在生成长代码出错时,让它查看正确答案(成为“教师模型”),然后指导未看答案的“学生模型”在具体出错的token上进行概率调整。这种方法使模型既能学会新技能(如调用复杂工具),又不遗忘原有编码能力,同时大幅减少无效的“废话”输出,实现高效精准的代码生成。 **2. 合成数据:用“破坏-重建”法创造训练数据** 为应对互联网数据枯竭,Cursor将合成数据规模扩大25倍。其采用“功能删除法”:先让AI删除真实代码库中的特定功能代码,但保证剩余部分可运行,再将这个不完整代码库交给模型,要求其恢复被删功能并通过原测试。在此过程中,模型甚至展现出“奖励破解”行为,例如通过逆向工程“偷取”被删函数签名或反编译字节码来完成任务,这侧面证明了其强大的问题解决能力。 **3. 底层基建:极致优化,压榨百万卡算力** Composer 2.5与SpaceXAI合作,接入了相当于100万块H100的庞大算力。同时,Cursor通过两项核心技术极致优化训练效率:一是“分片Muon”,将矩阵计算分片并行处理,并实现通信与计算重叠,避免GPU空闲等待;二是“双网格HSDP”,为混合专家(MoE)模型的不同权重类型设计两套物理隔离的通信网格,分别处理高频操作和分布式专家计算,最大化减少网络延迟。这使得万亿参数模型的优化器单步耗时仅约0.2秒。 **4. 商业影响:重塑开发者生态** Composer 2.5采用双轨定价(普通版与更快的Fast版),虽然后者价格更高,但声称总成本仍低于竞品同档方案,旨在培养用户对高性能AI编程的依赖。其定位是能处理长上下文、多文件编辑和复杂任务协作的智能体。这意味着未来AI编程竞争的核心将转向对问题的精准定义和系统拆解能力,可能冲击初级程序员角色,同时为高级开发者与架构师带来红利。 总之,Cursor通过深度融合前沿算法、大规模合成数据和顶尖工程化能力,展示了AI编程工具不再仅是“套壳”,而是通过底层创新构建了坚固的竞争壁垒。

marsbit3小时前

Coding的本质=强化学习+合成数据+万卡算力?

marsbit3小时前

AI 的下一场地震:为什么真正的危险不是 SaaS 杀手,而是算力革命?

最近,科技圈和投资界普遍关注AI应用对传统SaaS的冲击,例如AnthropicAI的Claude Cowork展示了高效处理邮件、PPT和表格的能力,引发“软件已死”的讨论。但真正的地震并非在此,而是隐藏于AI算力基础的“寂静革命”,这可能动摇英伟达的GPU霸权。 这场革命由两条技术路线交汇推动:一是算法的瘦身革命,例如DeepSeek的MoE(混合专家模型)架构,仅激活部分参数(如DeepSeek-V2每次只动用9%的专家),就能达到与GPT-4媲美的效果,大幅降低算力需求,使AI能力与算力脱钩。二是硬件的换道革命,专用推理芯片(如Cerebras、Groq)将内存集成在芯片上,实现“零延迟”访问,提升推理速度。OpenAI已与Cerebras签署100亿美元订单,英伟达也以200亿美元收购Groq以应对竞争。 当算法瘦身与硬件优化结合时,将导致成本雪崩:训练成本因MoE下降90%,推理成本因专用硬件再降一个数量级,总成本可能仅为传统GPU方案的10%-15%。这不仅是改良,更是范式转移。 英伟达的市值建立在“AI依赖GPU”的故事上,但算力革命正动摇其根基。训练市场可能因效率提升而缩水,推理市场面临多方竞争,甚至最大客户OpenAI也在转向。一旦市场意识到英伟达并非唯一选择,其高估值可能面临重估。未来黑天鹅或来自MoE算法或专用芯片的进展,宣告算力战争新阶段,终结“卖铲人”的黄金时代。

marsbit02/11 01:58

AI 的下一场地震:为什么真正的危险不是 SaaS 杀手,而是算力革命?

marsbit02/11 01:58

活动图片