# 交换媒介的所有文章

在 HTX 新闻中心浏览与「交换媒介」相关的最新资讯与深度分析。潘盖市场趋势、项目动态、技术进展及监管政策，提供权威的加密行业洞察。

Coding的本质=强化学习+合成数据+万卡算力？

标题指出，AI编程（Coding）的本质可能在于强化学习、合成数据和海量算力的结合。文章以Cursor最新发布的Composer 2.5为例，阐述了AI编程工具如何通过这三方面实现突破。 **1. 强化学习：“自我蒸馏”解决信用分配难题** 传统强化学习在长代码生成任务中，只能给出最终对错的粗略评分，导致模型难以精准改进。Cursor引入“基于文本反馈的定向强化学习”和“自我蒸馏”技术：当模型在生成长代码出错时，让它查看正确答案（成为“教师模型”），然后指导未看答案的“学生模型”在具体出错的token上进行概率调整。这种方法使模型既能学会新技能（如调用复杂工具），又不遗忘原有编码能力，同时大幅减少无效的“废话”输出，实现高效精准的代码生成。 **2. 合成数据：用“破坏-重建”法创造训练数据** 为应对互联网数据枯竭，Cursor将合成数据规模扩大25倍。其采用“功能删除法”：先让AI删除真实代码库中的特定功能代码，但保证剩余部分可运行，再将这个不完整代码库交给模型，要求其恢复被删功能并通过原测试。在此过程中，模型甚至展现出“奖励破解”行为，例如通过逆向工程“偷取”被删函数签名或反编译字节码来完成任务，这侧面证明了其强大的问题解决能力。 **3. 底层基建：极致优化，压榨百万卡算力** Composer 2.5与SpaceXAI合作，接入了相当于100万块H100的庞大算力。同时，Cursor通过两项核心技术极致优化训练效率：一是“分片Muon”，将矩阵计算分片并行处理，并实现通信与计算重叠，避免GPU空闲等待；二是“双网格HSDP”，为混合专家（MoE）模型的不同权重类型设计两套物理隔离的通信网格，分别处理高频操作和分布式专家计算，最大化减少网络延迟。这使得万亿参数模型的优化器单步耗时仅约0.2秒。 **4. 商业影响：重塑开发者生态** Composer 2.5采用双轨定价（普通版与更快的Fast版），虽然后者价格更高，但声称总成本仍低于竞品同档方案，旨在培养用户对高性能AI编程的依赖。其定位是能处理长上下文、多文件编辑和复杂任务协作的智能体。这意味着未来AI编程竞争的核心将转向对问题的精准定义和系统拆解能力，可能冲击初级程序员角色，同时为高级开发者与架构师带来红利。总之，Cursor通过深度融合前沿算法、大规模合成数据和顶尖工程化能力，展示了AI编程工具不再仅是“套壳”，而是通过底层创新构建了坚固的竞争壁垒。

marsbit3小时前

marsbit3小时前

算力受限，DeepSeek-V4凭什么开源？

4月24日，DeepSeek-V4预览版正式开源，支持1M超长上下文处理，将原本属于海外大厂的高端能力推向开源社区。尽管官方坦言受高端算力限制，V4-Pro服务吞吐有限，但其通过算法优化和架构创新，在代码生成、逻辑推理等核心任务中表现突出。 V4-Pro采用稀疏化设计，总参数量达1.6T，推理时仅激活49B参数，显著降低计算开销。团队重构注意力机制，引入KV Cache滑窗和压缩算法，有效控制长序列处理资源消耗。在多项专业评测中，V4-Pro接近甚至超越部分国际顶尖模型。同步推出的Flash版总参数量284B，激活参数仅13B，兼顾性能与成本，更适合中小企业和高频调用场景，也适配国产中低端算力芯片，推动本土算力生态发展。华为昇腾、寒武纪等国产芯片厂商迅速完成适配，但在高精度计算和供应链方面仍面临挑战。DeepSeek在人才流失和市场竞争加剧的背景下，通过V4版本展示了其技术体系的韧性和工程化能力。当前，DeepSeek正以超100亿美元估值寻求融资，有望创下国内大模型领域新高。此次发布不仅是一次技术开源，更是在算力受限的现实下，对模型能力分配和产业落地路径的一次深度探索。

marsbit04/26 00:27

marsbit04/26 00:27

DeepSeek V4的真正价值，不在参数里

DeepSeek V4的发布标志着技术指标的提升，但其真正价值在于实现了在国产算力平台上的高效稳定运行，突破了对英伟达芯片和CUDA生态的长期依赖。该模型通过混合注意力机制、KV Cache压缩和MoE架构优化，显著降低推理计算和显存负担，使其能够适配华为昇腾、寒武纪等国产芯片，并实现Day 0级支持。这一突破使中国大模型在推理阶段具备国产化部署能力，大幅降低长期运营成本。同时，DeepSeek V4以极具竞争力的价格提供1M长上下文处理能力，支持代码分析、合同审查、投研Agent等企业级应用，推动AI技术在各行业的规模化落地。尽管国产算力生态仍在完善中，但V4通过深度软硬件协同优化，证明了在限制中实现技术突围的可行性，为产业链自主可控提供了重要实践基础。

marsbit04/25 08:08

marsbit04/25 08:08

DeepSeek不想只做大模型了

DeepSeek发布新一代模型V4，包含1.6万亿参数的Pro版和主打高吞吐的Flash版，均支持百万token上下文，并进一步降低API价格。此次发布的关键信息是，DeepSeek明确将未来降价与国产昇腾950算力的规模化部署直接关联，意味着其低价策略已从模型优化转向依赖国产算力生态。 V4采用MoE架构和长文本压缩技术，在代码、金融等专业任务中表现强劲，但并非全面领先，核心优势在于以更低价格提供高性能的长上下文处理能力。同时，DeepSeek通过工程优化实现了跨平台适配，已在英伟达GPU和华为昇腾NPU上验证，为国产算力进入AI关键路径提供技术实证。此外，DeepSeek近期传出寻求大额融资的消息，反映出公司面临算力投入、人才流失和商业化等多重压力。随着竞争进入算力基础设施、工程系统和资本整合的深层阶段，DeepSeek需在保持技术理想的同时，应对更重的组织与商业挑战。

marsbit04/25 01:45

marsbit04/25 01:45

姚顺雨的88天

腾讯混元大模型Hy3 preview发布，这是姚顺雨加入腾讯后推出的首款产品。该模型采用MoE架构，总参数量295B，支持256K上下文长度，从启动训练到发布仅用88天。此前，腾讯在年会上公开反思混元大模型发展滞后，存在“背题应考”、泛化能力不足、内部业务不愿接入等问题。姚顺雨于2025年9月加入腾讯，推动组织架构重组，撤销AI Lab，新设AI Infra等部门，全面聚焦混元研发。Hy3 preview采用与业务协同设计（Co-design）策略，已在元宝、QQ等核心业务中实测应用，强调从“打榜”转向真实场景落地。腾讯还通过接入DeepSeek和OpenClaw等外部技术过渡，为混元重建争取时间。当前行业竞争激烈，阿里、Kimi、字节等密集发布新模型，腾讯需持续以组织效率提升应对窗口期挑战。混元真正的转变在于拆除了模型与产品、研究与工程之间的墙，推动AI重写组织基因。

marsbit04/23 11:13

marsbit04/23 11:13

国产大模型：这次剧本不一样

2026年，全球AI模型平台OpenRouter数据显示，中国大模型调用量首次超越美国并持续领先，前十名中六款来自中国，小米MiMo-V2-Pro位居榜首。这一变化源于智能体应用（如OpenClaw）的普及，大幅推高Token消耗量，使中美模型价格差距凸显。中国模型凭借算力成本低、MoE架构等技术优势，价格仅为美国模型的1/10至1/60，在编程等执行类任务上能力接近，但在复杂推理上仍有差距。随着需求激增，中国厂商如智谱、腾讯云、阿里云等集体涨价，但调用量不降反升，显示一定定价权。行业从价格战转向盈利追求，中国在AI应用端引领全球，但在基础算法原创性上仍需突破。与30年前代工模式不同，此次中国大模型正以技术迭代和成本优势重塑全球AI产业链角色。

marsbit04/07 11:00

marsbit04/07 11:00

谷歌开源大模型 Gemma 4 官宣在即：参数量翻 4 倍

在全球开源大模型由中国科技公司主导的背景下，谷歌即将推出新一代开源大模型Gemma 4。该模型参数量达到120B，是上一代的4倍，采用MoE架构以提升效率，激活参数仅为15B，有望在民用显卡上本地运行。Gemma 4还预计提升上下文处理能力1至2倍，并增强逻辑推理与复杂任务执行能力。分析认为，谷歌通过时间差策略，在闭源模型Gemini 3.0发布半年后推出开源版本，既保障商业收益，又维持开发者社区影响力。Gemma 4聚焦本地化服务，以端侧体验与中国开源模型竞争。行业观察指出，Gemma 4的加入抬高了开源模型竞争门槛，其实际表现能否超越国产开源模型将成为下半年AI社区关注焦点。

marsbit04/02 06:45

marsbit04/02 06:45

AI的下一场地震：为什么真正的危险不是SaaS杀手，而是算力革命？

当前科技界普遍关注AI应用如何颠覆传统SaaS，但真正的变革在于算力领域的革命。这场革命由两条技术路线推动：一是算法的瘦身革命，例如DeepSeek的MoE架构，仅激活部分参数即可达到与全参数模型相当的性能，大幅降低算力需求；二是硬件的换道革命，如Cerebras和Groq的专用推理芯片，通过内置内存实现零延迟访问，显著提升效率。这两者的结合将导致AI训练和推理成本急剧下降，可能仅为传统GPU方案的10%-15%。英伟达的GPU垄断地位因此面临挑战，其市值依赖的“AI必须依赖GPU”的故事根基正在动摇。未来最大的风险可能来自算力领域的范式转移，而非应用层的竞争。

marsbit02/12 04:38

AI 的下一场地震：为什么真正的危险不是 SaaS 杀手，而是算力革命？

最近，科技圈和投资界普遍关注AI应用对传统SaaS的冲击，例如AnthropicAI的Claude Cowork展示了高效处理邮件、PPT和表格的能力，引发“软件已死”的讨论。但真正的地震并非在此，而是隐藏于AI算力基础的“寂静革命”，这可能动摇英伟达的GPU霸权。这场革命由两条技术路线交汇推动：一是算法的瘦身革命，例如DeepSeek的MoE（混合专家模型）架构，仅激活部分参数（如DeepSeek-V2每次只动用9%的专家），就能达到与GPT-4媲美的效果，大幅降低算力需求，使AI能力与算力脱钩。二是硬件的换道革命，专用推理芯片（如Cerebras、Groq）将内存集成在芯片上，实现“零延迟”访问，提升推理速度。OpenAI已与Cerebras签署100亿美元订单，英伟达也以200亿美元收购Groq以应对竞争。当算法瘦身与硬件优化结合时，将导致成本雪崩：训练成本因MoE下降90%，推理成本因专用硬件再降一个数量级，总成本可能仅为传统GPU方案的10%-15%。这不仅是改良，更是范式转移。英伟达的市值建立在“AI依赖GPU”的故事上，但算力革命正动摇其根基。训练市场可能因效率提升而缩水，推理市场面临多方竞争，甚至最大客户OpenAI也在转向。一旦市场意识到英伟达并非唯一选择，其高估值可能面临重估。未来黑天鹅或来自MoE算法或专用芯片的进展，宣告算力战争新阶段，终结“卖铲人”的黄金时代。

marsbit02/11 01:58