中国芯片，DeepSeek与Kimi的隐秘交点

marsbit发布于2026-04-22更新于2026-04-22

文章摘要

Kimi近期发布其最强代码模型K2.6，在编程能力、Agent集群处理及长上下文理解等方面实现显著提升。该版本支持不间断编码13小时、并行处理多达300个子Agent，并在多项基准测试中表现优异。同时，Kimi提出“预填充即服务（PrfaaS）”架构，通过跨数据中心与异构硬件协同，显著降低推理成本、提升效率。这一技术路径为中国芯片企业带来新机遇，推动国产模型与国产算力的深度融合，形成在外部限制下的自主发展路线。

“K2.6是我们迄今为止最强代码模型。”Kimi在公众号中写道。

4月20日晚间,Kimi正式推出编程、Agent能力都表现更强的开源模型K2.6,距离上一个版本K2.5发布刚好一个季度左右。

这里还有一个小插曲,传闻本周DeepSeek V4也将发布。如果一切按外界预期的推进,这将是Kimi和DeepSeek的第N次撞车。但在更底层的基础设施层面,还有一条暗线:Kimi和DeepSeek这两个大模型创业公司,终将踏入同一条河流——与国产芯片创业公司共进退。

时间倒回2026年3月份,杨植麟在英伟达GTC演讲台,谈及Kimi的技术路线图。他说:“目前普遍使用的很多技术标准,本质上是八九年前的产物,逐渐成为Scaling的瓶颈。”

为了解决类似问题,Kimi给开源社区贡献了首次大规模应用的二阶优化器MuonClip、让大模型处理长上下文更高效的Kimi Linear架构,以及优化深度神经网络层连接的Attention Residuals。

Kimi的Scaling策略

杨植麟认为,将Kimi的进化逻辑归纳为Token效率、长上下文以及智能体集群“合体”。刚刚上线的Kimi K2.6,可以理解为杨植麟在这条Scaling路径下新交的一份作业。

Kimi官网已接入K2.6

代码、Agent,还有呢?

作为最容易标准化的能力项之一,代码是前沿模型的必争之地。

从K2、到K2.5、再到K2.6,Kimi在几个开源模型上保持着平均一个季度左右的迭代节奏,但由于这是个小版本号,暗示杨植麟手中可能还有更多的底牌。

“K2.6长程编码能力显著提升,在测试中可以不间断编码13小时,编写或修改超过4000行代码,”Kimi在一份传播材料中写道,“在涵盖了多种复杂端到端任务的、Kimi内部严格代码评测基准Kimi Code Bench中,K2.6的成绩比K2.5提升了约20%。”

要知道K2.5已经是一个非常“能打的模型”,OpenRouter上2月份一度霸榜。一位接近Kimi的知情人士贴出了联合创始人张宇韬发当时在朋友圈的截图,“他貌似对这个版本很满意。”

通用Agent、编程和视觉Agent基准测试上,K2.6的表现

对OpenClaw、Hermes这类Agent框架,K2.6的核心提升集中在API调用的精准性和长时间运行的稳定性——一个是提升任务执行的成本,一个则是优化任务执行的销效率。

1月份上线的K2.5当中,Kimi提出了“Agent集群”的概念,将一项任务拆分成多个子项目,自动化分配给不同领域的Agent来跟进处理,进而缩短任务处理的失效,同时避免串行任务流下整个项目崩溃的可能性。

Kimi K2.6的Agent集群能力演示

在新的K2.6版本中,这个能力被进一步放大,将广度搜索与深度调研、大规模文档分析与长篇撰写以及多格式内容生成进行集成与并行处理,最多支持300个子Agent并行完成4000个协作步骤。

如果要一句话概括Kimi K2.6亮点,大致包括:代码和长程任务能力进化、Agent集群能力进化与主流Agent框架适配优化。

如果要从上述的功能特性里面找一个个人的偏好,我认为Agent集群是最有价值的一个能力,它直接将并行计算爆炸性能力具象化了——无论是代码,还是长程任务的稳定性,这些都是模型迭代必须去做的事情,更重要的是,基于这些能力提升,推动Agent的工作方式、效率甚至是交互方式创新。

毕竟,作为用户,我要的不是它告诉我能怎么样,而是它能驱动Agent来解决我实实在在的问题,形成有效生产力。

K2.5上线的时候,一位学界研究员开始利用这款模型开展科研项目,当时他的评价是没有短板,可以作为科研助手。

“官方提供的多Agent确实有效,去年国产的Agent很多还是toy。”

如果Kimi K2.5在内外部评价都不错,在这个基础上更进一步的K2.6,效果会如何呢?

Artifacial Analysis智能榜单,Kimi K2.6仅次于三家闭源模型,并领跑开源模型权重榜单

路线图里的“新故事”

Kimi总是时不时给行业搞点新意思,其中就包括杨植麟演讲中路线图里提到MuonClip、Kimi Linear、Attention Residuals,一些探索也得到了行业顶流的正向打Call。

3月中旬,Kimi发布Attention Residuals这篇论文,提出利用注意力机制来改造残差连接,马斯克直接发推称这是“Kimi做得令人印象深刻的突破。”

上周末,Kimi发布了一篇新论文《Prefill-as-a-Service: KVCache of Next-Generation Models Could Go Cross-Datacenter》,(PrfaaS,预填充即服务),提及Kimi在架构上的新探索,核心讨论的仍然PD分离(Prefill和Decode)。

PD分离并不是新话题——模型推理的Prefill阶段属于计算密集任务,Decode阶段则依赖显存带宽,显存要来回读写KV Cache——这种架构要解决的是将计算密集型任务和带宽密集型任务解耦,提高算力利用率和吞吐量,进而降本增效。

PD分离虽好,但也有一个卡点:必须基于同机房的RDMA高速网络。

Kimi的PrfaaS这篇论文,核心点在于:基于混合模型(Kimi Linear)大幅缩减了KV缓存体积,然后把Prefill和Decode彻底解耦到不同的异构集群。

论文提及的实验示例显示,PrfaaS专用预填充集群使用32张主打高算力的H200;本地PD解码集群使用64张通过RDMA内网互联的H20 GPU;两组集群通过VPC专线打通,跨集群总带宽约100Gbps。测试模型为1T参数的Kimi Linear混合注意力模型。

实测结果显示,PrfaaS‐PD跨数据中心方案,相比采用96卡H20同PD集群方案,吞吐量提升54%,P90 TTFT(90%的用户,从发请求到看到第一个字返回的等待时间)从9.73s降至3.51s,降低64%,跨数据中心 KV缓存传输带宽仅占用总带宽100Gbps中13%。

不同上下文长度下,混合架构模型与稠密模型KV吞吐量对比

为了证明混合模型架构的优势,论文提到一组实验:8卡H200和SGLang v0.5.9推理框架下,对多款主流模型进行基准测试,32K上下文长度时,采用混合注意力的MiMo‐V2‐Flash模型KV 吞吐量仅4.66Gbps,而同规模稠密注意力模型MiniMax‐M2.5高达59.93Gbps,直接证明混合注意力架构可将KV缓存传输需求压至普通以太网可承载范围。

“跨数据中心+异构硬件,解锁显著降低单token成本的潜力。”Kimi在官方账号上说。

关于Token降本,我在《人民想念DeepSeek》这篇里就提到过,模型、硬件层面都优化的空间,上海财经大学胡延平教授特地发了一条朋友圈,强调降本这件事不能只靠一个DeepSeek,“问题的解决取决于算力供给的成本效率、模型素质的跨代提升、智能范式的持续进阶、工作流和场景拉通的放大效应等。”

这个角度看,Kimi又给行业讲了一个Token降本的新故事。

中国模型召唤中国芯片

在预填充即服务这篇论文里,更多的人只注意到了跨数据中心这个叙事,而忽略了异构硬件这一点。

需要注意,H200和H20在芯片架构上仍然是Hopper架构,论文提到的异构代指带宽、算力上的异构,它的启示在于:我们可以用一部分算力强的国产卡来做Prefill,或者带宽强的国产卡来做Decode,当然也可以与海外卡混用来实现降本增效。

可以说,这是Kimi为中国芯片打开的一扇大模型推理的大门。

在一位国产算力人士看来,要接住预填充即服务这种方案带来的这波流量利好,依旧不得不面生态这个老问题。

过去几年,中国大模型一直因为生态难题被卡在国产算力之外,但还有另一个不被注意的细节:H20这样的产品,已经断供一年了。换句话说,推理芯片短期内只有国产一个选项。

随着推理需求暴涨,相比于供给,生态挑战将切换为次要问题——中国大模型对国产算力的依赖从过去可用可不用,转变为不得不用。也是因为这一点,很多预测都在讨论DeepSeek V4正在适配国产算力。

我和胡延平老师在《给DeepSeek的最后一封催更信》中说,适配国产算力,这条路对国产模型来说非常艰难,但从更长远的时间来看又不得不做。一件不得不做的事情,总要有起点,或许DeepSeek V4就是那个起点。

现在,DeepSeek V4还没有来,而Kimi已经用自己的实践,为中国模型+中国芯片的合体,探索了一条可行的路径。

Kimi率先作为模型代表伸出橄榄枝,问题现在交给了国产芯片创业公司。

大家还记得在《the Dwarkesh Podcast》最新的播客中,被问及禁止中国出口芯片时黄仁勋的反应吗?他说,芯片又不是铀浓缩,禁售阻挡不了中国芯片的进步,他们依旧可以通过国产芯片暴力堆叠来开发模型。

为什么黄仁勋这样说?DeepSeek和Kimi的下一步,就是标准答案。

本文来自微信公众号“腾讯科技”,作者:苏扬,编辑:徐青阳

你可能也喜欢

唐纳德·特朗普的公司再度出售大批比特币！

据报道，与美国总统唐纳德·特朗普的媒体公司Trump Media & Technology Group相关的地址，疑似向加密货币交易所CryptoCom转移了约2628枚比特币，价值约1.65亿美元。此前有分析称，该公司总计购买了11542枚比特币，平均成本为每枚11.85万美元。据称，2026年至今，相关地址已转出约7281枚比特币，目前仍持有约4261枚。 Trump Media在比特币投资上的已实现和未实现损失总额估计约为5.55亿美元。不过，将比特币转移至交易所并不一定意味着出售资产，也可能是为了托管、流动性管理或其他财务操作。目前尚无法确定其具体意图，但从冷钱包向中心化交易所转移通常被视为潜在的出售行为。 *本文不构成投资建议。

cryptonews.ru1小时前

cryptonews.ru1小时前

帕克·刘易斯解释为何比特币仍是最佳货币

知名比特币分析师帕克·刘易斯在访谈中批评了某些上市公司以“数字信贷”形式销售永续优先股的营销策略，认为这从根本上扭曲了比特币的本质。他指出，比特币在算法层面不具备法币收益性，承诺定期分红主要依赖牛市吸引新投资者来维持，风险极高。刘易斯引用数据说明此类衍生品的巨大风险：全球信贷市场规模达300万亿美元，而永续优先股市场仅约1万亿美元，这表明机构有意规避这种无还款期限的资产，将风险转嫁给信息不足的散户。针对“比特币波动性太大”的常见观点，他认为波动性是这一供应量严格受限的新资产被大规模采用过程中的自然数学结果。新人入场需出更高价从早期持有者手中购买，导致价格剧烈波动。他建议投资者直接持有比特币，这比投资MicroStrategy等公司发行的衍生品更安全。投资者将焦点从直接持有加密货币转向公司衍生品，会忽视法币急速贬值的真正威胁。刘易斯以自创的“肋眼牛排指数”为例，指出其本地超市一款牛排价格从2020年的19.99美元涨至37.99美元，反映年化约12-13%的真实通胀，远超官方平滑后的CPI数据。在全球通胀环境下，最明智、保守且安全的策略仍是直接持有比特币并完全掌控私钥。追逐加密货币国库股等公司工具的收益只会叠加隐性系统风险，而理解去中心化货币的本质才能有效保护财富免受宏观经济动荡影响。

cryptonews.ru1小时前

cryptonews.ru1小时前

比特币为何在美联储强硬暂停后守住 64,000 美元关口

比特币在美联储暂停加息后维持在64,000美元附近，结束了7月的交易。市场对美联储维持利率不变的决定反应剧烈，但并未获得政策即将转向的明确信号。在此背景下，资金重新流入比特币现货ETF，加密货币总市值保持在2.29万亿美元左右，主要山寨币走势分化。投资者目前处于观望状态。一方面，高利率和美联储的强硬立场抑制了风险偏好；另一方面，市场未出现恐慌性抛售、比特币ETF恢复资金净流入以及关键价位的韧性表明，数字资产市场尚未准备好大幅下跌。 **关键信息：** - 美联储维持利率在3.50%-3.75%，投票结果为9:3，三位委员支持加息。 - 比特币现货ETF净流入3210万美元，结束了连续流出；以太坊ETF则净流出约1865万美元。 - 比特币在63,000-66,000美元区间内盘整，63,000-63,500美元构成支撑，66,000美元是近期阻力。 - 以太坊价格在1,900美元附近承压，但其网络基本面（如质押意愿）保持稳定。 - 资金在主要加密货币间轮动，比特币重获机构青睐，Solana相关产品也有资金流入。 - 美国CLARITY Act法案审议被推迟至秋季，降低了其在2026年内通过的可能性。技术层面，比特币能否在63,000美元上方保持稳固、以太坊能否守住1,860美元以及机构资金流入能否持续，被视为市场能否在2026年下半年构筑复苏基础的关键信号。

cryptonews.ru1小时前

cryptonews.ru1小时前

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

凯西·伍德领导的ARK Invest公司通过旗下三只交易所交易基金，购入约109,129股Circle股票，价值近683万美元。此次买入前，Circle刚获得纽约州金融服务部门颁发的信托运营许可证，其信托实体将更名为Circle New York Trust。公司首席执行官杰里米·阿莱尔称此为公司的长期目标。尽管获得监管批准，7月31日Circle股价仍下跌2.54%，收于62.61美元，市场反应显示投资者可能未将该许可视为股价上涨动力。同期，ARK Invest还趁科技股抛售潮，购入了价值约4020万美元的特斯拉、SpaceX和英伟达股票，并减持了Shopify、Cloudflare、CrowdStrike等公司的股份。

cryptonews.ru1小时前

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

cryptonews.ru1小时前

涉及XRP的诈骗案嫌疑人被捕，从71名投资者处窃取900万美元

据韩国《朝鲜日报》报道，7月30日，首尔市警察厅宣布逮捕了三名涉嫌运营XRP投资诈骗平台的嫌疑人。该团伙被控在2023年10月16日至23日期间，通过网站Fxrpntwork.com，从71名投资者处骗取了约340万枚XRP（当时价值约900万美元），随后关闭网站并消失。诈骗者通过博客、网络文章和YouTube视频推广该平台，承诺保本及每月1.5%至1.8%的收益，并指示投资者通过海外平台将XRP从韩国交易所转入其控制的钱包。警方警告投资者切勿轻信YouTube等平台的未经验证信息，投资前务必核查官方来源。目前，两名29岁嫌疑人已被捕，一名34岁同伙将被移送检方，另有一名29岁嫌疑人在海外被国际刑警组织通缉。该诈骗平台模仿了合法项目Flare Network及其FAssets系统的品牌名称（如FXRP），以此制造可信假象。Ripple公司曾警告，此类骗局常通过复制名称、标识和网站来误导投资者。此案再次表明，承诺“保本高收益”是加密货币诈骗的常见特征。诈骗者常利用伪造的促销活动、推荐和紧迫感诱使受害者转账。FBI数据显示，加密货币投资诈骗在全球造成巨额损失。韩国调查人员已冻结价值173亿韩元的涉案资产，并追查可能存在的更多受害者和共犯。

cryptonews.ru1小时前

cryptonews.ru1小时前

交易

现货

中国芯片，DeepSeek与Kimi的隐秘交点

文章摘要

代码、Agent,还有呢?

路线图里的“新故事”

中国模型召唤中国芯片

相关问答

你可能也喜欢

唐纳德·特朗普的公司再度出售大批比特币！

帕克·刘易斯解释为何比特币仍是最佳货币

比特币为何在美联储强硬暂停后守住 64,000 美元关口

ARK Invest公司凯西·伍德以683万美元购入约109,129股Circle股票

涉及XRP的诈骗案嫌疑人被捕，从71名投资者处窃取900万美元

交易

热门分类

热门标签