姚顺雨的88天

marsbit發佈於 2026-04-23更新於 2026-04-23

文章摘要

腾讯混元大模型Hy3 preview发布，这是姚顺雨加入腾讯后推出的首款产品。该模型采用MoE架构，总参数量295B，支持256K上下文长度，从启动训练到发布仅用88天。此前，腾讯在年会上公开反思混元大模型发展滞后，存在“背题应考”、泛化能力不足、内部业务不愿接入等问题。姚顺雨于2025年9月加入腾讯，推动组织架构重组，撤销AI Lab，新设AI Infra等部门，全面聚焦混元研发。Hy3 preview采用与业务协同设计（Co-design）策略，已在元宝、QQ等核心业务中实测应用，强调从“打榜”转向真实场景落地。腾讯还通过接入DeepSeek和OpenClaw等外部技术过渡，为混元重建争取时间。当前行业竞争激烈，阿里、Kimi、字节等密集发布新模型，腾讯需持续以组织效率提升应对窗口期挑战。混元真正的转变在于拆除了模型与产品、研究与工程之间的墙，推动AI重写组织基因。

文 | 版面之外，撰文｜画画

腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。

MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，1月底开训，不到三个月发布。

这样一个体量的模型放在今天，很容易被淹没。

但如果把这件事放在三个月前的背景下看，就有意思了。

这次发布看起来是模型升级，真正变化发生在模型之外，腾讯开始用AI反过来重写自己的组织方式。

今年1月26日，腾讯年会现场，腾讯总裁刘炽平在台上做了一件高管很少做的事，公开复盘混元大模型为什么不行。

他用了一个比喻：高中生背题应考。成绩单好看，但真正上了考场就露馅。盘点之后发现，每个关键模块都有缺失。

马化腾的措辞更直接：太慢了。慢了9个月到1年。

从那场年会到今天 Hy3 preview上线，88天。

一、背题拿不了真分

腾讯混元的故事要从2023年9月说起，腾讯在全球数字生态大会上正式发布混元大模型，大厂入场，声势不小。

然后就开始进入一种自证的逻辑。

不是缺投入，不是缺人。问题出在路径上。

刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限，团队选了捷径，用SFT（监督微调）去打榜。效果立竿见影，成绩单漂亮，但一进真实业务场景就暴露，泛化能力差，模型能力无法复用到产品上。

再往下挖，每一层都有裂缝。数据做得不够多，预训练不稳定，AI Infra无法规模化，强化学习缺因子和目标，底座模型撑不起上层应用。

这直接导致了产品端的困局。元宝，腾讯的AI助手应用，今年一季度月活约5700万。听起来在涨，但同期豆包月活3.45亿，千问1.66亿，差距不是在缩小，是在拉大。

差距已经不在规模层面，而是在入口的定义权。

更麻烦的是内部。腾讯体系内的业务线，微信、游戏、广告、企业服务，需要AI能力，但过去的混元接不住。不是业务不想用，是用了效果不达标。一些核心业务甚至不敢接混元，宁可绕开自己找方案。

一个大厂自研的大模型，在自己家里都坐不上主桌，这是混元过去困境最直接的写照。

彼时，腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心，AI团队是配角。先做产品，再让AI适配。用刘炽平的话说，腾讯的AI开发像是产品里没有产品经理，研发团队没人把控方向，很多工作做了等于白做。

而同一时期，字节仅AI芯片采购一项就砸了约900亿元，DeepSeek用极致效率的小团队做出R1震动全球，阿里千问的全球API调用量攀上前列。

混元不是输给了某一个对手，是组织结构本身，让它上不了战场。

二、先借一条命

2025年春节前后，DeepSeek R1爆火，全球AI行业的注意力被这家杭州公司劫持。

腾讯做了一个极其务实且讨巧的决定。2月13日，元宝全面接入DeepSeek-R1满血版，免费开放。

元宝日活在一个月内暴涨超过20倍，2月22日超越豆包登上苹果中国区免费App下载榜第二，一度还拿下榜单第一。

腾讯在那个窗口期的反应速度，整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima，一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。

全行业都在围观DeepSeek的时候，腾讯是第一个全方位把它接进自家生态的大厂。

但腾讯比谁都清楚，这次机遇是借来的。

DeepSeek帮元宝拉来了用户，但留存是另一回事。搜索链路被割裂，一部分走混元一部分走DeepSeek，体验不统一。

简单来说，拥抱DeepSeek的本质，是在混元自己还没准备好的时候，用外部能力把用户先接住、把场景先撑起来。

但问题在于，腾讯的微信生态、企业服务、游戏AI、广告智能投放，这些核心业务需要深度定制、可控可调的AI能力，一个通用API解决不了。

混元必须自己站起来。问题是怎么站。

三、拆房子的人

2025 年 9 月，一位 27 岁的年轻人低调入职腾讯。

姚顺雨，清华姚班本科、普林斯顿大学博士，师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间，他提出ReAct 框架与思维树（Tree of Thoughts），二者均为全球 AI Agent 领域的奠基性工作。

2024 年博士毕业后，他加入 OpenAI，深度参与Operator、Deep Research两大核心智能体项目研发。

但履历并非关键，更重要的是他入职后带来的架构级变革。

2025 年 12 月，腾讯发布内部组织架构调整公告，正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家，同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人，实行双线汇报，直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

27 岁直通腾讯二号人物、执掌两大 AI 核心部门，这样的晋升与权限，在腾讯发展史上都极其罕见。

有媒体报道，入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因，经常和同事、实习生交流到半夜。诊断结果上报刘炽平，直接推动了后续一连串的组织手术。

他接手的不是一个模型优化任务，而是一整套需要被推翻的工作方式。

2025 年 12 月，腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门，基建先行、推倒重打底层技术地基。与此同时，公司全面加速全球顶尖 AI 人才引进，补齐技术短板。

今年3 月 20 日，成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部，归入混元大模型研发主线，统一向姚顺雨汇报。

自此，腾讯不再保留独立于大模型体系之外的专属 AI 研究机构，所有 AI 研究力量全部收拢，聚焦混元单一主线。

这是一次全链路的重建，从底层Infra到数据管线到训练流程到组织架构，不是修补旧系统，是拆了重来，从头搭建完整研发闭环。

用姚顺雨团队的话说，Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。

对照过去两年混元读了书但做不了题的现实，这句话的指向很明确，不在测试集里自嗨了，去真实世界做事。

四、Preview，不是Answer

回到产品本身。

快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文。2026年1月底启动训练，4月上线。

不到三个月，从零到可用。这本身是混元研发加速演进的一个重要信号。

业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调，如果算上前期架构探索和后期评测优化，从0到1做一个完整的大版本周期大约6-12个月。

腾讯反其道而行，没有去扎堆追求同质化模型，结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计，这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。

和过去的混元完全反过来。过去是先打榜再找场景，找到场景发现用不了。现在是先进场景，再给外界看。

而在发布之前，Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配，模型和产品从设计阶段就同步推进。

这就是Co-design，边训边用，让产品反馈来倒逼模型迭代。

某种意义上，这是对刘炽平那句"产品里没有产品经理"的直接回应。

对腾讯内部来说，Hy3 preview带来的变化可能比外界感知到的更大。过去的混元，业务线不敢接、不想接，各找各的出路，模型团队和产品团队之间隔着一堵墙。

这一次混元真正成了腾讯内部业务的模型底座，不再是一个需要业务线配合打榜的面子工程。

当内部业务愿意把自己的产品体验押在混元上的时候，这件事本身就是信号。

但Preview就是Preview。意思很坦诚，这是第一版，拿到真实用户和业务里去磨，用反馈来迭代。

态度对了，方向有了，产品上线了。至于结果，考试才刚开始。

五、龙虾是桥，混元才是地基

事实上，在Hy3 preview上线之前，腾讯还做了一件容易被忽略的事。

今年初OpenClaw爆火，龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外，几乎是最早、最全面拥抱龙虾的大厂。

WorkBuddy、QClaw、Lighthouse，一系列基于龙虾协议的产品密集上线，腾讯的产品矩阵在短时间内全面接入。

现在回头看，龙虾热潮虽然慢慢退烧。但对腾讯来说，这件事的价值不在龙虾本身，更像一个过渡装置。

它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力，微信、元宝、企业服务、开发者工具，在龙虾这个公共协议层上第一次真正协同起来。二是更关键的，它为混元争取了时间。

当用户通过各种Agent入口涌进来的时候，腾讯用龙虾生态先接住了他们，而混元在幕后完成了从Infra到模型的重建。

Agent的入口可以有很多个。但最终决定用户留不留下来的，是底层模型的能力。龙虾是桥，混元才是地基。桥搭好了，地基也终于跟上了。

六、窗口期不会等人

今年4月，可能是中国AI历史上最拥挤的一个月。

阿里在72小时内连发三款战略级模型，Kimi发布并开源Kimi K2.6模型，通用Agent、代码、视觉理解等综合能力全面提升，字节Seed持续迭代，豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。（参考阅读：梁文峰和姚顺雨，四月交卷）

混元选在这个窗口交卷，要面对的不只是技术竞赛，更是一个现实问题：窗口期还有多长？

腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿，QQ、腾讯会议、腾讯文档、企业微信，都是天然的AI落地入口。

但这些资源要发挥作用，前提是底层模型能撑得住。

过去一年多，混元产品能力乏力，腾讯不得不借DeepSeek的热度和力量，不得不看着豆包在用户端把自己甩开。

Hy3 preview说明姚顺雨听到了马化腾的批评。听到了，而且动手了。

不到90天，拆掉旧流水线，重建Infra，撤掉AI Lab，并入团队，挖来核心人才，和产品Co-design，交出一个可用的版本。

这个速度本身就是组织效率改变的证据。

但听到了和做到了之间，还有距离。

混元追上来的速度够不够快，最终不取决于一次Preview的参数量，取决于这次重建的组织效率能不能持续。

这一次姚顺雨的答卷上写着Preview。显然，后面还有大招。

【版面之外】的话：

混元过去最大的问题，不是模型不够大，是组织不够对。

一个自家业务都不愿意接的大模型，参数再多也是自嗨。

Hy3 preview最重要的变化，不是参数变了，是墙拆了，模型和产品之间的墙，研究和工程之间的墙，混元和腾讯生态之间的墙。

拆墙这件事，比堆参数难得多。

但这件事的意义，也不只在腾讯。在大模型这场竞争里，参数、算法、人才都可以被追赶。

真正难以复制的，是一家公司有没有决心为AI重写自己。

你可能也喜歡

《我没时间说服你》——中本聪名言问世16周年

2010年7月29日，比特币创始人中本聪在Bitcointalk论坛上回复用户关于交易速度过慢的质疑时，写下了那句著名的话：“如果你不相信我或不理解，我没有时间试图说服你，抱歉。”这句罕见的、略显不耐烦的回复，在多年来始终冷静、耐心解答技术问题的沟通记录中显得格外突出。文章回顾了中本聪的一贯沟通风格。在长达数年的公开和私下交流中，他面对关于可扩展性、安全性等重复性质疑时，通常以具体的技术机制、数据或类比进行详尽解释，而非简单驳斥。他展现出坚定的设计哲学，例如从一开始就设想比特币网络将由少量全节点和大量轻客户端构成，并基于摩尔定律等具体预测来论证其 scalability 潜力。同时，他能够坦承设计中的简化之处，避免事后辩解。在私下与早期合作者（如Martti Malmi）的邮件中，中本聪表现出协作甚至自嘲的一面，亲自参与细节讨论。而在公开场合，他的发言则更具教导性，致力于向大众解释比特币的工作原理。他始终避免个人崇拜，曾要求将功劳归于更广泛的开发群体。这场关于可扩展性的辩论及其引发的名言，至今仍影响着比特币社区。中本聪的原始论述表明，比特币架构的核心权衡是初始设计的一部分。他的沟通方式也为开源协作树立了榜样：委托授权、书面记录决策、让贡献者共同创建材料。而那句著名回复则提醒所有人，即使是耐心十足的导师，在重复解释已给出的答案时，耐心也可能耗尽。

cryptonews.ru6 分鐘前

cryptonews.ru6 分鐘前

狗狗币创始人讲述其使用该迷因币最难忘的经历

DOGE创始人比利·马库斯近日分享了其使用狗狗币最难忘的经历。他回忆在2022年7月使用狗狗币支付了伊隆·马斯克旗下隧道公司The Boring Company在拉斯维加斯环线的特斯拉电车乘坐服务。马库斯表示，这次实际支付体验证明了狗狗币超越了单纯交易，具备了实用价值，并称这是其所有加密货币相关活动中最印象深刻的一次。此番分享是对网友征集“周末不寻常加密货币活动”的回应。马库斯同时提及当前加密货币熊市漫长且乏味。数据显示，狗狗币过去一个月下跌3%，市值约120.7亿美元。马库斯素以尖锐言论闻名，曾批评许多加密货币是“垃圾”，并嘲讽过比特币的狂热支持者。

cryptonews.ru6 分鐘前

cryptonews.ru6 分鐘前

USDT供应量减少55亿美元，稳定币交易额创历史新高

稳定币总市值出现多年来首次收缩，但交易量却创下历史新高，表明其使用性质正在转变。关键数据显示，6月稳定币总市值从5月峰值约3224亿美元降至3085亿美元，单月减少77亿美元，为2022年5月Terra崩溃以来最大月度跌幅。与此同时，6月经调整的稳定币交易量却飙升至创纪录的1.83万亿美元，环比增长60%，是去年同期的两倍多。这种分化显示，更少的资金处于闲置状态，而剩余资金正更快速地通过支付、交易和结算系统循环。部分资本可能流向了提供收益的代币化国债产品，该领域总价值已从3月的约110亿美元增长至超过160亿美元。这在一定程度上受到美国《GENIUS法案》的影响，该法禁止支付类稳定币直接支付利息，促使资金寻求收益更高的替代品。 USDT和USDC的供应量在近三个月内均有所下降，但幅度温和。值得注意的是，USDC已成为领先的结算资产，6月处理了约1.21万亿美元的交易量，高于USDT的5760亿美元，尽管其供应量较小。分析指出，交易周转速度正取代市值成为关键指标，目前稳定币月周转率约为6次，是两年前的两倍。尽管区块链上的大量转账包含自动化活动或交易所内部划转，并非全是真实经济支付，但可识别的真实支付规模（如企业间交易、薪资发放和汇款）在2025年已达到约3900亿美元，并保持快速增长。这表明稳定币正从“冻结”的抵押品，转变为活跃的金融基础设施。

cryptonews.ru11 分鐘前

cryptonews.ru11 分鐘前

摩根士丹利的MSSE基金首日筹集500万美元，以太坊ETF资金流入额再度超越比特币——达到1450万美元

7月28日，加密货币市场资金流向分化明显。以太坊ETF延续资金净流入，而比特币ETF则连续第四日遭遇净流出，Solana等资产也出现显著资金外流。具体数据显示，以太坊ETF当日净流入1453万美元，主要由贝莱德的ETHB（591万美元）和摩根士丹利新推出的MSSE（515万美元）等产品贡献。比特币ETF净流出4975万美元，贝莱德的IBIT基金是主要流出方。Solana ETF净流出1807万美元，为上市以来第二大单日流出。$HYPE相关ETF也连续第四日资金外流，$XRP ETF则无净变动。分析师指出，市场资金正变得更加“挑剔”，资金从比特币、Solana等资产向以太坊转移的趋势明显。尽管$HYPE ETF早期资金流入表现强劲，但近期也未能避免市场整体调整压力。数据表明此次下跌更多是局部调整，而非全市场普跌。

cryptonews.ru12 分鐘前

摩根士丹利的MSSE基金首日筹集500万美元，以太坊ETF资金流入额再度超越比特币——达到1450万美元

cryptonews.ru12 分鐘前

交易员将比特币价格推回64,400美元，此前美联储决议安抚了市场

7月29日，比特币价格波动，最初受中东紧张局势升级（伊朗袭击约旦美军基地）和油价上涨影响，但在美联储宣布维持利率不变后反弹。比特币价格从约63,700美元快速拉升至64,400美元，最终稳定在64,200美元附近，日内跌幅收窄至1%，市值约1.29万亿美元。市场情绪随美联储决议转向乐观，美股反弹，纳斯达克指数大幅回升。杠杆合约清算总额超过3.22亿美元，比特币部分占3800万美元，其中空头清算居多。尽管美联储暂缓加息，但未来仍有加息可能。比特币后续走势或更依赖内部因素，如机构采用、ETF资金流入或协议升级，而非宏观利好。

cryptonews.ru15 分鐘前

交易

現貨

姚顺雨的88天

文章摘要

一、背题拿不了真分

二、先借一条命

三、拆房子的人

四、Preview，不是Answer

五、龙虾是桥，混元才是地基

六、窗口期不会等人

相關問答

你可能也喜歡

《我没时间说服你》——中本聪名言问世16周年

狗狗币创始人讲述其使用该迷因币最难忘的经历

USDT供应量减少55亿美元，稳定币交易额创历史新高

摩根士丹利的MSSE基金首日筹集500万美元，以太坊ETF资金流入额再度超越比特币——达到1450万美元

交易员将比特币价格推回64,400美元，此前美联储决议安抚了市场

交易

熱門分類

熱門標籤