姚顺雨的88天

marsbitXuất bản vào 2026-04-23Cập nhật gần nhất vào 2026-04-23

Tóm tắt

腾讯混元大模型Hy3 preview发布，这是姚顺雨加入腾讯后推出的首款产品。该模型采用MoE架构，总参数量295B，支持256K上下文长度，从启动训练到发布仅用88天。此前，腾讯在年会上公开反思混元大模型发展滞后，存在“背题应考”、泛化能力不足、内部业务不愿接入等问题。姚顺雨于2025年9月加入腾讯，推动组织架构重组，撤销AI Lab，新设AI Infra等部门，全面聚焦混元研发。Hy3 preview采用与业务协同设计（Co-design）策略，已在元宝、QQ等核心业务中实测应用，强调从“打榜”转向真实场景落地。腾讯还通过接入DeepSeek和OpenClaw等外部技术过渡，为混元重建争取时间。当前行业竞争激烈，阿里、Kimi、字节等密集发布新模型，腾讯需持续以组织效率提升应对窗口期挑战。混元真正的转变在于拆除了模型与产品、研究与工程之间的墙，推动AI重写组织基因。

文 | 版面之外，撰文｜画画

腾讯混元Hy3 preview发布了。这是姚顺雨加入腾讯后交出的第一款产品。

MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度，1月底开训，不到三个月发布。

这样一个体量的模型放在今天，很容易被淹没。

但如果把这件事放在三个月前的背景下看，就有意思了。

这次发布看起来是模型升级，真正变化发生在模型之外，腾讯开始用AI反过来重写自己的组织方式。

今年1月26日，腾讯年会现场，腾讯总裁刘炽平在台上做了一件高管很少做的事，公开复盘混元大模型为什么不行。

他用了一个比喻：高中生背题应考。成绩单好看，但真正上了考场就露馅。盘点之后发现，每个关键模块都有缺失。

马化腾的措辞更直接：太慢了。慢了9个月到1年。

从那场年会到今天 Hy3 preview上线，88天。

一、背题拿不了真分

腾讯混元的故事要从2023年9月说起，腾讯在全球数字生态大会上正式发布混元大模型，大厂入场，声势不小。

然后就开始进入一种自证的逻辑。

不是缺投入，不是缺人。问题出在路径上。

刘炽平在年会上的复盘给了最清晰的诊断。底模能力有限，团队选了捷径，用SFT（监督微调）去打榜。效果立竿见影，成绩单漂亮，但一进真实业务场景就暴露，泛化能力差，模型能力无法复用到产品上。

再往下挖，每一层都有裂缝。数据做得不够多，预训练不稳定，AI Infra无法规模化，强化学习缺因子和目标，底座模型撑不起上层应用。

这直接导致了产品端的困局。元宝，腾讯的AI助手应用，今年一季度月活约5700万。听起来在涨，但同期豆包月活3.45亿，千问1.66亿，差距不是在缩小，是在拉大。

差距已经不在规模层面，而是在入口的定义权。

更麻烦的是内部。腾讯体系内的业务线，微信、游戏、广告、企业服务，需要AI能力，但过去的混元接不住。不是业务不想用，是用了效果不达标。一些核心业务甚至不敢接混元，宁可绕开自己找方案。

一个大厂自研的大模型，在自己家里都坐不上主桌，这是混元过去困境最直接的写照。

彼时，腾讯的组织也并没有跟上大模型发展步伐。腾讯长期以产品工程为核心，AI团队是配角。先做产品，再让AI适配。用刘炽平的话说，腾讯的AI开发像是产品里没有产品经理，研发团队没人把控方向，很多工作做了等于白做。

而同一时期，字节仅AI芯片采购一项就砸了约900亿元，DeepSeek用极致效率的小团队做出R1震动全球，阿里千问的全球API调用量攀上前列。

混元不是输给了某一个对手，是组织结构本身，让它上不了战场。

二、先借一条命

2025年春节前后，DeepSeek R1爆火，全球AI行业的注意力被这家杭州公司劫持。

腾讯做了一个极其务实且讨巧的决定。2月13日，元宝全面接入DeepSeek-R1满血版，免费开放。

元宝日活在一个月内暴涨超过20倍，2月22日超越豆包登上苹果中国区免费App下载榜第二，一度还拿下榜单第一。

腾讯在那个窗口期的反应速度，整个行业都在看。微信搜索、QQ浏览器、搜狗输入法、ima，一整套产品矩阵密集接入DeepSeek。甚至手游《和平精英》都把DeepSeek塞进了数字代言人。

全行业都在围观DeepSeek的时候，腾讯是第一个全方位把它接进自家生态的大厂。

但腾讯比谁都清楚，这次机遇是借来的。

DeepSeek帮元宝拉来了用户，但留存是另一回事。搜索链路被割裂，一部分走混元一部分走DeepSeek，体验不统一。

简单来说，拥抱DeepSeek的本质，是在混元自己还没准备好的时候，用外部能力把用户先接住、把场景先撑起来。

但问题在于，腾讯的微信生态、企业服务、游戏AI、广告智能投放，这些核心业务需要深度定制、可控可调的AI能力，一个通用API解决不了。

混元必须自己站起来。问题是怎么站。

三、拆房子的人

2025 年 9 月，一位 27 岁的年轻人低调入职腾讯。

姚顺雨，清华姚班本科、普林斯顿大学博士，师从 GPT 开山论文核心作者之一 Karthik Narasimhan。博士期间，他提出ReAct 框架与思维树（Tree of Thoughts），二者均为全球 AI Agent 领域的奠基性工作。

2024 年博士毕业后，他加入 OpenAI，深度参与Operator、Deep Research两大核心智能体项目研发。

但履历并非关键，更重要的是他入职后带来的架构级变革。

2025 年 12 月，腾讯发布内部组织架构调整公告，正式任命姚顺雨为CEO /总裁办公室首席 AI 科学家，同时兼任全新设立的AI Infra 部、大语言模型部双部门负责人，实行双线汇报，直接向腾讯总裁刘炽平、TEG 技术工程事业群负责人卢山汇报。

27 岁直通腾讯二号人物、执掌两大 AI 核心部门，这样的晋升与权限，在腾讯发展史上都极其罕见。

有媒体报道，入职后他做的第一件事是逐个模块排查混元长期表现不佳的原因，经常和同事、实习生交流到半夜。诊断结果上报刘炽平，直接推动了后续一连串的组织手术。

他接手的不是一个模型优化任务，而是一整套需要被推翻的工作方式。

2025 年 12 月，腾讯一口气新设AI Infra 部、AI Data 部、数据计算平台部三大核心部门，基建先行、推倒重打底层技术地基。与此同时，公司全面加速全球顶尖 AI 人才引进，补齐技术短板。

今年3 月 20 日，成立整整十年的腾讯 AI Lab 正式撤销。核心研发人员全部并入大语言模型部，归入混元大模型研发主线，统一向姚顺雨汇报。

自此，腾讯不再保留独立于大模型体系之外的专属 AI 研究机构，所有 AI 研究力量全部收拢，聚焦混元单一主线。

这是一次全链路的重建，从底层Infra到数据管线到训练流程到组织架构，不是修补旧系统，是拆了重来，从头搭建完整研发闭环。

用姚顺雨团队的话说，Hy3 preview是混元大语言模型从读万卷书到行万里路的开端。

对照过去两年混元读了书但做不了题的现实，这句话的指向很明确，不在测试集里自嗨了，去真实世界做事。

四、Preview，不是Answer

回到产品本身。

快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文。2026年1月底启动训练，4月上线。

不到三个月，从零到可用。这本身是混元研发加速演进的一个重要信号。

业界的模型研发通常包括高质量数据准备、预训练、后训练和强化学习/精调，如果算上前期架构探索和后期评测优化，从0到1做一个完整的大版本周期大约6-12个月。

腾讯反其道而行，没有去扎堆追求同质化模型，结合腾讯在社交、游戏、广告等核心业务场景需求进行Co-design设计，这样的好处是腾讯对AI的巨额投入能得到市场的快速验证。

和过去的混元完全反过来。过去是先打榜再找场景，找到场景发现用不了。现在是先进场景，再给外界看。

而在发布之前，Hy3 preview已经在元宝、WorkBuddy、CodeBuddy、ima、QQ等腾讯核心产品里完成了实测和协同适配，模型和产品从设计阶段就同步推进。

这就是Co-design，边训边用，让产品反馈来倒逼模型迭代。

某种意义上，这是对刘炽平那句"产品里没有产品经理"的直接回应。

对腾讯内部来说，Hy3 preview带来的变化可能比外界感知到的更大。过去的混元，业务线不敢接、不想接，各找各的出路，模型团队和产品团队之间隔着一堵墙。

这一次混元真正成了腾讯内部业务的模型底座，不再是一个需要业务线配合打榜的面子工程。

当内部业务愿意把自己的产品体验押在混元上的时候，这件事本身就是信号。

但Preview就是Preview。意思很坦诚，这是第一版，拿到真实用户和业务里去磨，用反馈来迭代。

态度对了，方向有了，产品上线了。至于结果，考试才刚开始。

五、龙虾是桥，混元才是地基

事实上，在Hy3 preview上线之前，腾讯还做了一件容易被忽略的事。

今年初OpenClaw爆火，龙虾热潮席卷整个AI行业。腾讯的反应速度又一次让人意外，几乎是最早、最全面拥抱龙虾的大厂。

WorkBuddy、QClaw、Lighthouse，一系列基于龙虾协议的产品密集上线，腾讯的产品矩阵在短时间内全面接入。

现在回头看，龙虾热潮虽然慢慢退烧。但对腾讯来说，这件事的价值不在龙虾本身，更像一个过渡装置。

它做了两件事。一是让腾讯散落在各条业务线的产品力重新形成合力，微信、元宝、企业服务、开发者工具，在龙虾这个公共协议层上第一次真正协同起来。二是更关键的，它为混元争取了时间。

当用户通过各种Agent入口涌进来的时候，腾讯用龙虾生态先接住了他们，而混元在幕后完成了从Infra到模型的重建。

Agent的入口可以有很多个。但最终决定用户留不留下来的，是底层模型的能力。龙虾是桥，混元才是地基。桥搭好了，地基也终于跟上了。

六、窗口期不会等人

今年4月，可能是中国AI历史上最拥挤的一个月。

阿里在72小时内连发三款战略级模型，Kimi发布并开源Kimi K2.6模型，通用Agent、代码、视觉理解等综合能力全面提升，字节Seed持续迭代，豆包生态扩张不停。DeepSeek V4也传言定于4月下旬发布。（参考阅读：梁文峰和姚顺雨，四月交卷）

混元选在这个窗口交卷，要面对的不只是技术竞赛，更是一个现实问题：窗口期还有多长？

腾讯有全中国最大的社交生态、最多的用户触点、最丰富的应用场景。微信月活超过14亿，QQ、腾讯会议、腾讯文档、企业微信，都是天然的AI落地入口。

但这些资源要发挥作用，前提是底层模型能撑得住。

过去一年多，混元产品能力乏力，腾讯不得不借DeepSeek的热度和力量，不得不看着豆包在用户端把自己甩开。

Hy3 preview说明姚顺雨听到了马化腾的批评。听到了，而且动手了。

不到90天，拆掉旧流水线，重建Infra，撤掉AI Lab，并入团队，挖来核心人才，和产品Co-design，交出一个可用的版本。

这个速度本身就是组织效率改变的证据。

但听到了和做到了之间，还有距离。

混元追上来的速度够不够快，最终不取决于一次Preview的参数量，取决于这次重建的组织效率能不能持续。

这一次姚顺雨的答卷上写着Preview。显然，后面还有大招。

【版面之外】的话：

混元过去最大的问题，不是模型不够大，是组织不够对。

一个自家业务都不愿意接的大模型，参数再多也是自嗨。

Hy3 preview最重要的变化，不是参数变了，是墙拆了，模型和产品之间的墙，研究和工程之间的墙，混元和腾讯生态之间的墙。

拆墙这件事，比堆参数难得多。

但这件事的意义，也不只在腾讯。在大模型这场竞争里，参数、算法、人才都可以被追赶。

真正难以复制的，是一家公司有没有决心为AI重写自己。

Câu hỏi Liên quan

Q姚顺雨加入腾讯后，对混元大模型进行了哪些关键的组织架构调整？

A姚顺雨加入腾讯后，被任命为CEO/总裁办公室首席AI科学家，兼任AI Infra部和大语言模型部双部门负责人，直接向刘炽平和卢山汇报。他推动了腾讯新设AI Infra部、AI Data部、数据计算平台部三大核心部门，并撤销了成立十年的腾讯AI Lab，将其核心研发人员全部并入大语言模型部，聚焦混元单一主线，实现了从底层Infra到组织架构的全链路重建。

Q腾讯混元大模型在Hy3 preview发布前存在哪些主要问题？

A腾讯混元大模型在Hy3 preview发布前存在多个问题：底模能力有限，团队过度依赖SFT（监督微调）打榜导致泛化能力差；数据准备不足，预训练不稳定；AI Infra无法规模化；强化学习缺因子和目标；底座模型无法支撑上层应用。这导致内部业务如微信、游戏等不敢接入混元，模型在真实场景中表现不佳，与竞争对手差距拉大。

Q腾讯在DeepSeek R1爆火后采取了什么策略？这一策略带来了什么效果和局限？

A腾讯在DeepSeek R1爆火后，于2025年2月13日全面将元宝接入DeepSeek-R1满血版，并免费开放。随后微信搜索、QQ浏览器、搜狗输入法等产品矩阵密集接入DeepSeek，甚至手游《和平精英》也接入其数字代言人。这一策略使元宝日活在一个月内暴涨超过20倍，一度登上苹果中国区免费App下载榜第一。但局限在于，搜索链路被割裂，体验不统一，且通用API无法满足腾讯核心业务深度定制、可控可调的需求，混元仍需自主发展。

QHy3 preview模型的主要技术特点是什么？它的研发周期和设计理念有何特别之处？

AHy3 preview采用MoE架构，总参数295B，激活参数21B，最大支持256K上下文长度。其研发周期仅不到三个月，从2026年1月底开训到4月上线。设计理念上，它结合腾讯核心业务场景需求进行Co-design（协同设计），边训练边应用，让产品反馈倒逼模型迭代，而非先打榜再找场景。发布前已在元宝、WorkBuddy、CodeBuddy等腾讯核心产品中完成实测和协同适配。

Q腾讯拥抱OpenClaw（龙虾协议）的热潮，对其AI战略有何实际意义？

A腾讯拥抱OpenClaw热潮，通过WorkBuddy、QClaw、Lighthouse等产品全面接入，其价值不在龙虾本身，而是一个过渡装置：一是让腾讯各业务线产品力在公共协议层上首次协同形成合力；二是为混元重建Infra和模型争取了时间。龙虾协议作为桥接入口接住了用户流量，而混元作为地基在幕后完成能力升级，最终决定用户留存的是底层模型能力。

Nội dung Liên quan

Polymarket Bị Kẹt: Bài Kiểm Tra Thực Sự Sau Khi Vượt Qua Giai Đoạn Lưu Lượng Tăng Đột Biến

Polymarket, nền tảng dự đoán thị trường hàng đầu, đang đối mặt với thách thức lớn khi trải nghiệm giao dịch xuống cấp do hạ tầng không theo kịp đà tăng trưởng. Phó chủ tịch kỹ thuật Josh Stevens thừa nhận vấn đề và công bố kế hoạch cải tổ toàn diện, bao gồm: giảm độ trễ dữ liệu, sửa lỗi hủy lệnh, xây dựng lại hệ thống order book (CLOB), nâng cao hiệu suất website, và quan trọng nhất là di chuyển chain (chain migration). Nguyên nhân sâu xa nằm ở việc Polymarket không còn là ứng dụng dự đoán đơn thuần mà đã phát triển thành một nền tảng giao dịch tần suất cao. Polygon, từng là lựa chọn chi phí thấp hoàn hảo, giờ đây trở thành rào cản kỹ thuật. Động thái này ngay lập tức thu hút sự quan tâm của các blockchain khác như Solana, Sui, Algorand... trong khi Polygon nỗ lực giữ chân ứng dụng quan trọng này - nguồn đóng góp phí giao dịch đáng kể cho hệ sinh thái của họ. Bài kiểm tra thực sự của Polymarket không chỉ là chọn chain mới, mà là xây dựng một hệ thống giao dịch đủ mạnh và ổn định để giữ chân người dùng trong giai đoạn tăng trưởng mới, nơi độ tin cậy quan trọng hơn bao giờ hết.

Odaily星球日报04/27 03:21

Polymarket Bị Kẹt: Bài Kiểm Tra Thực Sự Sau Khi Vượt Qua Giai Đoạn Lưu Lượng Tăng Đột Biến

Odaily星球日报04/27 03:21

Điều chỉnh kỳ vọng giảm cho chu kỳ tăng giá tiếp theo của BTC

Tác giả Alex Xu, một nhà đầu tư Bitcoin lâu năm, đã chia sẻ quyết định giảm dần tỷ trọng BTC trong danh mục đầu tư của mình, từ vị thế lớn nhất xuống còn khoảng 30%, và giải thích lý do cho việc điều chỉnh kỳ vọng về đỉnh giá trong chu kỳ bull market tiếp theo. Các lý do chính bao gồm: 1. **Năng lượng tăng trưởng tiềm năng giảm:** Các chu kỳ trước được thúc đẩy bởi việc mở rộng đối tượng đầu tư theo cấp số nhân (từ cá nhân đến tổ chức). Chu kỳ tới cần sự chấp nhận từ các quỹ đầu tư quốc gia hoặc ngân hàng trung ương, điều này khó xảy ra trong 2-3 năm tới. 2. **Chi phí cơ hội cá nhân:** Tìm thấy nhiều cơ hội đầu tư hấp dẫn khác (cổ phiếu công ty) với mức giá hợp lý. 3. **Tác động tiêu cực từ sự thu hẹp của ngành crypto:** Nhiều mô hình Web3 (SocialFi, GameFi...) không thành công, dẫn đến sự thu hẹp của toàn ngành và làm chậm tốc độ tăng trưởng số người nắm giữ BTC. 4. **Áp lực từ nhà mua lớn nhất (MicroStrategy):** Chi phí huy động vốn của MicroStrategy tiếp tục tăng cao (lãi suất 11.5%), có thể làm giảm tốc độ mua vào và gây áp lực bán. 5. **Sự cạnh tranh từ Vàng được token hóa:** Sản phẩm vàng token hóa (tokenized gold) đã thu hẹp khoảng cách về tính dễ chia nhỏ, dễ mang theo và dễ xác minh so với BTC. 6. **Vấn đề ngân sách bảo mật:** Phần thưởng khối giảm sau mỗi lần halving làm trầm trọng thêm vấn đề ngân sách cho bảo mật mạng lưới. Tác giả vẫn giữ một phần BTC đáng kể và sẵn sàng mua lại nếu các lý kiến trên được giải quyết hoặc xuất hiện các yếu tố tích cực mới, với điều kiện giá cả phù hợp.

marsbit04/27 02:46

Điều chỉnh kỳ vọng giảm cho chu kỳ tăng giá tiếp theo của BTC

marsbit04/27 02:46

Thị trường dự đoán không thể thiếu giao dịch nội gián, nhưng giao dịch nội gián đang giết chết nó

Tóm tắt: Thị trường dự đoán đang đối mặt với nghịch lý sâu sắc: chúng phụ thuộc vào giao dịch nội gián để tạo ra giá cả chính xác, nhưng chính hành vi này lại đe dọa niềm tin của các nhà đầu tư nhỏ lẻ. Vụ bê bối mới nhất liên quan một quân nhân Mỹ kiếm 400.000 USD trên Polymarket nhờ thông tin mật về một cuộc đột kích vào Venezuela chỉ là minh chứng rõ nhất. Các CEO của Kalshi và Polymarket thừa nhận lợi ích của việc cho phép người có thông tin ưu thế giao dịch, nhưng họ cũng phải siết chặt chính sách chống nội gián. Vấn đề cốt lõi là sự đánh đổi giữa hiệu quả thông tin và sự công bằng. Nếu quá dễ dãi, nhà đầu tư nhỏ lẻ rời bỏ; nếu quá nghiêm ngặt, thị trường mất đi nguồn thông tin giá trị. Tương lai của thị trường dự đoán phụ thuộc vào việc tìm ra điểm cân bằng tối ưu này, trong bối cảnh giám sát ngày càng chặt chẽ và làn sóng bê bối tiếp tục diễn ra.

marsbit04/27 02:37

Thị trường dự đoán không thể thiếu giao dịch nội gián, nhưng giao dịch nội gián đang giết chết nó

marsbit04/27 02:37

Eo biển Hormuz, Iran có thể 'kiểm soát' được không?

Theo thông tin từ một nghị sĩ Iran, nước này đã xây dựng một kế hoạch toàn diện để quản lý eo biển Hormuz - tuyến hàng hải trọng yếu toàn cầu. Kế hoạch bao gồm việc yêu cầu tàu thuyền qua lại phải được Iran cấp phép, đóng phí an ninh và bảo vệ môi trường (ưu tiên thanh toán bằng đồng rial), đồng thời cấm tuyệt đối tàu Israel và các nước thù địch. Phân tích cho thấy Iran muốn tăng sức ép lên Mỹ và Israel, tạo nguồn thu mới (ước tính hơn 7,7 tỷ USD/nếu thu 1 USD/thùng dầu), đồng thời mở ra khả năng đàm phán với Mỹ. Tuy nhiên, việc thực thi gặp nhiều thách thức: khó khăn về mặt kỹ thuật, phản đối của cộng đồng quốc tế (đặc biệt từ các nước Vùng Vịnh và phương Tây), các biện pháp phong tỏa phản kích từ Mỹ, và những tranh cãi về mặt pháp lý. Khả năng áp dụng đầy đủ kế hoạch này vẫn còn nhiều bất định.

marsbit04/27 01:32

Eo biển Hormuz, Iran có thể 'kiểm soát' được không?

marsbit04/27 01:32

Áp Lực Mua Phái Sinh Bitcoin Tiếp Tục Tăng — 80.000 USD Có Phải Là Điều Không Thể Tránh Khỏi?

Áp lực mua trên thị trường phái sinh Bitcoin tiếp tục tăng mạnh, với Khối lượng Người mua Ròng (Net Taker Volume) duy trì mức dương khoảng 145 triệu USD kể từ ngày 7 tháng 3, cho thấy lực mua chiếm ưu thế so với bán. Theo phân tích on-chain, đà tăng giá gần đây của Bitcoin lên trên 79.000 USD chủ yếu được thúc đẩy bởi nhu cầu từ thị trường hợp đồng tương lai vĩnh viễn. Các chuyên gia nhận định xu hướng tăng này có khả năng tiếp tục, hướng tới mục tiêu 80.000 USD, mặc dù vùng kháng cự này đã thể hiện sức cản đáng kể. Tại thời điểm báo cáo, giá Bitcoin giao dịch quanh mức 77.508 USD.

bitcoinist04/27 00:04

Áp Lực Mua Phái Sinh Bitcoin Tiếp Tục Tăng — 80.000 USD Có Phải Là Điều Không Thể Tránh Khỏi?

bitcoinist04/27 00:04

Giao dịch

Giao ngay

Hợp đồng Tương lai