姚顺雨的88天
腾讯混元大模型Hy3 preview发布,这是姚顺雨加入腾讯后推出的首款产品。该模型采用MoE架构,总参数量295B,支持256K上下文长度,从启动训练到发布仅用88天。此前,腾讯在年会上公开反思混元大模型发展滞后,存在“背题应考”、泛化能力不足、内部业务不愿接入等问题。姚顺雨于2025年9月加入腾讯,推动组织架构重组,撤销AI Lab,新设AI Infra等部门,全面聚焦混元研发。Hy3 preview采用与业务协同设计(Co-design)策略,已在元宝、QQ等核心业务中实测应用,强调从“打榜”转向真实场景落地。腾讯还通过接入DeepSeek和OpenClaw等外部技术过渡,为混元重建争取时间。当前行业竞争激烈,阿里、Kimi、字节等密集发布新模型,腾讯需持续以组织效率提升应对窗口期挑战。混元真正的转变在于拆除了模型与产品、研究与工程之间的墙,推动AI重写组织基因。
marsbit04/23 11:13