突发,谷歌Gemini联席负责人,被OpenAI挖了

marsbit發佈於 2026-06-18更新於 2026-06-18

文章摘要

6月19日,谷歌DeepMind研究员、Gemini联席负责人诺姆·沙泽尔(Noam Shazeer)正式加入OpenAI,担任架构研究负责人,负责探索新一代AI模型架构并推动Transformer的演进。沙泽尔是2017年里程碑论文《Attention Is All You Need》的核心作者之一,其提出的Transformer架构为当今主流大模型奠定了技术基础。 沙泽尔于2000年加入谷歌,工作近18年,期间还主导了混合专家(MoE)架构等关键研究。2021年他离开谷歌共同创立Character.AI,该公司于2023年估值超10亿美元。2024年,谷歌以约27亿美元的技术授权协议将其团队重新招入DeepMind,并任命他为Gemini联席负责人。 此次加盟被外界视为OpenAI近年来最重要的人才引进之一,也是对谷歌的重大人才流失。沙泽尔将在OpenAI专注于研究Transformer之后的新架构方向。目前,AI巨头间的人才竞争日趋激烈,沙泽尔的动向也折射出行业竞争态势。他的加入或将影响下一代AI模型的技术演进路径。

智东西6月19日消息,今日,谷歌DeepMind研究员、Gemini联席负责人Noam Shazeer已正式加入OpenAI,将担任架构研究负责人(Lead for Architecture Research),负责探索新一代AI模型架构,并推动Transformer架构的进一步演进。

Shazeer本人也在海外社交平台X上发文官宣加入OpenAI,他说:“我很高兴加入OpenAI,并期待与这里卓越的团队一起工作。”

与此同时,他也向谷歌团队表达感谢:“离开是一个艰难的决定。我为谷歌团队以及我们共同完成的一切感到无比自豪。能够与你们共事是一种荣幸。”谷歌发言人则向路透社回应称,公司感谢Shazeer多年来的重要贡献,并祝愿他未来一切顺利。

Noam Shazeer是AI领域的传奇人物之一。他是2017年经典论文《Attention Is All You Need》的核心作者之一,该论文首次提出Transformer架构,直接奠定了GPT系列、Gemini、Claude等现代大模型的技术基础。

《Attention Is All You Need》

在加入OpenAI前,Shazeer曾于2021年离开谷歌创办Character.AI。Shazeer最广为人知的身份其实是Character.AI联合创始人兼CEO。

这家公司比ChatGPT爆发还要早一步押注“AI陪伴”赛道,允许用户与各种AI角色进行长期对话,一度成为全球增长最快的消费级AI应用之一。2023年,Character.AI的估值已突破10亿美元(约合人民币67.65亿元)。

2024年,谷歌与Character.AI达成一项价值约27亿美元(约合人民币182.66亿元)的技术授权协议,将Noam Shazeer及部分核心团队重新招入DeepMind,并任命Noam Shazeer为Gemini联席负责人,参与Gemini新一代模型的预训练研发工作。

对于正与Anthropic展开激烈竞争的OpenAI而言,这被外界视为近年来最重要的一次顶级人才引进。消息公布后,OpenAI高层和多位知名研究员第一时间在X上留言欢迎。

OpenAI首席研究官Mark Chen发文称:“非常高兴欢迎Noam Shazeer加入OpenAI,担任架构研究负责人。他在Transformer、MoE以及高效解码领域的工作塑造了现代AI。”

随后,多位AI研究人员也在评论区送上祝贺,包括谷歌DeepMind研究员、Gemini Thinking与Coding团队华人成员Yuchen Zhuang,OpenAI研究员、o系列推理模型核心贡献者Noam Brown,以及前微软AI副总裁、现OpenAI研究员Sebastien Bubeck等。

谷歌DeepMind华人研究员Yuchen Zhuang

OpenAI o系列推理模型核心贡献者Noam Brown

OpenAI研究员Sebastien Bubeck

与此同时,也有网友感叹:“失去一位Transformer作者和Gemini联席负责人,对谷歌来说无疑是一次沉重打击。”

01.知名Transformer作者,在谷歌工作近18年

如果从生成式AI的发展史来看,Noam Shazeer几乎参与了每一个关键节点。他于2000年加入谷歌,先后担任软件工程师和首席软件工程师,累计工作超过18年。

Noam Shazeer工作经历与教育经历(图源:领英)

2017年,他与Ashish Vaswani、Jakob Uszkoreit等8位谷歌研究员共同发表经典论文《Attention Is All You Need》,提出Transformer架构。相比此前主流的RNN和LSTM模型,Transformer能够更高效地处理长文本,并具备更强的扩展能力。

过去几年,无论是OpenAI的GPT系列、谷歌Gemini、Anthropic Claude,还是DeepSeek、Llama等模型,底层几乎都建立在Transformer架构之上。换句话说,今天这场席卷全球的大模型浪潮,很大程度上都建立在这篇论文奠定的技术基础之上。

不过,Transformer只是Noam Shazeer众多代表作中的一个。

在谷歌任职期间,他还参与推动了多项影响深远的大模型技术。2017年,他作为第一作者提出稀疏门控混合专家(MoE)架构,为后来的GPT-4、Gemini、DeepSeek-V3等模型提供了重要技术思路;2018年,他又参与开发Mesh TensorFlow,为超大规模Transformer训练提供基础工具;此后,他还参与T5模型以及谷歌对话模型LaMDA等多个关键项目研发。

02.从谷歌离职创业,又被182亿买回

2021年,Shazeer离开谷歌,与Daniel De Freitas共同创办Character.AI。

当时,大语言模型尚未迎来ChatGPT时刻,但Character.AI已经率先尝试将聊天机器人产品推向大众市场,并迅速积累大量用户。

2024年,谷歌以约27亿美元(约合人民币182.66亿元)的合作交易重新将Shazeer及其核心团队纳入DeepMind体系。随后,他成为Gemini项目的重要负责人之一,并参与Gemini新一代模型的预训练工作

Shazeer回归的时间点,正值谷歌AI业务承受巨大压力。彼时ChatGPT爆火,Gemini仍处于追赶阶段。重返DeepMind后,Shazeer参与模型研发,并最终出任Gemini联席负责人,成为谷歌AI技术领军人物之一。

此后,Gemini 3系列模型在编程、推理等多个基准测试中跻身行业前列,成为谷歌与OpenAI、Anthropic竞争的重要筹码。

从谷歌研究员,到创业者,再到Gemini联席负责人,Shazeer几乎见证了谷歌近十年来AI发展的每一次重要转折。因此,此次离开谷歌加入OpenAI,也被不少业内人士视为谷歌近年来最重要的人才流失事件之一。

03.OpenAI的人才争夺战还在升级

Shazeer加盟的背景,是AI行业愈发激烈的人才竞争。

过去一年里,OpenAI与Anthropic之间的竞争持续升温。双方不仅围绕模型能力展开较量,也在不断争夺顶级研究员和核心工程师。

英国《金融时报》报道称,OpenAI内部将Shazeer的加入视为一次重要补强。未来他将重点研究Transformer之后的新架构方向,以及如何进一步提升模型能力。

值得注意的是,Transformer已经统治AI领域近十年。随着推理模型、多智能体系统以及世界模型的发展,越来越多研究人员开始思考:Transformer是否会迎来下一次重大架构升级?

而Shazeer恰恰是最有资格回答这个问题的人之一。

对于谷歌而言,这意味着失去了一位Transformer作者、Gemini联席负责人以及最资深的AI架构设计者之一。对于OpenAI而言,其实验室则迎来了一位曾亲手塑造现代AI技术栈的人。

04.结语:Transformer时代重要人才流动

随着技术逐渐逼近前沿,顶级研究员本身也成为最稀缺的资源之一。Noam Shazeer的职业轨迹,几乎串联起了Transformer、Character.AI、Gemini和OpenAI四个重要节点。

如今,这位Transformer作者离开谷歌、加入OpenAI,既是一场人才流动,也折射出当下AI巨头之间愈发激烈的竞争态势。

尤其是在OpenAI与Anthropic围绕下一代模型、企业市场和顶级研究人才展开白热化竞争的当下,谷歌也正通过Gemini持续追赶。此时失去一位Transformer奠基人和Gemini联席负责人,对谷歌而言无疑是一笔不小的损失。

对于整个行业来说,后续值得关注的问题或许是:当Transformer作者亲自研究“Transformer之后的架构”时,下一代AI模型会走向何方。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:江宇,编辑:李水青

相關問答

QNoam Shazeer是谁?他在加入OpenAI前担任什么职务?

ANoam Shazeer是AI领域的传奇人物之一,是2017年经典论文《Attention Is All You Need》的核心作者之一,首次提出Transformer架构。在加入OpenAI前,他是谷歌DeepMind研究员、Gemini项目的联席负责人。

QNoam Shazeer此次加入OpenAI,将担任什么职位?主要负责什么工作?

A他将担任OpenAI的“架构研究负责人”(Lead for Architecture Research),主要负责探索新一代AI模型架构,并推动Transformer架构的进一步演进。

QNoam Shazeer的职业生涯中,除了Transformer,还有哪些重要的技术贡献?

A除了提出Transformer,他还作为第一作者提出了稀疏门控混合专家(MoE)架构,参与了Mesh TensorFlow的开发,以及谷歌的T5模型和对话模型LaMDA等多个关键项目的研发。

Q文章中提到谷歌在2024年曾与Shazeer有过一次大规模合作,具体内容是什么?

A2024年,谷歌与Shazeer联合创立的公司Character.AI达成一项价值约27亿美元的技术授权协议,借此将Noam Shazeer及部分核心团队重新招入谷歌DeepMind,并任命其为Gemini项目的联席负责人。

QNoam Shazeer的这次跳槽对谷歌和OpenAI分别意味着什么?

A对谷歌而言,意味着失去了一位Transformer奠基人、Gemini项目的核心领导者和资深AI架构师,是一次重大的人才流失。对OpenAI而言,则是一次顶级人才的重要引进,尤其是在与Anthropic等竞争对手的激烈人才争夺战中,增强了其在未来模型架构探索方面的实力。

你可能也喜歡

Gate 研究院:ETF 流出压制风险偏好,双向系统穿越弱势市场

本文分析了2026年5月加密市场的表现与交易策略回溯。5月市场呈现先冲高、后回落、月末低波整理的特征。BTC、ETH、SOL均在月初创出阶段高点后进入调整,主流ETF出现连续净流出,市场结构呈现现货偏弱、杠杆交易主导的特点。 策略测试显示,在弱势震荡市中,双向交易策略显著优于买入持有和只做多策略。三资产等权买入持有收益约-6.09%,只做多均线突破策略收益约-3.65%,而双向均线簇突破策略收益为+2.11%。收益主要来源于5月中下旬ETH和SOL的空头趋势交易,验证了在趋势不明朗、假突破频发的市场环境下,允许双向交易的重要性。 有效的交易框架是:识别均线簇压缩状态,允许价格向上或向下突破选择方向;使用EMA12作为动态退出线管理失败信号,配合2.5%的固定止损和3倍风险回报比(3R)的止盈来保留趋势利润。这种低胜率、高盈亏比的框架更适合5月的市场结构。 资金面上,稳定币总市值保持稳定,但BTC和ETH现货ETF资金流出,资金转向局部主题ETF和高弹性品种。衍生品交易活跃,永续合约成交规模远超现货。同时,加密市场与美股(尤其是标普500指数)保持较高相关性,美股AI科技龙头股的强劲表现吸引了部分风险资金,加剧了主流加密资产的资金流出压力。 展望6月,报告建议继续采用纪律化的双向交易系统,将BTC作为市场整体风险偏好的锚,并结合美股表现、ETF资金流向等宏观过滤条件来调整多空信号的权重,在控制单笔风险的前提下捕捉趋势机会。

marsbit6 分鐘前

Gate 研究院:ETF 流出压制风险偏好,双向系统穿越弱势市场

marsbit6 分鐘前

Anthropic CEO最新访谈:论技术爆发、安全红线与文明契约

本次访谈中,Anthropic CEO达里奥·阿莫代分享了其对AI行业现状与未来的深度思考。他描述AI发展如同“平稳的指数级增长”,虽表面平缓但终将迎来爆发。面对这种压力,他强调需保持外科医生般的理性冷静,避免在恐慌与漠视间摇摆。 阿莫代回顾了离开OpenAI的核心原因,并非单纯技术分歧,而是源于根本性的信任与价值观破裂。他强调,行业合作的基础是信任,主张可信的参与者应联合制定标准,以带动整个生态负责任地发展。 在商业模式上,Anthropic坚定选择企业级市场,认为这与公司“安全、向善”的价值观更具协同性,能避免消费级市场常见的成瘾性与低质内容竞争。他谈及AI对就业的冲击,认为社会需提前规划宏观经济政策,并引导企业利用AI“做更多事”,而非简单裁员,以寻求正和博弈。 关于AI安全与军事应用,阿莫代划出了明确红线:坚决反对大规模监控和全自主武器系统,坚持“人类在回路中”的原则。他以公司暂不发布高风险网络安全模型“Mythos”为例,阐释了在能力与安全之间主动权衡的实践。 在权力制衡方面,他承认私营公司掌控强大技术存在风险,介绍了Anthropic设立“长期利益信托”等机制来引入制衡,并呼吁政府实施基于风险的合理监管,而非在“放任不管”与“全面国有化”两个极端间跳跃。 最后,阿莫代承认AI可能导致文明崩溃的风险,但表示Anthropic的行动正是为了降低该概率。他认为重建硅谷失去的信任不能靠言语,而要靠如推迟产品发布、切断某些市场访问等实际牺牲来证明其“做正确的事”的承诺。

marsbit10 分鐘前

Anthropic CEO最新访谈:论技术爆发、安全红线与文明契约

marsbit10 分鐘前

卡尔达诺 Van Rossum 升级随着治理阶段推进更接近主网

卡尔达诺(Cardano)的 Van Rossum 升级正深入其治理和准备阶段,ADA交易者密切关注网络能否顺利将该协议变更推向主网激活。 此次升级是卡尔达诺后伏尔泰(Voltaire)时代的关键一步,其重要性在于测试链上治理流程的实际运作。Intersect的最新生态更新显示,升级已在PreProd测试网上成功实施,工作重点正转向主网准备。 对于交易者而言,升级过程本身与市场反应密切相关。顺利的部署可能增强对项目路线的信心,而沟通不畅或延迟则可能在市场疲软时打击情绪。ADA的价格走势不仅取决于技术里程碑,也受制于更广泛的市场环境。 目前最稳妥的解读是升级已取得显著进展,但市场应避免将每一步治理进展都视同主网最终完成。PreProd测试网的成功为开发者和生态参与者提供了重要演练,而主网激活才是更重要的里程碑。 接下来,来自Intersect和卡尔达诺治理渠道的官方沟通至关重要,交易所和基础设施提供商也需要充分准备以降低风险。对卡尔达诺而言,最理想的结果是平稳执行:完成基础设施升级、获得治理确认、保障交易所准备就绪,且用户无重大中断。对于一个将治理作为核心身份的网络而言,证明此流程有效运行本身就是关键的催化剂。

bitcoinist42 分鐘前

卡尔达诺 Van Rossum 升级随着治理阶段推进更接近主网

bitcoinist42 分鐘前

交易

現貨
合約
活动图片