Soudain, le codirigeant de Gemini chez Google a été recruté par OpenAI

marsbitPublié le 2026-06-18Dernière mise à jour le 2026-06-18

Résumé

Noam Shazeer, chercheur chez Google DeepMind et co-responsable de Gemini, rejoint officiellement OpenAI en tant que responsable de la recherche en architecture. Il sera chargé d'explorer les nouvelles architectures de modèles d'IA et de faire évoluer l'architecture Transformer, dont il est l'un des auteurs principaux du célèbre article « Attention Is All You Need » publié en 2017. Shazeer a travaillé chez Google pendant près de 18 ans avant de co-fonder Character.AI en 2021. En 2024, Google l'a recruté à nouveau au sein de DeepMind via un accord de licence technique d'environ 27 milliards de dollars, où il est devenu co-responsable de Gemini. Son départ pour OpenAI est considéré comme une perte significative pour Google et un renfort majeur pour OpenAI, notamment dans sa compétition avec Anthropic. Son arrivée à OpenAI intervient dans un contexte de guerre des talents intense dans le secteur de l'IA. Il est attendu qu'il se concentre sur le développement de la prochaine génération d'architectes de modèles, au-delà du Transformer. Ce mouvement reflète la concurrence acharnée entre les géants de l'IA pour sécuriser les experts les plus influents.

L’information du 19 juin – Aujourd’hui, Noam Shazeer, chercheur chez Google DeepMind et codirigeant de Gemini, a officiellement rejoint OpenAI. Il y occupera le poste de responsable de la recherche en architecture (Lead for Architecture Research), chargé d'explorer les nouvelles architectures de modèles d'IA et de faire évoluer l'architecture Transformer.

Shazeer a lui-même annoncé son arrivée chez OpenAI sur la plateforme de médias sociaux X. Il a déclaré : « Je suis ravi de rejoindre OpenAI et j'ai hâte de travailler avec l'équipe exceptionnelle qui s'y trouve. »

Dans le même temps, il a exprimé sa gratitude envers l'équipe de Google : « Partir a été une décision difficile. Je suis extrêmement fier de l'équipe de Google et de tout ce que nous avons accompli ensemble. Ce fut un honneur de travailler avec vous. » Un porte-parole de Google a quant à lui déclaré à Reuters que l'entreprise remerciait Shazeer pour ses importantes contributions au fil des années et lui souhaitait le meilleur pour l'avenir.

Noam Shazeer est l'une des figures légendaires du domaine de l'IA. Il est l'un des auteurs principaux du célèbre article de 2017 « Attention Is All You Need », qui a introduit pour la première fois l'architecture Transformer, jetant ainsi les bases techniques des modèles modernes de grande envergure tels que la série GPT, Gemini, Claude, etc.

« Attention Is All You Need »

Avant de rejoindre OpenAI, Shazeer avait quitté Google en 2021 pour fonder Character.AI. Son rôle le plus connu est en réalité celui de cofondateur et PDG de Character.AI.

Cette entreprise a parié sur le créneau de « l'accompagnement par IA » (AI companionship) plus tôt que l'explosion de ChatGPT, permettant aux utilisateurs d'avoir des conversations durables avec divers personnages IA, devenant ainsi l'une des applications d'IA grand public à la croissance la plus rapide au monde. En 2023, la valorisation de Character.AI avait dépassé 1 milliard de dollars (environ 67,65 milliards de yuans).

En 2024, Google et Character.AI ont conclu un accord de licence technologique d'une valeur d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), réintégrant Noam Shazeer et une partie de l'équipe principale au sein de DeepMind et nommant Noam Shazeer codirigeant de Gemini, participant au développement du pré-entraînement de la nouvelle génération de modèles Gemini.

Pour OpenAI, qui est en concurrence féroce avec Anthropic, cela est considéré par les observateurs comme l'un des recrutements de talents de premier plan les plus importants de ces dernières années. Après l'annonce, la direction d'OpenAI et plusieurs chercheurs renommés ont immédiatement posté des messages de bienvenue sur X.

Mark Chen, directeur de la recherche chez OpenAI, a écrit : « Je suis très heureux d'accueillir Noam Shazeer chez OpenAI en tant que responsable de la recherche en architecture. Ses travaux sur le Transformer, le MoE et le décodage efficace ont façonné l'IA moderne. »

Ensuite, plusieurs chercheurs en IA ont également présenté leurs félicitations dans les commentaires, notamment Yuchen Zhuang, chercheur chez Google DeepMind et membre de l'équipe Gemini Thinking & Coding, Noam Brown, chercheur chez OpenAI et contributeur clé des modèles de raisonnement de la série o, ainsi que l'ancien vice-président IA de Microsoft et actuel chercheur chez OpenAI, Sebastien Bubeck.

Yuchen Zhuang, chercheur chez Google DeepMind

Noam Brown, contributeur clé des modèles de raisonnement de la série o chez OpenAI

Sebastien Bubeck, chercheur chez OpenAI

Parallèlement, certains internautes ont commenté : « Perdre un auteur du Transformer et le codirigeant de Gemini est sans aucun doute un coup dur pour Google. »

01. Auteur renommé du Transformer, près de 18 ans chez Google

Si l'on regarde l'histoire de l'IA générative, Noam Shazeer a participé à presque tous les moments clés. Il a rejoint Google en 2000, occupant successivement les postes d'ingénieur logiciel et d'ingénieur logiciel principal, pour un total de plus de 18 ans de travail.

Parcours professionnel et éducatif de Noam Shazeer (Source : LinkedIn)

En 2017, avec huit autres chercheurs de Google, dont Ashish Vaswani et Jakob Uszkoreit, il a publié l'article fondateur « Attention Is All You Need », proposant l'architecture Transformer. Comparé aux modèles RNN et LSTM qui prédominaient auparavant, le Transformer pouvait traiter plus efficacement les longs textes et possédait une plus grande capacité d'extension.

Ces dernières années, que ce soit la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, ou encore DeepSeek, Llama, etc., leurs fondations reposent presque toutes sur l'architecture Transformer. En d'autres termes, la vague actuelle des grands modèles qui balaie le monde est largement construite sur les bases techniques établies par cet article.

Cependant, le Transformer n'est qu'une des nombreuses contributions majeures de Noam Shazeer.

Pendant son mandat chez Google, il a également participé à la promotion de plusieurs technologies de grands modèles ayant une influence profonde. En 2017, en tant que premier auteur, il a proposé l'architecture de Mélange d'Experts à portes éparses (MoE), fournissant une piste technologique importante pour les modèles ultérieurs tels que GPT-4, Gemini, DeepSeek-V3, etc. ; en 2018, il a participé au développement de Mesh TensorFlow, fournissant un outil de base pour l'entraînement de Transformers à très grande échelle ; par la suite, il a également participé au développement de plusieurs projets clés tels que le modèle T5 et le modèle de dialogue de Google, LaMDA.

02. Départ de Google pour entreprendre, puis racheté pour 18,2 milliards de dollars

En 2021, Shazeer a quitté Google et a cofondé Character.AI avec Daniel De Freitas.

À l'époque, les grands modèles de langage n'avaient pas encore connu leur moment « ChatGPT », mais Character.AI avait déjà été l'un des premiers à tenter de commercialiser un produit de chatbot auprès du grand public, accumulant rapidement un grand nombre d'utilisateurs.

En 2024, Google, via un accord de partenariat d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), a réintégré Shazeer et son équipe principale dans l'écosystème DeepMind. Par la suite, il est devenu l'un des responsables importants du projet Gemini et a participé aux travaux de pré-entraînement de la nouvelle génération de modèles Gemini.

Le moment du retour de Shazeer coïncidait avec une période de grande pression pour les activités d'IA de Google. ChatGPT venait de connaître un succès fulgurant, et Gemini était encore en phase de rattrapage. Après son retour chez DeepMind, Shazeer a participé au développement des modèles et a finalement été nommé codirigeant de Gemini, devenant l'une des figures de proue technologique de l'IA chez Google.

Par la suite, la série de modèles Gemini 3 s'est classée parmi les premiers de l'industrie dans plusieurs benchmarks de programmation et de raisonnement, devenant un atout important pour Google dans sa concurrence avec OpenAI et Anthropic.

Du chercheur de Google, à l'entrepreneur, puis au codirigeant de Gemini, Shazeer a été témoin de presque tous les tournants importants du développement de l'IA chez Google au cours de la dernière décennie. Par conséquent, son départ de Google pour rejoindre OpenAI est également considéré par de nombreux professionnels du secteur comme l'un des événements de fuite des cerveaux les plus importants pour Google ces dernières années.

03. La bataille des talents d'OpenAI continue de s'intensifier

Le contexte de l'arrivée de Shazeer est celui d'une concurrence de plus en plus féroce pour les talents dans l'industrie de l'IA.

Au cours de l'année écoulée, la concurrence entre OpenAI et Anthropic n'a cessé de s'intensifier. Non seulement les deux parties rivalisent autour des capacités des modèles, mais elles se disputent également continuellement les chercheurs de premier plan et les ingénieurs clés.

Le Financial Times a rapporté qu'au sein d'OpenAI, l'arrivée de Shazeer est considérée comme un renforcement important. À l'avenir, il se concentrera principalement sur la recherche de nouvelles orientations architecturales post-Transformer, ainsi que sur les moyens d'améliorer davantage les capacités des modèles.

Il est à noter que le Transformer règne sur le domaine de l'IA depuis près de dix ans. Avec le développement des modèles de raisonnement, des systèmes multi-agents et des modèles du monde, de plus en plus de chercheurs commencent à se demander : le Transformer connaîtra-t-il sa prochaine mise à niveau architecturale majeure ?

Et Shazeer est justement l'une des personnes les plus qualifiées pour répondre à cette question.

Pour Google, cela signifie perdre un auteur du Transformer, le codirigeant de Gemini et l'un de ses concepteurs d'architecture IA les plus expérimentés. Pour OpenAI, son laboratoire accueille quelqu'un qui a personnellement façonné la pile technologique de l'IA moderne.

04. Conclusion : Un mouvement de talents important à l'ère du Transformer

À mesure que la technologie approche des frontières de la recherche, les chercheurs de premier plan deviennent eux-mêmes l'une des ressources les plus rares. La trajectoire professionnelle de Noam Shazeer relie presque quatre nœuds importants : Transformer, Character.AI, Gemini et OpenAI.

Aujourd'hui, le départ de cet auteur du Transformer de Google pour rejoindre OpenAI est à la fois un mouvement de talents et le reflet de la concurrence de plus en plus intense entre les géants de l'IA actuels.

Particulièrement à un moment où OpenAI et Anthropic sont engagés dans une concurrence acharnée autour de la prochaine génération de modèles, du marché des entreprises et des chercheurs de premier plan, et où Google poursuit sa course poursuite via Gemini, perdre un fondateur du Transformer et le codirigeant de Gemini représente sans aucun doute une perte non négligeable pour Google.

Pour l'ensemble du secteur, la question qui mérite d'être suivie à l'avenir est peut-être : lorsque l'auteur du Transformer se penche personnellement sur « l'architecture post-Transformer », vers où se dirigera la prochaine génération de modèles d'IA.

Cet article provient du compte WeChat officiel « 智东西 » (ID : zhidxcom), auteur : Jiang Yu, éditeur : Li Shuiqing.

Questions liées

QQui est Noam Shazeer et quel est son nouveau poste chez OpenAI ?

ANoam Shazeer est un chercheur renommé de Google DeepMind et co-responsable de Gemini. Il a officiellement rejoint OpenAI en tant que Lead for Architecture Research (Responsable de la recherche en architecture), chargé d'explorer la prochaine génération d'architectures de modèles d'IA et de faire progresser l'architecture Transformer.

QPourquoi Noam Shazeer est-il considéré comme une figure légendaire dans le domaine de l'IA ?

ANoam Shazeer est considéré comme une figure légendaire car il est l'un des auteurs principaux du célèbre article de 2017 'Attention Is All You Need', qui a introduit l'architecture Transformer. Cette architecture constitue la base technique des modèles de langage modernes comme GPT, Gemini et Claude.

QQuelle était la relation précédente entre Noam Shazeer et Google avant son départ pour OpenAI ?

AAvant de rejoindre OpenAI, Noam Shazeer avait travaillé chez Google pendant près de 18 ans. En 2021, il a quitté Google pour co-fonder Character.AI. En 2024, Google a racheté son équipe pour environ 27 milliards de dollars et l'a réintégré au sein de DeepMind en tant que co-responsable de Gemini.

QPourquoi le départ de Shazeer vers OpenAI est-il considéré comme une perte significative pour Google ?

ALe départ de Shazeer est considéré comme une perte significative pour Google car il perd non seulement l'un des pères de l'architecture Transformer, mais aussi un leader technique clé et co-responsable du projet phare Gemini, dans un contexte de concurrence intense avec OpenAI et Anthropic.

QQuel sera le principal axe de recherche de Noam Shazeer chez OpenAI selon l'article ?

ASelon l'article, chez OpenAI, Noam Shazeer se concentrera principalement sur la recherche de nouvelles architectures succédant au Transformer et sur les moyens d'améliorer davantage les capacités des modèles d'IA, explorant ainsi l'évolution future des fondements de l'IA.

Lectures associées

NVIDIA fait pression avec ses CPU, la Chine riposte avec RISC-V : Plongée approfondie dans les semi-conducteurs - Quatrième partie

Une information significative est apparue cette semaine : le CPU Vera de NVIDIA, conçu pour l'IA des centres de données, sera disponible pour les clients chinois dès août, à un prix unitaire dépassant 20 000 $. Face à cette arrivée, reposant toujours sur l'architecture Arm, la question se pose en Chine : existe-t-il une alternative autonome pour les CPU haute performance au-delà du duopole x86/Arm ? RISC-V émerge comme la réponse. Cette architecture ouverte, née il y a plus de dix ans, dépasse désormais le domaine de l'embarqué pour viser les serveurs et l'IA. Elle représente une opportunité de briser le "triangle impossible" de l'industrie (prospérité, contrôle, autonomie), offrant une voie potentiellement libre, contrôlée et florissante. La Chine devient un acteur central de cette poussée, motivée par la sécurité d'approvisionnement, la réduction des coûts, la souveraineté technologique et l'explosion de l'IA. Des équipes locales ont franchi le seuil symbolique des 15 points SPECint par GHz, signe d'entrée dans le club haute performance. Les progrès vont au-delà du simple cœur (core) pour englober des sous-systèmes complets : réseaux sur puce cohérents (NoC), gestion, fiabilité (RAS). Un processeur serveur 40 cœurs, 100% compatible avec le standard RVA23 (sans instructions personnalisées), illustre cette maturité croissante et cette priorité donnée à la compatibilité logicielle sur les performances artificielles. Cependant, les défis restent immenses. La fragmentation de l'écosystème due aux extensions personnalisées, l'immaturité des outils de développement (EDA) et de validation, les écarts de performance monocœur et d'efficacité énergétique par rapport aux architectures établies, ainsi que les contraintes liées aux procédés de fabrication avancés, constituent autant d'obstacles concrets. Le fossé logiciel, symbolisé par CUDA chez NVIDIA, est particulièrement profond. En résumé, la porte s'est ouverte pour RISC-V en Chine comme une alternative sérieuse et nécessaire à long terme. Le chemin est néanmoins long et semé d'épreuves techniques ardues. La course ne consiste pas à remplacer immédiatement des solutions comme le Vera de NVIDIA, mais à construire, pierre par pierre, une base autonome pour la prochaine révolution du calcul.

marsbitIl y a 3 h

NVIDIA fait pression avec ses CPU, la Chine riposte avec RISC-V : Plongée approfondie dans les semi-conducteurs - Quatrième partie

marsbitIl y a 3 h

Le tableau de paris codé a rapporté de l'argent, mais Polymarket n'est vraiment pas un bon endroit pour "l'arbitrage"

Dans son article, l'auteur partage son expérience de développement d'un tableau de bord personnalisé pour suivre et gérer ses paris sur Polymarket, une plateforme de prédiction. En utilisant cet outil avec un capital d'environ 1600 dollars, il a obtenu un rendement de plus de 30% sur une quinzaine de jours. Cependant, il insiste sur le fait que Polymarket n'est pas un lieu adapté pour des stratégies d'arbitrage traditionnelles. Le tableau de bord, divisé en un "Tableau de bord des positions" et une "Veille des opportunités", vise à visualiser les investissements, gérer les risques et suivre les marchés d'intérêt. L'outil intègre un système de contrôle des risques basé sur le fractionnement des paris en trois catégories (T1, T2, T3) selon le niveau de conviction et le risque, et limite l'exposition à certains thèmes pour éviter une "diversification illusoire". L'auteur met en garde contre les pièges des marchés binaires comme Polymarket. Il explique que même pour un pari perçu comme ayant une probabilité de réussite très élevée, le risque de perdre 100% du capital engagé existe toujours. Il souligne l'importance cruciale de la gestion de la taille des positions pour survivre à des erreurs de jugement inévitables à long terme. Il note également que de nombreux marchés, bien que distincts, peuvent être corrélés autour d'un même événement sous-jacent, amplifiant ainsi les risques. Son expérience l'amène à considérer Polymarket non pas comme une source de revenus stables, mais plutôt comme un terrain d'entraînement pour affiner son jugement sur l'actualité politique, économique et technologique. Il conclut que la valeur principale de son outil réside dans l'imposition d'une discipline et d'un cadre rigoureux, transformant l'intuition en processus contrôlé, bien plus que dans la performance affichée sur une période courte.

marsbitIl y a 6 h

Le tableau de paris codé a rapporté de l'argent, mais Polymarket n'est vraiment pas un bon endroit pour "l'arbitrage"

marsbitIl y a 6 h

Analyse de la croissance de Notion : D'un outil de prise de notes à 100 millions d'utilisateurs, comment Notion a construit sa triple roue de croissance via le produit, les modèles et la communauté

Notion est passé d'un outil de prise de notes à une plateforme de gestion des connaissances et de collaboration comptant 100 millions d'utilisateurs, grâce à un système de croissance à trois niveaux. La croissance a été principalement tirée par le produit (PLG) : sa structure modulaire offre une grande adaptabilité, sa stratégie gratuite a facilité l'adoption et ses fonctionnalités de partage et de collaboration ont généré une diffusion virale naturelle. Le deuxième moteur est l'économie des modèles. Face à la liberté parfois déroutante du produit, les modèles (officiels et créés par les utilisateurs) fournissent des solutions concrètes, réduisant les coûts d'activation pour les nouveaux venus et créant un canal de croissance via les moteurs de recherche. Ils ont également permis l'émergence d'une communauté de créateurs qui soutient l'écosystème. Le troisième moteur est la croissance communautaire. La communauté Notion va au-delà du support technique : elle produit des tutoriels, organise des événements locaux via des ambassadeurs et participe à la traduction culturelle du produit. Elle transforme les utilisateurs en éducateurs et en promoteurs, réduisant ainsi les coûts d'expansion mondiale. Le marketing de contenu de Notion se concentre sur l'éducation aux méthodes de travail plutôt que sur la vente de fonctionnalités. Son passage au marché professionnel s'est fait "par le bas", les équipes adoptant d'abord l'outil avant que les entreprises ne formalisent son usage. À l'ère de l'IA, Notion intègre ces capacités dans ses flux de travail existants, renforçant sa valeur et ouvrant la voie à une évolution potentielle vers un système d'exploitation du travail. La force durable de Notion réside dans cet écosystème difficile à répliquer : la combinaison d'un produit flexible, d'un vaste patrimoine de connaissances utilisateur, d'une économie de modèles dynamique et d'une communauté engagée crée un effet de levier et une fidélité qui vont bien au-delà de simples fonctionnalités logicielles.

marsbitIl y a 9 h

Analyse de la croissance de Notion : D'un outil de prise de notes à 100 millions d'utilisateurs, comment Notion a construit sa triple roue de croissance via le produit, les modèles et la communauté

marsbitIl y a 9 h

Trading

Spot
Futures
活动图片