Soudain, le codirigeant de Gemini chez Google a été recruté par OpenAI

marsbitPublié le 2026-06-18Dernière mise à jour le 2026-06-18

Résumé

Noam Shazeer, chercheur chez Google DeepMind et co-responsable de Gemini, rejoint officiellement OpenAI en tant que responsable de la recherche en architecture. Il sera chargé d'explorer les nouvelles architectures de modèles d'IA et de faire évoluer l'architecture Transformer, dont il est l'un des auteurs principaux du célèbre article « Attention Is All You Need » publié en 2017. Shazeer a travaillé chez Google pendant près de 18 ans avant de co-fonder Character.AI en 2021. En 2024, Google l'a recruté à nouveau au sein de DeepMind via un accord de licence technique d'environ 27 milliards de dollars, où il est devenu co-responsable de Gemini. Son départ pour OpenAI est considéré comme une perte significative pour Google et un renfort majeur pour OpenAI, notamment dans sa compétition avec Anthropic. Son arrivée à OpenAI intervient dans un contexte de guerre des talents intense dans le secteur de l'IA. Il est attendu qu'il se concentre sur le développement de la prochaine génération d'architectes de modèles, au-delà du Transformer. Ce mouvement reflète la concurrence acharnée entre les géants de l'IA pour sécuriser les experts les plus influents.

L’information du 19 juin – Aujourd’hui, Noam Shazeer, chercheur chez Google DeepMind et codirigeant de Gemini, a officiellement rejoint OpenAI. Il y occupera le poste de responsable de la recherche en architecture (Lead for Architecture Research), chargé d'explorer les nouvelles architectures de modèles d'IA et de faire évoluer l'architecture Transformer.

Shazeer a lui-même annoncé son arrivée chez OpenAI sur la plateforme de médias sociaux X. Il a déclaré : « Je suis ravi de rejoindre OpenAI et j'ai hâte de travailler avec l'équipe exceptionnelle qui s'y trouve. »

Dans le même temps, il a exprimé sa gratitude envers l'équipe de Google : « Partir a été une décision difficile. Je suis extrêmement fier de l'équipe de Google et de tout ce que nous avons accompli ensemble. Ce fut un honneur de travailler avec vous. » Un porte-parole de Google a quant à lui déclaré à Reuters que l'entreprise remerciait Shazeer pour ses importantes contributions au fil des années et lui souhaitait le meilleur pour l'avenir.

Noam Shazeer est l'une des figures légendaires du domaine de l'IA. Il est l'un des auteurs principaux du célèbre article de 2017 « Attention Is All You Need », qui a introduit pour la première fois l'architecture Transformer, jetant ainsi les bases techniques des modèles modernes de grande envergure tels que la série GPT, Gemini, Claude, etc.

« Attention Is All You Need »

Avant de rejoindre OpenAI, Shazeer avait quitté Google en 2021 pour fonder Character.AI. Son rôle le plus connu est en réalité celui de cofondateur et PDG de Character.AI.

Cette entreprise a parié sur le créneau de « l'accompagnement par IA » (AI companionship) plus tôt que l'explosion de ChatGPT, permettant aux utilisateurs d'avoir des conversations durables avec divers personnages IA, devenant ainsi l'une des applications d'IA grand public à la croissance la plus rapide au monde. En 2023, la valorisation de Character.AI avait dépassé 1 milliard de dollars (environ 67,65 milliards de yuans).

En 2024, Google et Character.AI ont conclu un accord de licence technologique d'une valeur d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), réintégrant Noam Shazeer et une partie de l'équipe principale au sein de DeepMind et nommant Noam Shazeer codirigeant de Gemini, participant au développement du pré-entraînement de la nouvelle génération de modèles Gemini.

Pour OpenAI, qui est en concurrence féroce avec Anthropic, cela est considéré par les observateurs comme l'un des recrutements de talents de premier plan les plus importants de ces dernières années. Après l'annonce, la direction d'OpenAI et plusieurs chercheurs renommés ont immédiatement posté des messages de bienvenue sur X.

Mark Chen, directeur de la recherche chez OpenAI, a écrit : « Je suis très heureux d'accueillir Noam Shazeer chez OpenAI en tant que responsable de la recherche en architecture. Ses travaux sur le Transformer, le MoE et le décodage efficace ont façonné l'IA moderne. »

Ensuite, plusieurs chercheurs en IA ont également présenté leurs félicitations dans les commentaires, notamment Yuchen Zhuang, chercheur chez Google DeepMind et membre de l'équipe Gemini Thinking & Coding, Noam Brown, chercheur chez OpenAI et contributeur clé des modèles de raisonnement de la série o, ainsi que l'ancien vice-président IA de Microsoft et actuel chercheur chez OpenAI, Sebastien Bubeck.

Yuchen Zhuang, chercheur chez Google DeepMind

Noam Brown, contributeur clé des modèles de raisonnement de la série o chez OpenAI

Sebastien Bubeck, chercheur chez OpenAI

Parallèlement, certains internautes ont commenté : « Perdre un auteur du Transformer et le codirigeant de Gemini est sans aucun doute un coup dur pour Google. »

01. Auteur renommé du Transformer, près de 18 ans chez Google

Si l'on regarde l'histoire de l'IA générative, Noam Shazeer a participé à presque tous les moments clés. Il a rejoint Google en 2000, occupant successivement les postes d'ingénieur logiciel et d'ingénieur logiciel principal, pour un total de plus de 18 ans de travail.

Parcours professionnel et éducatif de Noam Shazeer (Source : LinkedIn)

En 2017, avec huit autres chercheurs de Google, dont Ashish Vaswani et Jakob Uszkoreit, il a publié l'article fondateur « Attention Is All You Need », proposant l'architecture Transformer. Comparé aux modèles RNN et LSTM qui prédominaient auparavant, le Transformer pouvait traiter plus efficacement les longs textes et possédait une plus grande capacité d'extension.

Ces dernières années, que ce soit la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, ou encore DeepSeek, Llama, etc., leurs fondations reposent presque toutes sur l'architecture Transformer. En d'autres termes, la vague actuelle des grands modèles qui balaie le monde est largement construite sur les bases techniques établies par cet article.

Cependant, le Transformer n'est qu'une des nombreuses contributions majeures de Noam Shazeer.

Pendant son mandat chez Google, il a également participé à la promotion de plusieurs technologies de grands modèles ayant une influence profonde. En 2017, en tant que premier auteur, il a proposé l'architecture de Mélange d'Experts à portes éparses (MoE), fournissant une piste technologique importante pour les modèles ultérieurs tels que GPT-4, Gemini, DeepSeek-V3, etc. ; en 2018, il a participé au développement de Mesh TensorFlow, fournissant un outil de base pour l'entraînement de Transformers à très grande échelle ; par la suite, il a également participé au développement de plusieurs projets clés tels que le modèle T5 et le modèle de dialogue de Google, LaMDA.

02. Départ de Google pour entreprendre, puis racheté pour 18,2 milliards de dollars

En 2021, Shazeer a quitté Google et a cofondé Character.AI avec Daniel De Freitas.

À l'époque, les grands modèles de langage n'avaient pas encore connu leur moment « ChatGPT », mais Character.AI avait déjà été l'un des premiers à tenter de commercialiser un produit de chatbot auprès du grand public, accumulant rapidement un grand nombre d'utilisateurs.

En 2024, Google, via un accord de partenariat d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), a réintégré Shazeer et son équipe principale dans l'écosystème DeepMind. Par la suite, il est devenu l'un des responsables importants du projet Gemini et a participé aux travaux de pré-entraînement de la nouvelle génération de modèles Gemini.

Le moment du retour de Shazeer coïncidait avec une période de grande pression pour les activités d'IA de Google. ChatGPT venait de connaître un succès fulgurant, et Gemini était encore en phase de rattrapage. Après son retour chez DeepMind, Shazeer a participé au développement des modèles et a finalement été nommé codirigeant de Gemini, devenant l'une des figures de proue technologique de l'IA chez Google.

Par la suite, la série de modèles Gemini 3 s'est classée parmi les premiers de l'industrie dans plusieurs benchmarks de programmation et de raisonnement, devenant un atout important pour Google dans sa concurrence avec OpenAI et Anthropic.

Du chercheur de Google, à l'entrepreneur, puis au codirigeant de Gemini, Shazeer a été témoin de presque tous les tournants importants du développement de l'IA chez Google au cours de la dernière décennie. Par conséquent, son départ de Google pour rejoindre OpenAI est également considéré par de nombreux professionnels du secteur comme l'un des événements de fuite des cerveaux les plus importants pour Google ces dernières années.

03. La bataille des talents d'OpenAI continue de s'intensifier

Le contexte de l'arrivée de Shazeer est celui d'une concurrence de plus en plus féroce pour les talents dans l'industrie de l'IA.

Au cours de l'année écoulée, la concurrence entre OpenAI et Anthropic n'a cessé de s'intensifier. Non seulement les deux parties rivalisent autour des capacités des modèles, mais elles se disputent également continuellement les chercheurs de premier plan et les ingénieurs clés.

Le Financial Times a rapporté qu'au sein d'OpenAI, l'arrivée de Shazeer est considérée comme un renforcement important. À l'avenir, il se concentrera principalement sur la recherche de nouvelles orientations architecturales post-Transformer, ainsi que sur les moyens d'améliorer davantage les capacités des modèles.

Il est à noter que le Transformer règne sur le domaine de l'IA depuis près de dix ans. Avec le développement des modèles de raisonnement, des systèmes multi-agents et des modèles du monde, de plus en plus de chercheurs commencent à se demander : le Transformer connaîtra-t-il sa prochaine mise à niveau architecturale majeure ?

Et Shazeer est justement l'une des personnes les plus qualifiées pour répondre à cette question.

Pour Google, cela signifie perdre un auteur du Transformer, le codirigeant de Gemini et l'un de ses concepteurs d'architecture IA les plus expérimentés. Pour OpenAI, son laboratoire accueille quelqu'un qui a personnellement façonné la pile technologique de l'IA moderne.

04. Conclusion : Un mouvement de talents important à l'ère du Transformer

À mesure que la technologie approche des frontières de la recherche, les chercheurs de premier plan deviennent eux-mêmes l'une des ressources les plus rares. La trajectoire professionnelle de Noam Shazeer relie presque quatre nœuds importants : Transformer, Character.AI, Gemini et OpenAI.

Aujourd'hui, le départ de cet auteur du Transformer de Google pour rejoindre OpenAI est à la fois un mouvement de talents et le reflet de la concurrence de plus en plus intense entre les géants de l'IA actuels.

Particulièrement à un moment où OpenAI et Anthropic sont engagés dans une concurrence acharnée autour de la prochaine génération de modèles, du marché des entreprises et des chercheurs de premier plan, et où Google poursuit sa course poursuite via Gemini, perdre un fondateur du Transformer et le codirigeant de Gemini représente sans aucun doute une perte non négligeable pour Google.

Pour l'ensemble du secteur, la question qui mérite d'être suivie à l'avenir est peut-être : lorsque l'auteur du Transformer se penche personnellement sur « l'architecture post-Transformer », vers où se dirigera la prochaine génération de modèles d'IA.

Cet article provient du compte WeChat officiel « 智东西 » (ID : zhidxcom), auteur : Jiang Yu, éditeur : Li Shuiqing.

Questions liées

QQui est Noam Shazeer et quel est son nouveau poste chez OpenAI ?

ANoam Shazeer est un chercheur renommé de Google DeepMind et co-responsable de Gemini. Il a officiellement rejoint OpenAI en tant que Lead for Architecture Research (Responsable de la recherche en architecture), chargé d'explorer la prochaine génération d'architectures de modèles d'IA et de faire progresser l'architecture Transformer.

QPourquoi Noam Shazeer est-il considéré comme une figure légendaire dans le domaine de l'IA ?

ANoam Shazeer est considéré comme une figure légendaire car il est l'un des auteurs principaux du célèbre article de 2017 'Attention Is All You Need', qui a introduit l'architecture Transformer. Cette architecture constitue la base technique des modèles de langage modernes comme GPT, Gemini et Claude.

QQuelle était la relation précédente entre Noam Shazeer et Google avant son départ pour OpenAI ?

AAvant de rejoindre OpenAI, Noam Shazeer avait travaillé chez Google pendant près de 18 ans. En 2021, il a quitté Google pour co-fonder Character.AI. En 2024, Google a racheté son équipe pour environ 27 milliards de dollars et l'a réintégré au sein de DeepMind en tant que co-responsable de Gemini.

QPourquoi le départ de Shazeer vers OpenAI est-il considéré comme une perte significative pour Google ?

ALe départ de Shazeer est considéré comme une perte significative pour Google car il perd non seulement l'un des pères de l'architecture Transformer, mais aussi un leader technique clé et co-responsable du projet phare Gemini, dans un contexte de concurrence intense avec OpenAI et Anthropic.

QQuel sera le principal axe de recherche de Noam Shazeer chez OpenAI selon l'article ?

ASelon l'article, chez OpenAI, Noam Shazeer se concentrera principalement sur la recherche de nouvelles architectures succédant au Transformer et sur les moyens d'améliorer davantage les capacités des modèles d'IA, explorant ainsi l'évolution future des fondements de l'IA.

Lectures associées

La dure réalité de la FDV de 535 millions de dollars de CARDS : revenus nets de seulement 43 millions, marge bénéficiaire divisée par deux

Le projet Collector Crypt (CC), présenté comme une plateforme de cartes à collectionner tokenisées, génère en réalité l'essentiel de son volume (6,35 milliards de dollars) via un mécanisme de « gacha » à recyclage ultra-rapide. 90,6% des dépenses des utilisateurs sont immédiatement remboursées via un rachat automatique des cartes, ne laissant qu'un revenu net de 43 millions de dollars (taux de rétention de 6,7%). L'activité est extrêmement concentrée sur quelques dizaines de portefeuilles actifs, avec seulement environ 420 joueurs quotidiens. Le marché des collectionneurs, censé justifier le modèle, est quasi inexistant : les transactions secondaires et les ventes sur eBay représentent moins de 1% du volume et sont en déclin constant depuis six trimestres. La rentabilité nette du protocole a été divisée par deux, passant de 11,2% à 5,8%, à mesure que le volume se concentre sur les packs de cartes haut de gamme. La capture de valeur pour le jeton CARDS est faible : seulement 1,4 million de dollars (brûlages et rachats), soit 3,4% des revenus nets. Dans le même temps, les portefeuilles opérationnels liés à la plateforme ont retiré 45,7 millions de dollars USDC. Avec une valorisation fully diluted (FDV) d'environ 535 millions de dollars, soit 7,3 fois ses revenus nets annuels, et 72% des jetons détenus par des initiés et bloqués jusqu'en novembre 2027, le modèle économique et la valorisation du jeton apparaissent très fragiles.

Foresight NewsIl y a 10 mins

La dure réalité de la FDV de 535 millions de dollars de CARDS : revenus nets de seulement 43 millions, marge bénéficiaire divisée par deux

Foresight NewsIl y a 10 mins

La Mise À Jour Cardano Van Rossem Se Rapproche Du Mainnet Alors Que La Phase De Gouvernance Avance

La mise à niveau Van Rossem de Cardano progresse vers sa phase finale de gouvernance et de validation, selon les dernières mises à jour d'Intersect. Ce hard fork, testé avec succès sur le testnet PreProd, représente la première mise à œuvre majeure du modèle de gouvernance on-chain post-Voltaire du réseau, impliquant opérateurs de stake pools, échanges et autres parties prenantes. Les traders d'ADA suivent de près ce déploiement, car une exécution fluide pourrait renforcer la confiance dans la feuille de route de Cardano, tandis que des complications pourraient peser sur le sentiment dans un marché déjà ralenti. L'accent est désormais mis sur la préparation du mainnet et la clarté de la communication de l'écosystème. Bien que le succès technique soit crucial, la réaction du prix de l'ADA dépendra également des conditions du marché global. Pour Cardano, le meilleur scénario serait une exécution « ennuyeuse » et sans heurts, démontrant la solidité de son processus de gouvernance décentralisée.

bitcoinistIl y a 20 mins

La Mise À Jour Cardano Van Rossem Se Rapproche Du Mainnet Alors Que La Phase De Gouvernance Avance

bitcoinistIl y a 20 mins

BitTorrent lance BTTInferGrid : la couche d'infrastructure décentralisée pour l'inférence IA évolutive

BitTorrent annonce le lancement stratégique de **BTTInferGrid**, une infrastructure de calcul décentralisée conçue spécifiquement pour l'inférence IA. Cette plateforme agrège des ressources GPU fragmentées et sous-utilisées dans le monde entier pour créer un réseau accessible, évolutif et fonctionnant sur un modèle de paiement à l'utilisation. Le marché de l'inférence IA, qui représente une part croissante et majoritaire des coûts de calcul (jusqu'à 95% pour les LLM), est confronté à des défis majeurs : une infrastructure centralisée rigide, des prix prohibitifs pour l'accès aux GPU et une inadéquation entre l'offre et la demande. BTTInferGrid propose une solution en établissant un corridor direct entre les développeurs d'IA et la puissance de calcul inutilisée grâce à une architecture DePIN (Physical Infrastructure Network décentralisé). Côté offre, le réseau permet aux détenteurs de GPU inactifs de les monétiser. Côté demande, il offre aux développeurs un accès à une capacité d'inférence vérifiable sur la blockchain et économique. BTTInferGrid s'appuie sur trois piliers : un accès sans autorisation pour agréger rapidement les ressources, une exécution vérifiable et digne de confiance, ainsi qu'une économie durable ancrée sur la demande réelle. Bâti sur l'expérience éprouvée de BitTorrent et de son système de fichiers BTFS, BTTInferGrid suivra une feuille de route en plusieurs phases, visant à devenir une couche d'infrastructure fondamentale pour l'IA décentralisée, combinant à terme calcul, stockage et contrats intelligents.

TheNewsCryptoIl y a 48 mins

BitTorrent lance BTTInferGrid : la couche d'infrastructure décentralisée pour l'inférence IA évolutive

TheNewsCryptoIl y a 48 mins

Rendement annuel de 15% à 25% : l'ETF de revenus Bitcoin de BlackRock est-il une opportunité ou un piège ?

Le géant mondial de la gestion d'actifs BlackRock a lancé un ETF à revenus Bitcoin (BITA) en juin, visant un rendement annuel de 15 à 25 %. Ce produit génère des revenus en vendant des options call couvertes sur son ETF Bitcoin spot (IBIT), tout en sacrifiant une partie des gains potentiels en cas de forte hausse du bitcoin. Les partisans y voient une opportunité de convertir l'épargne à rendement en nouvelle demande pour le bitcoin, notant des entrées nettes continues dans IBIT. Des investisseurs expérimentés soulignent le cycle quadriennal du bitcoin et sa rareté croissante, avec des objectifs de prix à long terme très élevés. Cependant, les critiques mettent en garde contre un "piège à rendement". Ils affirment que le produit ne crée pas de nouvelle demande nette de bitcoin, limite les gains à la hausse tout en exposant pleinement aux baisses, et pourrait à terme nuire à l'écosystème crypto en concentrant la propriété dans des ETF plutôt que dans des portefeuilles privés. L'impact sur le prix du bitcoin dépendra de savoir si BITA attire de nouveaux capitaux ou détourne simplement les fonds des ETF spot existants.

Foresight NewsIl y a 49 mins

Rendement annuel de 15% à 25% : l'ETF de revenus Bitcoin de BlackRock est-il une opportunité ou un piège ?

Foresight NewsIl y a 49 mins

Gate 研究院 : Analyse des configurations graphiques et stratégie de trading par breakout

**Gate Research : Analyse des figures graphiques et stratégie de trading par breakout** Les figures graphiques sont des outils clés de l'analyse technique pour observer les changements d'offre et de demande, ainsi que la continuation ou l'inversion des tendances. L'analyse repose sur une évaluation globale de la tendance, des volumes, des supports/résistances, de la durée et de la validité du breakout, et non sur une simple mémorisation de formes. On distingue principalement les figures de **retournement** (double top/double bottom, tête et épaules) et les figures de **continuation** (drapeau, triangle, rectangle). Un breakout valide nécessite généralement un support/résistance clair, une phase de consolidation prolongée, un contexte de tendance et une confirmation par les volumes. La stratégie de trading par breakout consiste à entrer en position lors de la rupture d'un niveau clé. Il est crucial de différencier les **breakouts valides** (avec forte impulsion et volumes), les **breakouts avec retest** (retour au niveau cassé pour confirmation) et les **faux breakouts** (fréquents, nécessitant une gestion stricte du risque). Les conditions d'une rupture valide incluent une clôture franche au-delà du niveau, une expansion des volumes et l'absence de retour immédiat dans l'ancienne fourchette. La gestion des risques est primordiale. Elle passe par un positionnement adapté, des **ordres de stop-loss** placés de manière judicieuse (par exemple sous le niveau de breakout), une confirmation éventuelle par retest et une prise de bénéfices échelonnée. Des indicateurs comme les **volumes**, l'**ATR**, les **moyennes mobiles** ou les **bandes de Bollinger** peuvent aider à valider la dynamique d'un breakout. En conclusion, les figures et le trading par breakout offrent un cadre d'analyse structuré, mais leur efficacité dépend de la convergence de plusieurs facteurs. Une approche robuste intègre l'identification des figures, la confirmation du signal, et une gestion rigoureuse du capital via le stop-loss et la prise de bénéfices.

marsbitIl y a 1 h

Trading

Spot

Futures