L’information du 19 juin – Aujourd’hui, Noam Shazeer, chercheur chez Google DeepMind et codirigeant de Gemini, a officiellement rejoint OpenAI. Il y occupera le poste de responsable de la recherche en architecture (Lead for Architecture Research), chargé d'explorer les nouvelles architectures de modèles d'IA et de faire évoluer l'architecture Transformer.
Shazeer a lui-même annoncé son arrivée chez OpenAI sur la plateforme de médias sociaux X. Il a déclaré : « Je suis ravi de rejoindre OpenAI et j'ai hâte de travailler avec l'équipe exceptionnelle qui s'y trouve. »
Dans le même temps, il a exprimé sa gratitude envers l'équipe de Google : « Partir a été une décision difficile. Je suis extrêmement fier de l'équipe de Google et de tout ce que nous avons accompli ensemble. Ce fut un honneur de travailler avec vous. » Un porte-parole de Google a quant à lui déclaré à Reuters que l'entreprise remerciait Shazeer pour ses importantes contributions au fil des années et lui souhaitait le meilleur pour l'avenir.
Noam Shazeer est l'une des figures légendaires du domaine de l'IA. Il est l'un des auteurs principaux du célèbre article de 2017 « Attention Is All You Need », qui a introduit pour la première fois l'architecture Transformer, jetant ainsi les bases techniques des modèles modernes de grande envergure tels que la série GPT, Gemini, Claude, etc.
« Attention Is All You Need »
Avant de rejoindre OpenAI, Shazeer avait quitté Google en 2021 pour fonder Character.AI. Son rôle le plus connu est en réalité celui de cofondateur et PDG de Character.AI.
Cette entreprise a parié sur le créneau de « l'accompagnement par IA » (AI companionship) plus tôt que l'explosion de ChatGPT, permettant aux utilisateurs d'avoir des conversations durables avec divers personnages IA, devenant ainsi l'une des applications d'IA grand public à la croissance la plus rapide au monde. En 2023, la valorisation de Character.AI avait dépassé 1 milliard de dollars (environ 67,65 milliards de yuans).
En 2024, Google et Character.AI ont conclu un accord de licence technologique d'une valeur d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), réintégrant Noam Shazeer et une partie de l'équipe principale au sein de DeepMind et nommant Noam Shazeer codirigeant de Gemini, participant au développement du pré-entraînement de la nouvelle génération de modèles Gemini.
Pour OpenAI, qui est en concurrence féroce avec Anthropic, cela est considéré par les observateurs comme l'un des recrutements de talents de premier plan les plus importants de ces dernières années. Après l'annonce, la direction d'OpenAI et plusieurs chercheurs renommés ont immédiatement posté des messages de bienvenue sur X.
Mark Chen, directeur de la recherche chez OpenAI, a écrit : « Je suis très heureux d'accueillir Noam Shazeer chez OpenAI en tant que responsable de la recherche en architecture. Ses travaux sur le Transformer, le MoE et le décodage efficace ont façonné l'IA moderne. »
Ensuite, plusieurs chercheurs en IA ont également présenté leurs félicitations dans les commentaires, notamment Yuchen Zhuang, chercheur chez Google DeepMind et membre de l'équipe Gemini Thinking & Coding, Noam Brown, chercheur chez OpenAI et contributeur clé des modèles de raisonnement de la série o, ainsi que l'ancien vice-président IA de Microsoft et actuel chercheur chez OpenAI, Sebastien Bubeck.
Yuchen Zhuang, chercheur chez Google DeepMind
Noam Brown, contributeur clé des modèles de raisonnement de la série o chez OpenAI
Sebastien Bubeck, chercheur chez OpenAI
Parallèlement, certains internautes ont commenté : « Perdre un auteur du Transformer et le codirigeant de Gemini est sans aucun doute un coup dur pour Google. »
01. Auteur renommé du Transformer, près de 18 ans chez Google
Si l'on regarde l'histoire de l'IA générative, Noam Shazeer a participé à presque tous les moments clés. Il a rejoint Google en 2000, occupant successivement les postes d'ingénieur logiciel et d'ingénieur logiciel principal, pour un total de plus de 18 ans de travail.
Parcours professionnel et éducatif de Noam Shazeer (Source : LinkedIn)
En 2017, avec huit autres chercheurs de Google, dont Ashish Vaswani et Jakob Uszkoreit, il a publié l'article fondateur « Attention Is All You Need », proposant l'architecture Transformer. Comparé aux modèles RNN et LSTM qui prédominaient auparavant, le Transformer pouvait traiter plus efficacement les longs textes et possédait une plus grande capacité d'extension.
Ces dernières années, que ce soit la série GPT d'OpenAI, Gemini de Google, Claude d'Anthropic, ou encore DeepSeek, Llama, etc., leurs fondations reposent presque toutes sur l'architecture Transformer. En d'autres termes, la vague actuelle des grands modèles qui balaie le monde est largement construite sur les bases techniques établies par cet article.
Cependant, le Transformer n'est qu'une des nombreuses contributions majeures de Noam Shazeer.
Pendant son mandat chez Google, il a également participé à la promotion de plusieurs technologies de grands modèles ayant une influence profonde. En 2017, en tant que premier auteur, il a proposé l'architecture de Mélange d'Experts à portes éparses (MoE), fournissant une piste technologique importante pour les modèles ultérieurs tels que GPT-4, Gemini, DeepSeek-V3, etc. ; en 2018, il a participé au développement de Mesh TensorFlow, fournissant un outil de base pour l'entraînement de Transformers à très grande échelle ; par la suite, il a également participé au développement de plusieurs projets clés tels que le modèle T5 et le modèle de dialogue de Google, LaMDA.
02. Départ de Google pour entreprendre, puis racheté pour 18,2 milliards de dollars
En 2021, Shazeer a quitté Google et a cofondé Character.AI avec Daniel De Freitas.
À l'époque, les grands modèles de langage n'avaient pas encore connu leur moment « ChatGPT », mais Character.AI avait déjà été l'un des premiers à tenter de commercialiser un produit de chatbot auprès du grand public, accumulant rapidement un grand nombre d'utilisateurs.
En 2024, Google, via un accord de partenariat d'environ 2,7 milliards de dollars (environ 18,266 milliards de yuans), a réintégré Shazeer et son équipe principale dans l'écosystème DeepMind. Par la suite, il est devenu l'un des responsables importants du projet Gemini et a participé aux travaux de pré-entraînement de la nouvelle génération de modèles Gemini.
Le moment du retour de Shazeer coïncidait avec une période de grande pression pour les activités d'IA de Google. ChatGPT venait de connaître un succès fulgurant, et Gemini était encore en phase de rattrapage. Après son retour chez DeepMind, Shazeer a participé au développement des modèles et a finalement été nommé codirigeant de Gemini, devenant l'une des figures de proue technologique de l'IA chez Google.
Par la suite, la série de modèles Gemini 3 s'est classée parmi les premiers de l'industrie dans plusieurs benchmarks de programmation et de raisonnement, devenant un atout important pour Google dans sa concurrence avec OpenAI et Anthropic.
Du chercheur de Google, à l'entrepreneur, puis au codirigeant de Gemini, Shazeer a été témoin de presque tous les tournants importants du développement de l'IA chez Google au cours de la dernière décennie. Par conséquent, son départ de Google pour rejoindre OpenAI est également considéré par de nombreux professionnels du secteur comme l'un des événements de fuite des cerveaux les plus importants pour Google ces dernières années.
03. La bataille des talents d'OpenAI continue de s'intensifier
Le contexte de l'arrivée de Shazeer est celui d'une concurrence de plus en plus féroce pour les talents dans l'industrie de l'IA.
Au cours de l'année écoulée, la concurrence entre OpenAI et Anthropic n'a cessé de s'intensifier. Non seulement les deux parties rivalisent autour des capacités des modèles, mais elles se disputent également continuellement les chercheurs de premier plan et les ingénieurs clés.
Le Financial Times a rapporté qu'au sein d'OpenAI, l'arrivée de Shazeer est considérée comme un renforcement important. À l'avenir, il se concentrera principalement sur la recherche de nouvelles orientations architecturales post-Transformer, ainsi que sur les moyens d'améliorer davantage les capacités des modèles.
Il est à noter que le Transformer règne sur le domaine de l'IA depuis près de dix ans. Avec le développement des modèles de raisonnement, des systèmes multi-agents et des modèles du monde, de plus en plus de chercheurs commencent à se demander : le Transformer connaîtra-t-il sa prochaine mise à niveau architecturale majeure ?
Et Shazeer est justement l'une des personnes les plus qualifiées pour répondre à cette question.
Pour Google, cela signifie perdre un auteur du Transformer, le codirigeant de Gemini et l'un de ses concepteurs d'architecture IA les plus expérimentés. Pour OpenAI, son laboratoire accueille quelqu'un qui a personnellement façonné la pile technologique de l'IA moderne.
04. Conclusion : Un mouvement de talents important à l'ère du Transformer
À mesure que la technologie approche des frontières de la recherche, les chercheurs de premier plan deviennent eux-mêmes l'une des ressources les plus rares. La trajectoire professionnelle de Noam Shazeer relie presque quatre nœuds importants : Transformer, Character.AI, Gemini et OpenAI.
Aujourd'hui, le départ de cet auteur du Transformer de Google pour rejoindre OpenAI est à la fois un mouvement de talents et le reflet de la concurrence de plus en plus intense entre les géants de l'IA actuels.
Particulièrement à un moment où OpenAI et Anthropic sont engagés dans une concurrence acharnée autour de la prochaine génération de modèles, du marché des entreprises et des chercheurs de premier plan, et où Google poursuit sa course poursuite via Gemini, perdre un fondateur du Transformer et le codirigeant de Gemini représente sans aucun doute une perte non négligeable pour Google.
Pour l'ensemble du secteur, la question qui mérite d'être suivie à l'avenir est peut-être : lorsque l'auteur du Transformer se penche personnellement sur « l'architecture post-Transformer », vers où se dirigera la prochaine génération de modèles d'IA.
Cet article provient du compte WeChat officiel « 智东西 » (ID : zhidxcom), auteur : Jiang Yu, éditeur : Li Shuiqing.













