ZHIDONGXI, 19 de junio – Noticia de última hora, hoy, el investigador de DeepMind de Google y codirector de Gemini, Noam Shazeer, se ha unido oficialmente a OpenAI, donde ocupará el cargo de Responsable de Investigación en Arquitectura (Lead for Architecture Research), encargado de explorar la nueva generación de arquitecturas de modelos de IA y promover la evolución de la arquitectura Transformer.
El propio Shazeer anunció su incorporación a OpenAI en un mensaje publicado en la plataforma social internacional X, diciendo: "Estoy encantado de unirme a OpenAI y ansío trabajar con el excelente equipo que hay aquí."
Al mismo tiempo, expresó su agradecimiento al equipo de Google: "Fue una decisión difícil. Estoy increíblemente orgulloso del equipo de Google y de todo lo que hemos logrado juntos. Ha sido un honor trabajar con vosotros". Un portavoz de Google respondió a Reuters diciendo que la empresa agradece las importantes contribuciones de Shazeer durante muchos años y le desea lo mejor en el futuro.
Noam Shazeer es una de las figuras legendarias en el campo de la IA. Es uno de los autores principales del artículo clásico de 2017 "Attention Is All You Need", que propuso por primera vez la arquitectura Transformer, sentando directamente la base técnica para modelos modernos de gran lenguaje como la serie GPT, Gemini, Claude, entre otros.
"Attention Is All You Need"
Antes de unirse a OpenAI, Shazeer dejó Google en 2021 para fundar Character.AI. La identidad más conocida de Shazeer es en realidad la de cofundador y CEO de Character.AI.
Esta empresa apostó por el nicho del "acompañamiento con IA" incluso antes de la explosión de ChatGPT, permitiendo a los usuarios mantener conversaciones a largo plazo con diversos personajes de IA, y llegó a ser una de las aplicaciones de IA de consumo de más rápido crecimiento a nivel mundial. En 2023, la valoración de Character.AI superó los 10.000 millones de dólares (aproximadamente 67.650 millones de RMB).
En 2024, Google llegó a un acuerdo de licencia tecnológica con Character.AI valorado en unos 27.000 millones de dólares (aproximadamente 182.660 millones de RMB), reincorporando a Noam Shazeer y parte de su equipo central a DeepMind, y nombrando a Noam Shazeer codirector de Gemini, participando en el desarrollo del preentrenamiento de la nueva generación de modelos Gemini.
Para OpenAI, que está inmerso en una feroz competencia con Anthropic, esto es visto externamente como la incorporación de talento de primer nivel más importante en los últimos años. Tras el anuncio, los altos cargos de OpenAI y varios investigadores destacados dejaron mensajes de bienvenida de inmediato en X.
El Director de Investigación de OpenAI, Mark Chen, publicó: "Estoy muy contento de dar la bienvenida a Noam Shazeer a OpenAI como Responsable de Investigación en Arquitectura. Su trabajo en Transformer, MoE y decodificación eficiente ha dado forma a la IA moderna".
Posteriormente, varios investigadores de IA también dejaron sus felicitaciones en los comentarios, incluyendo a Yuchen Zhuang, investigador de Google DeepMind y miembro chino de los equipos de Pensamiento y Codificación de Gemini; Noam Brown, investigador de OpenAI y contribuyente clave a la serie o de modelos de razonamiento; y el ex Vicepresidente de IA de Microsoft y actual investigador de OpenAI, Sebastien Bubeck, entre otros.
El investigador chino de Google DeepMind, Yuchen Zhuang
El contribuyente clave a la serie o de modelos de razonamiento de OpenAI, Noam Brown
El investigador de OpenAI, Sebastien Bubeck
Al mismo tiempo, algunos usuarios también expresaron su pesar: "Perder a un autor de Transformer y codirector de Gemini es sin duda un duro golpe para Google".
01. Reconocido autor de Transformer, trabajó en Google durante casi 18 años
Si observamos la historia del desarrollo de la IA generativa, Noam Shazeer ha participado en casi todos los momentos clave. Se unió a Google en el año 2000, ejerciendo como ingeniero de software e ingeniero jefe de software, acumulando más de 18 años de trabajo.
Experiencia laboral y educativa de Noam Shazeer (Fuente: LinkedIn)
En 2017, junto con otros 8 investigadores de Google, Ashish Vaswani, Jakob Uszkoreit y otros, publicó el artículo clásico "Attention Is All You Need", proponiendo la arquitectura Transformer. En comparación con los modelos RNN y LSTM predominantes en ese momento, Transformer podía procesar textos largos de manera más eficiente y tenía una mayor capacidad de escalabilidad.
En los últimos años, ya sea la serie GPT de OpenAI, Gemini de Google, Anthropic Claude, o modelos como DeepSeek y Llama, sus fundamentos se basan casi todos en la arquitectura Transformer. En otras palabras, la actual ola de grandes modelos que está arrasando el mundo se basa en gran medida en los cimientos técnicos establecidos por este artículo.
Sin embargo, Transformer es solo uno de los muchos trabajos representativos de Noam Shazeer.
Durante su tiempo en Google, también impulsó múltiples tecnologías de grandes modelos de gran impacto. En 2017, como primer autor, propuso la arquitectura Mixta de Expertos (MoE) con puertas dispersas, proporcionando ideas técnicas importantes para modelos posteriores como GPT-4, Gemini, DeepSeek-V3, etc.; en 2018, participó en el desarrollo de Mesh TensorFlow, proporcionando herramientas fundamentales para el entrenamiento de Transformers a gran escala; posteriormente, también participó en el desarrollo de múltiples proyectos clave como el modelo T5 y el modelo de diálogo LaMDA de Google.
02. Dejó Google para emprender, y fue recomprado por 18.200 millones
En 2021, Shazeer dejó Google y, junto con Daniel De Freitas, fundó Character.AI.
En ese momento, los modelos de lenguaje de gran tamaño aún no habían vivido su momento ChatGPT, pero Character.AI ya había intentado llevar productos de chatbot al mercado masivo, acumulando rápidamente una gran cantidad de usuarios.
En 2024, Google, a través de un acuerdo de colaboración de aproximadamente 27.000 millones de dólares (unos 182.660 millones de RMB), reincorporó a Shazeer y su equipo central al ecosistema de DeepMind. Posteriormente, se convirtió en uno de los responsables clave del proyecto Gemini, participando en el trabajo de preentrenamiento de la nueva generación de modelos Gemini.
El momento del regreso de Shazeer coincidió con un período de gran presión para el negocio de IA de Google. En ese momento, ChatGPT era un éxito viral y Gemini todavía estaba en fase de seguimiento. Tras su regreso a DeepMind, Shazeer participó en el desarrollo de modelos y finalmente asumió el cargo de codirector de Gemini, convirtiéndose en una de las figuras líderes en tecnología de IA de Google.
Posteriormente, la serie Gemini 3 se situó a la cabeza de la industria en múltiples pruebas de referencia, como programación y razonamiento, convirtiéndose en una baza importante para la competencia de Google con OpenAI y Anthropic.
Desde investigador de Google, a emprendedor, y luego a codirector de Gemini, Shazeer ha sido testigo de casi todos los giros importantes en el desarrollo de la IA de Google en la última década. Por lo tanto, su partida de Google para unirse a OpenAI es vista por muchos en la industria como uno de los eventos de fuga de talento más importantes para Google en los últimos años.
03. La guerra por el talento de OpenAI sigue intensificándose
El trasfondo de la incorporación de Shazeer es la competencia cada vez más feroz por el talento en la industria de la IA.
Durante el último año, la competencia entre OpenAI y Anthropic ha continuado calentándose. Ambas partes no solo compiten en capacidades de modelos, sino que también luchan constantemente por investigadores principales e ingenieros clave.
Según informó el Financial Times, dentro de OpenAI, la incorporación de Shazeer es vista como un refuerzo importante. En el futuro, se centrará en investigar nuevas direcciones arquitectónicas posteriores a Transformer, y en cómo mejorar aún más las capacidades de los modelos.
Vale la pena señalar que Transformer ha dominado el campo de la IA durante casi diez años. Con el desarrollo de modelos de razonamiento, sistemas multiagente y modelos mundiales, cada vez más investigadores comienzan a preguntarse: ¿Experimentará Transformer una próxima gran actualización arquitectónica?
Y Shazeer es precisamente una de las personas más cualificadas para responder a esta pregunta.
Para Google, esto significa perder a un autor de Transformer, codirector de Gemini y uno de sus arquitectos de IA más experimentados. Para OpenAI, su laboratorio recibe a alguien que moldeó personalmente la pila tecnológica de la IA moderna.
04. Conclusión: Un importante flujo de talento en la era Transformer
A medida que la tecnología se acerca gradualmente a la frontera del conocimiento, los investigadores de primer nivel se convierten en uno de los recursos más escasos. La trayectoria profesional de Noam Shazeer conecta casi cuatro nodos importantes: Transformer, Character.AI, Gemini y OpenAI.
Hoy, que este autor de Transformer deje Google y se una a OpenAI es tanto un flujo de talento como un reflejo de la intensa competencia entre los gigantes de la IA en la actualidad.
Especialmente en el contexto de la competencia feroz entre OpenAI y Anthropic por la próxima generación de modelos, el mercado empresarial y el talento investigador de primer nivel, mientras Google también persigue a través de Gemini, perder en este momento a un fundador de Transformer y codirector de Gemini supone sin duda una pérdida considerable para Google.
Para toda la industria, la pregunta que merece atención a continuación es: cuando el autor de Transformer investiga personalmente "la arquitectura posterior a Transformer", hacia dónde se dirigirá la próxima generación de modelos de IA.
Este artículo proviene del WeChat público "智东西" (ID:zhidxcom), autor: Jiang Yu, editor: Li Shuiqing.













