Sorpresa, el codirector de Gemini de Google ha sido reclutado por OpenAI

marsbitPublicado a 2026-06-18Actualizado a 2026-06-18

Resumen

Noam Shazeer, investigador de DeepMind y codirector de Gemini en Google, se ha unido a OpenAI como Líder de Investigación en Arquitectura. Shazeer es coautor del influyente artículo "Attention Is All You Need", que introdujo la arquitectura Transformer, base de modelos actuales como GPT, Gemini y Claude. Tras dejar Google en 2021 para fundar Character.AI, fue recuperado por la empresa en 2024 con un acuerdo clave para liderar Gemini. Su salida supone una pérdida significativa para Google, mientras que OpenAI fortalece su búsqueda de la próxima generación de arquitecturas de IA más allá del Transformer. Este movimiento refleja la intensa competencia por el talento en la industria de la inteligencia artificial.

ZHIDONGXI, 19 de junio – Noticia de última hora, hoy, el investigador de DeepMind de Google y codirector de Gemini, Noam Shazeer, se ha unido oficialmente a OpenAI, donde ocupará el cargo de Responsable de Investigación en Arquitectura (Lead for Architecture Research), encargado de explorar la nueva generación de arquitecturas de modelos de IA y promover la evolución de la arquitectura Transformer.

El propio Shazeer anunció su incorporación a OpenAI en un mensaje publicado en la plataforma social internacional X, diciendo: "Estoy encantado de unirme a OpenAI y ansío trabajar con el excelente equipo que hay aquí."

Al mismo tiempo, expresó su agradecimiento al equipo de Google: "Fue una decisión difícil. Estoy increíblemente orgulloso del equipo de Google y de todo lo que hemos logrado juntos. Ha sido un honor trabajar con vosotros". Un portavoz de Google respondió a Reuters diciendo que la empresa agradece las importantes contribuciones de Shazeer durante muchos años y le desea lo mejor en el futuro.

Noam Shazeer es una de las figuras legendarias en el campo de la IA. Es uno de los autores principales del artículo clásico de 2017 "Attention Is All You Need", que propuso por primera vez la arquitectura Transformer, sentando directamente la base técnica para modelos modernos de gran lenguaje como la serie GPT, Gemini, Claude, entre otros.

"Attention Is All You Need"

Antes de unirse a OpenAI, Shazeer dejó Google en 2021 para fundar Character.AI. La identidad más conocida de Shazeer es en realidad la de cofundador y CEO de Character.AI.

Esta empresa apostó por el nicho del "acompañamiento con IA" incluso antes de la explosión de ChatGPT, permitiendo a los usuarios mantener conversaciones a largo plazo con diversos personajes de IA, y llegó a ser una de las aplicaciones de IA de consumo de más rápido crecimiento a nivel mundial. En 2023, la valoración de Character.AI superó los 10.000 millones de dólares (aproximadamente 67.650 millones de RMB).

En 2024, Google llegó a un acuerdo de licencia tecnológica con Character.AI valorado en unos 27.000 millones de dólares (aproximadamente 182.660 millones de RMB), reincorporando a Noam Shazeer y parte de su equipo central a DeepMind, y nombrando a Noam Shazeer codirector de Gemini, participando en el desarrollo del preentrenamiento de la nueva generación de modelos Gemini.

Para OpenAI, que está inmerso en una feroz competencia con Anthropic, esto es visto externamente como la incorporación de talento de primer nivel más importante en los últimos años. Tras el anuncio, los altos cargos de OpenAI y varios investigadores destacados dejaron mensajes de bienvenida de inmediato en X.

El Director de Investigación de OpenAI, Mark Chen, publicó: "Estoy muy contento de dar la bienvenida a Noam Shazeer a OpenAI como Responsable de Investigación en Arquitectura. Su trabajo en Transformer, MoE y decodificación eficiente ha dado forma a la IA moderna".

Posteriormente, varios investigadores de IA también dejaron sus felicitaciones en los comentarios, incluyendo a Yuchen Zhuang, investigador de Google DeepMind y miembro chino de los equipos de Pensamiento y Codificación de Gemini; Noam Brown, investigador de OpenAI y contribuyente clave a la serie o de modelos de razonamiento; y el ex Vicepresidente de IA de Microsoft y actual investigador de OpenAI, Sebastien Bubeck, entre otros.

El investigador chino de Google DeepMind, Yuchen Zhuang

El contribuyente clave a la serie o de modelos de razonamiento de OpenAI, Noam Brown

El investigador de OpenAI, Sebastien Bubeck

Al mismo tiempo, algunos usuarios también expresaron su pesar: "Perder a un autor de Transformer y codirector de Gemini es sin duda un duro golpe para Google".

01. Reconocido autor de Transformer, trabajó en Google durante casi 18 años

Si observamos la historia del desarrollo de la IA generativa, Noam Shazeer ha participado en casi todos los momentos clave. Se unió a Google en el año 2000, ejerciendo como ingeniero de software e ingeniero jefe de software, acumulando más de 18 años de trabajo.

Experiencia laboral y educativa de Noam Shazeer (Fuente: LinkedIn)

En 2017, junto con otros 8 investigadores de Google, Ashish Vaswani, Jakob Uszkoreit y otros, publicó el artículo clásico "Attention Is All You Need", proponiendo la arquitectura Transformer. En comparación con los modelos RNN y LSTM predominantes en ese momento, Transformer podía procesar textos largos de manera más eficiente y tenía una mayor capacidad de escalabilidad.

En los últimos años, ya sea la serie GPT de OpenAI, Gemini de Google, Anthropic Claude, o modelos como DeepSeek y Llama, sus fundamentos se basan casi todos en la arquitectura Transformer. En otras palabras, la actual ola de grandes modelos que está arrasando el mundo se basa en gran medida en los cimientos técnicos establecidos por este artículo.

Sin embargo, Transformer es solo uno de los muchos trabajos representativos de Noam Shazeer.

Durante su tiempo en Google, también impulsó múltiples tecnologías de grandes modelos de gran impacto. En 2017, como primer autor, propuso la arquitectura Mixta de Expertos (MoE) con puertas dispersas, proporcionando ideas técnicas importantes para modelos posteriores como GPT-4, Gemini, DeepSeek-V3, etc.; en 2018, participó en el desarrollo de Mesh TensorFlow, proporcionando herramientas fundamentales para el entrenamiento de Transformers a gran escala; posteriormente, también participó en el desarrollo de múltiples proyectos clave como el modelo T5 y el modelo de diálogo LaMDA de Google.

02. Dejó Google para emprender, y fue recomprado por 18.200 millones

En 2021, Shazeer dejó Google y, junto con Daniel De Freitas, fundó Character.AI.

En ese momento, los modelos de lenguaje de gran tamaño aún no habían vivido su momento ChatGPT, pero Character.AI ya había intentado llevar productos de chatbot al mercado masivo, acumulando rápidamente una gran cantidad de usuarios.

En 2024, Google, a través de un acuerdo de colaboración de aproximadamente 27.000 millones de dólares (unos 182.660 millones de RMB), reincorporó a Shazeer y su equipo central al ecosistema de DeepMind. Posteriormente, se convirtió en uno de los responsables clave del proyecto Gemini, participando en el trabajo de preentrenamiento de la nueva generación de modelos Gemini.

El momento del regreso de Shazeer coincidió con un período de gran presión para el negocio de IA de Google. En ese momento, ChatGPT era un éxito viral y Gemini todavía estaba en fase de seguimiento. Tras su regreso a DeepMind, Shazeer participó en el desarrollo de modelos y finalmente asumió el cargo de codirector de Gemini, convirtiéndose en una de las figuras líderes en tecnología de IA de Google.

Posteriormente, la serie Gemini 3 se situó a la cabeza de la industria en múltiples pruebas de referencia, como programación y razonamiento, convirtiéndose en una baza importante para la competencia de Google con OpenAI y Anthropic.

Desde investigador de Google, a emprendedor, y luego a codirector de Gemini, Shazeer ha sido testigo de casi todos los giros importantes en el desarrollo de la IA de Google en la última década. Por lo tanto, su partida de Google para unirse a OpenAI es vista por muchos en la industria como uno de los eventos de fuga de talento más importantes para Google en los últimos años.

03. La guerra por el talento de OpenAI sigue intensificándose

El trasfondo de la incorporación de Shazeer es la competencia cada vez más feroz por el talento en la industria de la IA.

Durante el último año, la competencia entre OpenAI y Anthropic ha continuado calentándose. Ambas partes no solo compiten en capacidades de modelos, sino que también luchan constantemente por investigadores principales e ingenieros clave.

Según informó el Financial Times, dentro de OpenAI, la incorporación de Shazeer es vista como un refuerzo importante. En el futuro, se centrará en investigar nuevas direcciones arquitectónicas posteriores a Transformer, y en cómo mejorar aún más las capacidades de los modelos.

Vale la pena señalar que Transformer ha dominado el campo de la IA durante casi diez años. Con el desarrollo de modelos de razonamiento, sistemas multiagente y modelos mundiales, cada vez más investigadores comienzan a preguntarse: ¿Experimentará Transformer una próxima gran actualización arquitectónica?

Y Shazeer es precisamente una de las personas más cualificadas para responder a esta pregunta.

Para Google, esto significa perder a un autor de Transformer, codirector de Gemini y uno de sus arquitectos de IA más experimentados. Para OpenAI, su laboratorio recibe a alguien que moldeó personalmente la pila tecnológica de la IA moderna.

04. Conclusión: Un importante flujo de talento en la era Transformer

A medida que la tecnología se acerca gradualmente a la frontera del conocimiento, los investigadores de primer nivel se convierten en uno de los recursos más escasos. La trayectoria profesional de Noam Shazeer conecta casi cuatro nodos importantes: Transformer, Character.AI, Gemini y OpenAI.

Hoy, que este autor de Transformer deje Google y se una a OpenAI es tanto un flujo de talento como un reflejo de la intensa competencia entre los gigantes de la IA en la actualidad.

Especialmente en el contexto de la competencia feroz entre OpenAI y Anthropic por la próxima generación de modelos, el mercado empresarial y el talento investigador de primer nivel, mientras Google también persigue a través de Gemini, perder en este momento a un fundador de Transformer y codirector de Gemini supone sin duda una pérdida considerable para Google.

Para toda la industria, la pregunta que merece atención a continuación es: cuando el autor de Transformer investiga personalmente "la arquitectura posterior a Transformer", hacia dónde se dirigirá la próxima generación de modelos de IA.

Este artículo proviene del WeChat público "智东西" (ID:zhidxcom), autor: Jiang Yu, editor: Li Shuiqing.

Preguntas relacionadas

Q¿Quién es Noam Shazeer y cuál es su nuevo cargo en OpenAI?

ANoam Shazeer es un investigador legendario en IA, coautor del artículo seminal 'Attention Is All You Need' que introdujo la arquitectura Transformer. Anteriormente fue co-director de Gemini en Google DeepMind y cofundador y CEO de Character.AI. Su nuevo cargo en OpenAI es 'Líder de Investigación en Arquitectura' (Lead for Architecture Research), donde será responsable de explorar nuevas arquitecturas de modelos de IA y avanzar en la evolución de la arquitectura Transformer.

Q¿Por qué se considera significativa la partida de Shazeer de Google para OpenAI?

ASe considera una pérdida significativa para Google y una gran adquisición para OpenAI porque Shazeer es una figura fundacional en el campo de la IA moderna. Como coautor del Transformer, su trabajo es la base técnica de modelos como GPT, Gemini y Claude. Perder a un autor clave del Transformer y al co-director de Gemini en un momento de intensa competencia con OpenAI y Anthropic es un golpe para Google. Para OpenAI, ganar a alguien con su profundo conocimiento en el diseño de arquitecturas es crucial para impulsar la próxima generación de modelos.

Q¿Cuál fue la trayectoria profesional de Noam Shazeer antes de unirse a OpenAI?

ALa trayectoria de Noam Shazeer abarca más de 18 años en Google, donde contribuyó a proyectos clave como el Transformer, la arquitectura MoE (Mixture of Experts) y los modelos LaMDA. En 2021 dejó Google para cofundar Character.AI. En 2024, Google recuperó su talento a través de un acuerdo de licencia tecnológica con Character.AI valorado en unos 27.000 millones de dólares, reincorporándolo a DeepMind como co-director de Gemini. Ahora, ha dado el paso de unirse a OpenAI.

QSegún el artículo, ¿cuál será el enfoque principal de Shazeer en su nuevo rol en OpenAI?

AEn su nuevo rol como Líder de Investigación en Arquitectura en OpenAI, el enfoque principal de Shazeer será explorar y desarrollar la próxima generación de arquitecturas para modelos de IA. Esto incluye investigar cómo evolucionar y potencialmente superar la arquitectura Transformer, que ha dominado el campo durante casi una década, para impulsar capacidades más avanzadas en los futuros modelos.

Q¿Qué reacciones generó el anuncio de la incorporación de Shazeer a OpenAI?

AEl anuncio generó reacciones positivas y destacadas dentro de la comunidad de IA. El Director de Investigación de OpenAI, Mark Chen, y otros investigadores importantes como Noam Brown y Sébastien Bubeck dieron la bienvenida a Shazeer en la red social X. Al mismo tiempo, algunos observadores externos señalaron que esta salida era un 'duro golpe' para Google, subrayando la intensa competencia por el talento de primer nivel entre los gigantes de la IA.

Lecturas Relacionadas

Gate Research Institute: Análisis de Formaciones Gráficas y Estrategia de Trading por Ruptura

"Gate Research: Análisis de Patrones Gráficos y Estrategias de Trading por Ruptura Los patrones gráficos son herramientas esenciales del análisis técnico para observar cambios en la oferta y la demanda, y posibles continuaciones o reversiones de tendencia. Su análisis requiere una evaluación integral de la tendencia, volumen, soportes/resistencias, ciclos temporales y la validez de las rupturas, no solo la memorización de formas. Los patrones se dividen principalmente en dos categorías: de reversión (como doble techo/doble suelo, cabeza y hombros) y de continuación (como banderas, triángulos, rectángulos). Una ruptura efectiva suele basarse en niveles claros de soporte/resistencia, una consolidación prolongada, el contexto de la tendencia y la confirmación del volumen. Sin embargo, una ruptura no garantiza una tendencia nueva, ya que las falsas rupturas son frecuentes. Los traders deben gestionar el riesgo mediante el control de la posición, stop-loss, confirmación por retroceso y toma parcial de ganancias. La estrategia de trading por ruptura se centra en la salida del precio de un rango o patrón consolidado. La entrada puede realizarse en el momento de la ruptura o tras una confirmación por retroceso. Es crucial definir niveles claros de entrada, stop-loss (colocándolo fuera de la estructura del patrón) y objetivos de beneficio (a menudo basados en la altura del patrón). La gestión de posiciones puede incluir tomar ganancias parciales en objetivos medibles y seguir el resto con un stop-loss móvil. Existen tres tipos principales de comportamiento tras una ruptura: ruptura efectiva (avance sostenido), ruptura con retroceso (que ofrece una segunda oportunidad de entrada) y falsa ruptura (que revierte rápidamente). Indicadores como el volumen, la conversión de soporte/resistencia, ATR, medias móviles, Bandas de Bollinger y RSI pueden ayudar a validar la solidez de una ruptura. En conclusión, los patrones y las rupturas proporcionan un marco útil, pero su eficacia depende de múltiples factores que converjan. Deben integrarse en un sistema de trading más amplio que incluya gestión de riesgo y gestión monetaria disciplinada."

marsbitHace 12 min(s)

Gate Research Institute: Análisis de Formaciones Gráficas y Estrategia de Trading por Ruptura

marsbitHace 12 min(s)

STRC sufre una grave desvinculación de su valor nominal, ¿qué riesgos está valorando el mercado?

**Resumen: La Desvinculación de STRC y los Riesgos que Valora el Mercado** La acción preferente perpetua STRC de Strategy ha caído a unos 89 dólares, desviándose significativamente de su valor nominal de 100 USD, lo que eleva su rendimiento simple actual a aproximadamente el 12.9%. Esto es inusual, ya que STRC fue diseñada como un instrumento de alto rendimiento que debería operar cerca de la paridad. Strategy mantiene un dividendo anual del 11.5% y aumentará la frecuencia de pago a quincenal a partir de julio, lo que, en teoría, debería apoyar el precio. El mercado, sin embargo, está valorando otros riesgos. Una explicación clave es la posible liquidación mecánica de operaciones de *carry trade* con apalancamiento: la caída del precio puede forzar ventas para cubrir márgenes, creando un círculo vicioso de desapalancamiento. Además, la tokenización de STRC y su integración en protocolos DeFi (como Apyx, Saturn, Pendle) han amplificado la volatilidad al conectar el activo con mecanismos más rápidos de préstamo, apalancamiento y liquidación. La aparición de un producto competidor, SATA de Strive, que ofrece un rendimiento nominal del 13% y pagos diarios, ha cambiado el punto de referencia para los inversores que buscan rendimiento, desafiando la narrativa de escasez de STRC. Aunque Strategy enfatiza su cobertura con reservas de BTC (capacidad para cubrir dividendos durante ~31.6 años), el mercado cuestiona si esto se traduce en un flujo de caja estable para los dividendos. El mecanismo de dividendo ajustable de Strategy, destinado a mantener el precio cerca de los 100 USD, está ahora bajo prueba. La cuestión clave es si Strategy actuará para restaurar la paridad (por ejemplo, ajustando el dividendo) o si el mercado ha establecido un nuevo punto de partida para la prima de riesgo de STRC. La evolución del precio, las próximas decisiones sobre dividendos y la estabilización de las posiciones apalancadas serán cruciales para determinar si el descuento actual es una sobreventa temporal o un reflejo de un riesgo estructural mayor.

marsbitHace 24 min(s)

STRC sufre una grave desvinculación de su valor nominal, ¿qué riesgos está valorando el mercado?

marsbitHace 24 min(s)

El precio de LIT alcanza un máximo de seis meses: ¿cuánto durará aún el combustible de la rueda de recompras?

El token LIT de Lighter, un exchange descentralizado de contratos perpetuos, alcanzó un máximo de 1.9 USD el 18 de junio, su precio más alto en seis meses, antes de corregir a alrededor de 1.6 USD. Su capitalización de mercado es de 425 millones de USD. El mecanismo central de captura de valor de Lighter es un programa de recompra automática que utiliza el 100% de los ingresos por comisiones para comprar LIT en el mercado abierto. Desde su lanzamiento, se han recomprado aproximadamente 15 millones de LIT (6% de la oferta circulante), por valor de unos 21 millones de USD. Otro pilar es el LLP (Lighter Liquidity Pool), un fondo que actúa como contraparte central para los traders. Los proveedores de liquidez deben apostar LIT equivalente al 10% de su depósito en USDC, lo que crea una demanda significativa y bloquea tokens. Actualmente, circulan 250 millones de LIT (25% del total), y el 75% restante (equipo e inversores) está bloqueado hasta diciembre de 2026, lo que elimina la presión de venta inmediata. Al compararse con su principal competidor, Hyperliquid (HYPE), Lighter muestra un volumen negociado y un interés abierto menores. Hyperliquid, con un ecosistema más amplio que incluye mercados de predicción y un ETF spot en EE.UU., cuenta con un respaldo institucional más fuerte (p.ej., a16z). En conclusión, el precio de LIT se ve impulsado por su programa de recompra transparente, el mecanismo de bloqueo del LLP y la ausencia actual de desbloqueos. Sin embargo, enfrenta desafíos en la expansión de su volumen y adopción frente a Hyperliquid, que disfruta de una ventaja de primer moviente y un mayor apoyo del mercado.

Foresight NewsHace 46 min(s)

El precio de LIT alcanza un máximo de seis meses: ¿cuánto durará aún el combustible de la rueda de recompras?

Foresight NewsHace 46 min(s)

Anthony Scaramucci Señala un Posible Fondo del Bitcoin, Citando un RSI Bajo y la Apatía Minorista

Anthony Scaramucci sugiere que el actual sentimiento de apatía en el mercado de Bitcoin podría ser una señal de fondo de ciclo, en lugar de una razón para alejarse del activo. El inversor afirma seguir teniendo una cantidad sustancial de Bitcoin y mantiene una visión alcista, anticipando un repunte más fuerte a finales del cuarto trimestre de 2026 o principios de 2027. Su argumento se basa en el bajo interés minorista, la escasa demanda, la debilidad del sentimiento y las condiciones de RSI (Índice de Fuerza Relativa) deprimidas. Scaramucci plantea que, en mercados con poca participación como el actual, incluso un modesto impulso de demanda puede mover el precio de manera más agresiva. No obstante, se debe matizar la afirmación sobre el RSI: aunque el RSI semanal de Bitcoin es bajo, no necesariamente se encuentra en mínimos históricos extremos, como los vistos en ciclos bajistas anteriores. Por tanto, este indicador por sí solo no es suficiente para confirmar un suelo duradero; los analistas suelen combinarlo con estructura de precios, volumen y datos on-chain. En resumen, Scaramucci presenta un argumento alcista contrario: la actual falta de emoción podría indicar que los vendedores están exhaustos y las expectativas son mínimas, preparando el terreno para la siguiente fase de acumulación si surge un nuevo impulso de demanda institucional o macroeconómico.

bitcoinistHace 55 min(s)

Anthony Scaramucci Señala un Posible Fondo del Bitcoin, Citando un RSI Bajo y la Apatía Minorista

bitcoinistHace 55 min(s)

Trading

Spot
Futuros
活动图片