Tras fichar a un premio Nobel, Anthropic recluta al director de CS de Berkeley: cuatro fichajes en dos semanas

marsbitPublicado a 2026-07-02Actualizado a 2026-07-02

Resumen

El 1 de julio, Jelani Nelson, director del departamento de Ciencias de la Computación en EECS de UC Berkeley y destacado profesor de ciencias de la computación teórica, anunció su incorporación a Anthropic mediante una excedencia académica. Especialista en algoritmos de flujo, reducción de dimensionalidad y algoritmos aleatorios, su trabajo se centra en optimizar el uso de memoria y cómputo para grandes volúmenes de datos, un campo crucial para la eficiencia en el entrenamiento y la inferencia de modelos de IA. Su llegada a Anthropic se enmarca en una ola de fichajes de alto nivel en la industria. En las dos semanas previas, la empresa también sumó al premio Nobel de Química 2024, John Jumper (ex DeepMind), y a dos investigadores principales de Gemini, Jonas Adler y Alexander Pritzel. Paralelamente, OpenAI atrajo al coautor de Transformer, Noam Shazeer, y Meta contrató a la experta en seguridad de IA Dawn Song de Berkeley. Este éxodo masivo, especialmente desde instituciones académicas de élite como Berkeley, refleja una intensa competencia por talento teórico que pueda abordar los límites fundamentales de la escalabilidad y la eficiencia de los modelos. El mecanismo de "excedencia" o "licencia" se ha popularizado, permitiendo a los académicos mantener su plaza universitaria mientras trabajan en la industria, lo que acelera la fuga de cerebros. La tendencia sugiere que la batalla de la IA está descendiendo desde la carrera por modelos más grandes hacia la optimización de a...

El 1 de julio por la tarde, un tuit sacudió los círculos académicos de Silicon Valley.

Jelani Nelson, profesor de Ciencias de la Computación Teórica y director del departamento de Ciencias de la Computación en EECS de UC Berkeley, dejó temporalmente las llaves de su oficina y se marchó a Anthropic.

Publicó en X:

Me he unido a Anthropic y estoy de excedencia de la universidad. Es un placer trabajar con tantas personas talentosas y con propósito en la tecnología definitoria de nuestra época.

Dos breves frases cargadas de información: ya está en su puesto, conserva su plaza académica, mediante una excedencia. No mencionó ni su cargo, ni su equipo, ni su dirección de trabajo.

La biografía de Nelson en X ya se ha actualizado: 'Miembro del Equipo Técnico (Member of Technical Staff) en Anthropic', convirtiéndose así en colega de Karpathy, quien se unió en mayo.

Jelani Nelson, Director del Departamento de Ciencias de la Computación en EECS de la Universidad de California, Berkeley

El hombre que dirigía uno de los departamentos de Ciencias de la Computación más prestigiosos de EE.UU., se marcha así sin más.

Las empresas de IA llevan tres años compitiendo por talento, desde ingeniería hasta producto, desde alineación hasta multimodalidad.

Esta vez, han puesto sus manos en la cúspide de la informática teórica.

De MIT a Berkeley, el hombre que llevó el "contar" al límite óptimo mundial

El currículum de Nelson es casi la configuración perfecta estándar para un informático teórico.

En la escuela secundaria aprendió HTML por su cuenta para crear sitios web, en el instituto aprendió a programar, y durante la universidad demostró en competiciones que podía escribir código sin errores a la mayor velocidad.

Cursó licenciatura, máster y doctorado en el MIT, obteniendo su doctorado en Ciencias de la Computación en 2011, especializándose en algoritmos eficientes para datos masivos.

Describe la atracción de esta disciplina como "casi religiosa": aborda problemas fundamentales del pensamiento humano y está íntimamente relacionada con el mundo real.

Tras el doctorado, realizó estancias posdoctorales en Berkeley, la Universidad de Princeton y el Instituto de Estudios Avanzados de Princeton (IAS), incorporándose como profesor a Harvard en 2013.

En 2019, Nelson se despidió de Harvard y se trasladó al oeste, a UC Berkeley.

El periódico de Harvard expresó su pesar directamente en el titular: su partida deja un gran vacío (Big Hole) en el departamento de informática.

En Berkeley, se sintió como pez en el agua, sumergiéndose en el círculo teórico del Instituto de Computación Teórica Simons (Simons Institute).

En otoño de 2024, Nelson asumió el cargo de Director (Chair) del departamento de Ciencias de la Computación en EECS, al frente de uno de los departamentos de CS más prestigiosos del mundo.

Sus principales áreas de investigación son los algoritmos de streaming (streaming algorithms), la reducción de dimensionalidad (dimensionality reduction) y los algoritmos aleatorios (randomized algorithms).

Traducido a lenguaje llano, Nelson se centra en un mismo tipo de problema: cómo calcular cuando los datos son demasiado grandes para ser almacenados.

Hace unos años, se fijó en un problema que parece de primaria: hacer que un ordenador aprenda a contar.

Parece simple, pero cuando los números son tan grandes que ni los teléfonos ni los servidores pueden recordar "hasta dónde se había contado", el coste en almacenamiento y velocidad se dispara.

Su equipo proporcionó una fórmula matemática que demuestra la cantidad mínima de memoria que cualquier algoritmo que resuelva este problema debe utilizar.

Artículo del equipo de Nelson, que demuestra el límite inferior de memoria para el problema de conteo aproximado. https://arxiv.org/pdf/2010.02116

Los ingenieros hacen que los programas corran más rápido; Nelson demuestra lo rápido que, como máximo, puede correr un programa. Ése es el trabajo del informático teórico: establecer los límites físicos inferiores de la computación.

Las contribuciones de Nelson en el ámbito académico van mucho más allá de este "contar".

Una, junto con Kasper Green Larsen, demostró la optimalidad del lema de Johnson-Lindenstrauss (Johnson-Lindenstrauss lemma).

Ésta es una piedra angular en el campo de la reducción de dimensionalidad, cuyo límite teórico inferior él fijó. Anteriormente, junto con Daniel Kane, también propuso la transformación JL dispersa (sparse JL transform).

Otra, junto con Kane y David Woodruff, proporcionó el algoritmo asintóticamente óptimo para el problema de contar-distintos (count-distinct) (cuántos elementos distintos hay realmente en un flujo de datos).

En su opinión, incluso algo que todo el mundo sabe hacer como "contar" esconde tras de sí una solución teórica óptima.

Este trabajo le ha valido una larga lista de honores: el Sloan Research Fellowship, el Premio Presidencial para Científicos e Ingenieros en sus Primeros Años de Carrera (PECASE), entre otros.

Fuera de la academia, Nelson tiene otra faceta.

En 2011, mientras aún hacía el doctorado en el MIT, viajó a Etiopía y fundó el campamento gratuito de programación AddisCoder.

Catorce años después, casi 700 estudiantes han pasado por él, y muchos han ingresado en programas de doctorado en Harvard, MIT y Stanford.

Posteriormente, la estrella del reggae jamaicano Chronixx se acercó para donar dinero, lo que dio lugar al proyecto hermano JamCoders.

AddisCoder, el campamento gratuito de programación fundado por Nelson en 2011, ha formado a cerca de 700 estudiantes. (Fuente: sitio web de AddisCoder)

Nelson también es uno de los opositores más vehementes a la reforma del currículo de matemáticas en California, por una razón simple: su abuelo, de origen humilde, se convirtió en médico gracias a una educación pública de calidad, cambiando la trayectoria de toda la familia.

Por lo tanto, en su opinión, eliminar las matemáticas rigurosas de las escuelas públicas equivale a quitar la escalera para que la próxima generación supere su situación.

Esta labor "fuera de la academia" también le valió posteriormente el Premio Humanitario ACM Lawler.

¿Para qué quiere Anthropic a un teórico?

¿Qué relación tiene un profesor especializado en algoritmos de streaming con una empresa de modelos grandes?

Las áreas de investigación de Nelson (algoritmos de streaming, reducción de dimensionalidad, algoritmos aleatorios) estudian en realidad lo mismo: cómo procesar la mayor cantidad de datos con la mínima memoria y el mínimo cómputo.

Esto se corresponde precisamente con algunas de las cosas más costosas en el ámbito de los modelos grandes: eficiencia del entrenamiento, compresión de datos, complejidad computacional.

Tomemos como ejemplo el lema de JL, cuya última pieza completó él: responde a una pregunta tan simple que roza lo obvio: cuánto se puede comprimir un dato de alta dimensión sin perder información.

La intuición subyacente a la recuperación vectorial y la compresión de embeddings que vemos hoy en día se basa en este lema.

Entrenar un modelo de vanguardia es, en esencia, realizar compresión y selección en un flujo de datos astronómico; en el lado de la inferencia, la memoria de vídeo (VRAM), la caché, la ventana de contexto, cada aspecto se enfrenta a limitaciones de memoria y complejidad.

Y éste es precisamente el dominio de problemas en el que Nelson ha profundizado durante veinte años.

Cuando la escala de los modelos choca con los límites de la capacidad computacional y los datos, el valor de "ahorrar" comienza a superar al de "acumular". El foco de la competencia en IA está pasando de "qué modelo es más potente" a "qué algoritmo subyacente es más eficiente".

Y el conjunto de herramientas de los algoritmos de streaming y aleatorios encaja naturalmente con el problema de "aproximarse a la solución óptima con recursos limitados", lo que golpea justo la ansiedad común de todos los laboratorios de vanguardia hoy en día.

Desde esta perspectiva, que Anthropic contrate a un científico de la computación teórica se asemeja más a una puesta al día: además de modelos, ingeniería y alineación, profundizar una capa más en los cimientos teóricos.

Profesores de élite en empresas de IA: ahora está de moda no dimitir

Con respecto a su incorporación a Anthropic, las palabras exactas de Nelson fueron "taken leave from the university", excedencia de la universidad (leave of absence).

Excedencia y dimisión son dos cosas diferentes: conserva su plaza académica y puede regresar en cualquier momento.

Se trata de un sistema consolidado en el ámbito académico estadounidense, que permite a los profesores ausentarse de la universidad por un tiempo, con o sin sueldo, para ir a la industria, emprender o hacer cualquier otra cosa.

Este camino ya ha sido validado antes.

En 2017, Fei-Fei Li aprovechó un permiso académico para asumir el cargo de Vicepresidenta y Científica Jefe de IA en la Nube de Google, regresando a Stanford dos años después.

Hoy en día, la puerta giratoria entre el mundo académico y la industria gira cada vez más rápido, y la "incorporación mediante excedencia" se está convirtiendo en un modo predominante.

Para los académicos, es un billete de vuelta garantizado, especialmente cuando la industria ofrece capacidad computacional, datos y problemas reales que la academia no puede proporcionar.

Para las empresas de IA, es una vía de baja fricción para atraer talento. Y lo que es aún más rentable: contratar a un académico nunca significa contratar solo a una persona, sino también a sus estudiantes, colegas y toda su red académica.

El camino tradicional único de "obtener la titularidad (tenure) y trabajar hasta la jubilación" está siendo reemplazado por el modelo de excedencia de "tener un pie en la industria".

Para las universidades, una vez que se abre esta puerta, es difícil cerrarla.

Tras competir entre ellas, los gigantes de la IA comienzan a competir por las universidades

¿Hasta qué punto estuvo loco el mercado de talento de IA en junio pasado?

El 18 de junio, Noam Shazeer, coautor del artículo Transformer y cogestor de Gemini, anunció que dejaba Google para irse a OpenAI.

Cabe recordar que Google lo había recuperado de Character.AI en 2024 mediante una transacción de 2700 millones de dólares, y en menos de dos años, ya se había marchado de nuevo.

El 19 de junio, John Jumper, galardonado con el Premio Nobel de Química 2024 por AlphaFold, anunció oficialmente: abandona DeepMind después de casi nueve años y se une a Anthropic.

Sujeto a las cláusulas de no competencia de la alta dirección de DeepMind, es posible que no pueda incorporarse oficialmente hasta el próximo año.

El 24 de junio, Bloomberg reveló: los investigadores clave de Gemini, Jonas Adler y Alexander Pritzel, también seguirán sus pasos y se unirán a Anthropic. Ambos fueron colaboradores en el trabajo de Jumper sobre estructuras proteicas.

Las acciones de Alphabet cayeron en respuesta, y los inversores comenzaron a cuestionar públicamente si Google podía retener a su personal.

Hasta aquí, el campo de batalla seguía estando entre las empresas de IA. Pronto, las llamas de la guerra llegaron a la universidad.

El 25 de junio, Dawn Song, investigadora de seguridad de IA con 19 años de docencia en Berkeley, anunció que se unía al Laboratorio de Superinteligencia de Meta como Vicepresidenta de Investigación en IA.

El 1 de julio, Nelson.

En solo dos semanas: un premio Nobel, dos investigadores clave de Gemini, un profesor veterano y, además, un director de departamento en activo.

De ellos, Jumper, Adler, Pritzel y Nelson, los cuatro, se dirigieron a Anthropic.

El contexto de esta frenética movilidad de talento tampoco es difícil de adivinar.

OpenAI ya ha presentado en secreto la documentación para su OPV (Oferta Pública de Venta), y múltiples fuentes también apuntan a que Anthropic se acerca a su salida a bolsa. Para los investigadores de primer nivel, incorporarse ahora significa acciones previas a la salida a bolsa, algo que las grandes tecnológicas no pueden ofrecer.

Y el papel de Berkeley en esta ronda de migraciones es especialmente llamativo.

El Instituto de Computación Teórica Simons tiene su sede aquí, al igual que el departamento de EECS de primer nivel nacional: las tres líneas de teoría, sistemas de aprendizaje automático y seguridad de IA suministran talento constantemente a Anthropic, OpenAI y DeepMind.

En la ronda anterior, los gigantes de la IA competían por quienes sabían entrenar modelos; en esta ronda, compiten por quienes saben cuáles son los límites de los modelos.

Con la afluencia de académicos de élite, las empresas de IA están, de hecho, convirtiéndose en un "segundo sistema de instituciones de investigación".

Si los mejores teóricos están todos de "excedencia" en empresas, ¿qué le queda a la universidad? Nadie lo sabe.

Lo único seguro es que el foco de la competencia en IA ya ha descendido desde las capacidades del modelo hasta la capa fundamental de la teoría algorítmica.

Referencias:

https://x.com/minilek/status/2072322757908664728?s=20

https://www2.eecs.berkeley.edu/Faculty/Homepages/minilek.html

https://vcresearch.berkeley.edu/news/jelani-nelson-considers-human-thought-computer-science-tools

https://arxiv.org/pdf/2010.02116

Este artículo proviene del canal de WeChat "新智元" (New Zhiyuan), autor: ASI启示录

Preguntas relacionadas

Q¿Qué anunció Jelani Nelson en su publicación de X y qué implicaciones tiene?

AJelani Nelson anunció en X que se ha unido a Anthropic y está de excedencia de la universidad. Esto implica que ha asumido un rol en la industria de la IA (como Miembro del Personal Técnico) mientras mantiene su puesto académico, lo que refleja una tendencia creciente de los académicos destacados que trabajan en empresas de IA bajo acuerdos de excedencia.

Q¿Cuáles son las principales áreas de investigación de Jelani Nelson y por qué son relevantes para Anthropic?

ALas principales áreas de investigación de Jelani Nelson son los algoritmos de flujo (streaming algorithms), la reducción de dimensionalidad (dimensionality reduction) y los algoritmos aleatorios (randomized algorithms). Estas áreas son relevantes para Anthropic porque abordan cómo procesar grandes volúmenes de datos con recursos computacionales y de memoria mínimos, lo que es crucial para mejorar la eficiencia en el entrenamiento de modelos de IA, la compresión de datos y la gestión de la complejidad computacional.

Q¿Qué otros destacados investigadores se unieron a Anthropic recientemente, según el artículo?

ASegún el artículo, además de Jelani Nelson, Anthropic ha incorporado recientemente al premio Nobel de Química 2024, John Jumper (anteriormente de DeepMind), y a los investigadores principales de Gemini, Jonas Adler y Alexander Pritzel (también de Google/DeepMind). Esto refleja una intensa competencia por el talento de primer nivel en la industria de la IA.

Q¿Qué es el modo 'excedencia' (leave of absence) mencionado en el artículo y por qué es significativo?

AEl modo 'excedencia' (leave of absence) es un acuerdo institucionalizado en el ámbito académico estadounidense que permite a los profesores tomar un permiso temporal de su universidad (con o sin salario) para trabajar en la industria, emprender o realizar otras actividades. Es significativo porque reduce la fricción para que los académicos se unan a empresas, les ofrece seguridad al mantener su puesto universitario y permite a las empresas acceder a talento experto y sus redes académicas sin una contratación permanente.

QSegún el artículo, ¿cómo está cambiando la competencia en IA en términos de enfoque estratégico?

ASegún el artículo, la competencia en IA está cambiando su enfoque estratégico desde simplemente construir modelos más grandes y potentes ('quién tiene el modelo más fuerte') hacia la optimización de los algoritmos fundamentales para lograr una mayor eficiencia ('quién tiene el algoritmo subyacente más eficiente'). La contratación de teóricos como Jelani Nelson por parte de Anthropic señala un esfuerzo por fortalecer los cimientos teóricos y algorítmicos para superar los límites actuales de cómputo, datos y eficiencia energética.

Lecturas Relacionadas

La mujer más rica de China se dedica a la capital de riesgo

La multimillonaria china Zhou Qunfei, conocida como la "Reina del Cristal" por fundar la empresa de componentes electrónicos Lens Technology, está incursionando activamente en el ámbito del capital de riesgo (VC) para invertir en empresas tecnológicas pioneras. Recientemente, invirtió una cantidad significativa (varios cientos de millones de yuanes) en X-Dimension.ai, una startup de Shenzhen valorada en 10.000 millones de yuanes (unicornio) que desarrolla inteligencia artificial corporizada (AGI físico) y robots humanoides. Su enfoque de inversión es práctico: Lens Technology ya utilizaba los productos de X-Dimension.ai en sus líneas de producción antes de que Zhou decidiera invertir personalmente. Zhou opera a través de dos vías principales: inversiones personales discretas a través de su empresa "Changsha Qunxin Investment" y participaciones estratégicas más visibles a través del grupo Lens Technology. Su cartera personal incluye empresas de semiconductores como XinAi Technology y Chixin Semiconductor. Por su parte, Lens Technology ha invertido recientemente en destacadas empresas de IA como BrainCo, Star Mapping, Q-Truck y Pudu Technology. Este movimiento de Zhou refleja una tendencia más amplia entre los magnates industriales chinos. Empresarios que acumularon fortunas en sectores tradicionales como la manufactura (por ejemplo, Liu Yi de Andon Health, Zhu Xingming de Inovance, Wang Laichun de Luxshare) están redirigiendo ahora su capital y experiencia industrial hacia áreas tecnológicas de vanguardia como la IA, la inteligencia corporizada, las interfaces cerebro-computadora y la fusión nuclear. Parecen compartir la convicción de que el futuro crecimiento económico ya no reside en sectores como el inmobiliario, sino en el mundo de los datos y los algoritmos. La trayectoria de Zhou es notable: pasó de ser una trabajadora migrante en una línea de ensamblaje a construir Lens Technology, un proveedor clave para Apple, Tesla y otras grandes marcas, con una capitalización de mercado que supera los 300.000 millones de yuanes. Ahora, junto con sus pares, está utilizando su riqueza para apostar por el próximo futuro tecnológico de China.

marsbitHace 36 min(s)

La mujer más rica de China se dedica a la capital de riesgo

marsbitHace 36 min(s)

En vísperas de su llegada a EE.UU., las acciones de SK Hynix se desploman como un perro callejero

Antes de su inminente listado en Nasdaq, las acciones de SK Hynix, el gigante surcoreano de chips de memoria, se desplomaron un 14.57% en la bolsa de Corea. Esta caída se produjo tras la especulación del mercado sobre una posible ralentización en el gasto de capital de las grandes tecnológicas, desencadenada por reportes de que Meta podría vender capacidad de computación de IA excedente. El contexto es crucial: SK Hynix está en la fase final de su proceso de oferta pública inicial (IPO) en Estados Unidos mediante ADR, con el objetivo de recaudar unos 294.000 millones de dólares para financiar la expansión de su capacidad de producción en Corea. La empresa se beneficia actualmente del auge de la IA, con una cuota de mercado superior al 50% en la memoria de alto ancho de banda (HBM), un componente crítico para los servidores de IA. El artículo argumenta que la fuerte reacción del mercado podría ser una exageración. Señala que los informes iniciales sobre Meta fueron modificados, eliminando la palabra "excedente" y matizando el alcance del plan, lo que sugiere una posible sobreinterpretación. Además, plantea que la reasignación o comercialización parcial de capacidad de computación por parte de una sola empresa no equivale necesariamente a un exceso de oferta a nivel de la industria ni al fin del ciclo de inversión en IA. La caída podría atribuirse más bien a una combinación de pánico puntual, posiciones apalancadas en un sector que había alcanzado máximos y una alta sensibilidad a cualquier noticia marginal. En conclusión, el autor ve la caída más como una oportunidad de compra que como un cambio fundamental en las perspectivas de la industria, considerando el fuerte posicionamiento de SK Hynix en HBM y el incentivo de los actores involucrados en su IPO para un debut exitoso en Wall Street.

Odaily星球日报Hace 37 min(s)

En vísperas de su llegada a EE.UU., las acciones de SK Hynix se desploman como un perro callejero

Odaily星球日报Hace 37 min(s)

arXiv se independiza de Cornell y comienza un nuevo capítulo como organización autónoma

El repositorio de preprints arXiv ha completado su transición para convertirse en una organización independiente sin ánimo de lucro, arXiv, Inc., dejando atrás su dependencia de la Universidad de Cornell después de 25 años. El cambio, efectivo desde el 1 de julio, incluye una nueva identidad visual y una estructura de gobernanza dirigida por un consejo directivo de hasta 12 miembros, con la Universidad de Cornell y la Simons Foundation como miembros fundadores. El profesor Ramin Zabih actuará como CEO interino hasta que se nombre un director ejecutivo permanente. La plataforma, fundada en 1991 por Paul Ginsparg, alberga más de 3,09 millones de artículos y sirve a una comunidad global con más de 37.000 millones de descargas. Su modelo de preprints ha revolucionado la velocidad de difusión del conocimiento, especialmente en campos como la IA. Los usuarios no experimentarán cambios funcionales inmediatos, y arXiv reitera su compromiso de seguir siendo gratuito para lectores y autores. Las razones clave para la independencia incluyen la necesidad de mayor flexibilidad financiera y operativa, ya que arXiv enfrentó un déficit en 2025, y la presión de adaptarse al rápido crecimiento y a los desafíos planteados por el contenido generado por IA. El futuro CEO deberá liderar la modernización técnica, desarrollar mecanismos para manejar el alto volumen de envíos y asegurar una base de financiación sostenible.

marsbitHace 42 min(s)

arXiv se independiza de Cornell y comienza un nuevo capítulo como organización autónoma

marsbitHace 42 min(s)

Trading

Spot
活动图片