En medio de la creciente competencia en inteligencia artificial, el debate en torno a DeepMind, OpenAI y Anthropic ya no se centra únicamente en "qué modelo es más potente", sino que ha evolucionado hacia una cuestión más profunda: cómo organizan la investigación los principales laboratorios de IA, eligen sus rutas tecnológicas y toman decisiones a largo plazo equilibrando capacidad computacional, capital y seguridad.
En una reciente entrevista de InfoQ a Sebastian Mallaby, autor de "The Infinity Machine" (El cerebro de la IA de Google), reconocido historiador de la tecnología y las finanzas, intentamos comprender, desde una perspectiva más cercana a la de un "observador interno", la lógica del crecimiento de DeepMind y las verdaderas diferencias estructurales entre esta, OpenAI y Anthropic.
Como observador que ha seguido de cerca a Demis Hassabis y su equipo, Mallaby opina que la ventaja de DeepMind no proviene solo de la capacidad computacional y la financiación proporcionadas por Google, sino también de una forma única de organización: permite a los científicos explorar con libertad a largo plazo y, al mismo tiempo, formar rápidamente equipos de突击 (strike teams) para impulsar avances en momentos clave. Este mecanismo le ha permitido abordar continuamente problemas que requieren más de una década de inversión, como AlphaGo y AlphaFold.
Mientras tanto, las diferencias en el equilibrio entre "seguridad y velocidad" entre los distintos laboratorios se están convirtiendo en una variable importante que afecta al panorama competitivo de la AGI (Inteligencia Artificial General). Y a medida que la escalabilidad (scaling) de la IA se extiende desde la fase de entrenamiento a la de inferencia e incluso al nivel de los agentes inteligentes, la propia estructura motriz del progreso de la IA está cambiando.
En este sentido, la competencia actual en IA ya no es solo una carrera de capacidades de modelos, sino un juego a largo plazo en torno a modelos organizativos, métodos de investigación y asignación de recursos del sistema.
¿Por qué triunfó DeepMind?
InfoQ: En su libro menciona que Tomaso Poggio, mentor de Hassabis en el MIT, dijo que muchos premios Nobel que conoció eran tanto brillantes como afortunados. Unos pocos premios Nobel tenían un talento excepcional y estaban destinados a ganar el premio sin importar lo que investigaran. En 2009, Geoffrey Hinton conoció a Hassabis y pensó que era una persona más competitiva que él. Si tuviera que describir a Hassabis con unas pocas palabras, ¿cuáles serían? ¿Por qué?
Mallaby: Si tuviera que usar tres palabras para describirlo, diría: talento natural, competitivo, amable y modesto.
Lo de talento natural no hace falta ni decirlo. Competitivo significa que tiene un deseo innato de ganar, de lograr algo grandioso. Creo que esto está relacionado con su participación en competiciones de ajedrez desde pequeño. Con solo seis años, ya estaba inmerso en una competencia feroz, lo que lo volvió extremadamente competitivo. Esta competitividad se convirtió en su motor.
Pero, pensándolo al revés, si una persona es solo competitiva y talentosa, pero no es amable, entonces los demás no querrán trabajar para él, ni le caerá bien, e incluso intentarán ponerle trabas y obstaculizarle. Su ventaja radica en que a todo el mundo le cae bien. Después de tratar con él, la gente piensa que es una persona decente, con buenos valores, que desea que la inteligencia artificial beneficie a la humanidad. Precisamente por eso, todos están dispuestos a apoyar su causa. Me cuesta imaginar que sin esta bondad pudiera haber logrado el éxito que tiene hoy.
InfoQ: ¿Entonces cree que el éxito actual de DeepMind está relacionado con la personalidad modesta y bondadosa de su fundador, Hassabis? En comparación con otros laboratorios de IA, ¿qué tiene de único DeepMind?
Mallaby: Sí, creo que todo esto está estrechamente relacionado con la personalidad de Hassabis.
Lo único de DeepMind es, en primer lugar, que se fundó en 2010, cuando la IA ni siquiera podía reconocer la foto de un gato. En aquel entonces, la tecnología relevante aún no estaba madura, pero aún así había personas dispuestas a unirse a la empresa y dedicarse a una causa que aún no tenía éxito. Fue esta inversión y visión adelantada lo que permitió a DeepMind mantenerse a la vanguardia de la industria durante los primeros diez años aproximadamente, hasta que apareció ChatGPT y la competencia se intensificó. Durante esos diez años previos, siempre estuvieron muy por delante, todo gracias a lo temprano de su inicio, y esto sin duda se debe directamente a Hassabis. Desde los 18 años, antes de entrar en Cambridge, estaba convencido de las posibilidades de la IA y había abrazado esta visión desde muy joven. Esta es quizás otra cualidad que lo define: no solo es competitivo, talentoso y bondadoso, sino también un visionario pionero.
InfoQ: En su libro menciona que a Hassabis en realidad no le gusta la gestión empresarial. Su modelo organizativo ideal es "Bell Labs + Instituto de investigación académica". El equipo de DeepMind siempre ha trabajado de forma independiente en el Reino Unido, muchas de las normas iniciales del equipo permitían a los científicos investigar a largo plazo, no exigían productos a corto plazo y sus artículos podían publicarse, algo completamente diferente a muchas empresas de Silicon Valley. ¿Estas condiciones aparentemente "demasiado libres" no dificultarían la gestión de Hassabis? Normalmente, las personas acostumbradas a la libertad, especialmente los genios, no están dispuestas a someterse a restricciones.
Mallaby: Creo que el punto clave de DeepMind es que dieron una gran libertad a este talento de élite. Los investigadores pueden decidir por sí mismos su dirección de investigación, publicar artículos académicos y disfrutar de una libertad de investigación similar a la universitaria.
Pero si DeepMind solo tuviera libertad, solo sería un grupo de personas haciendo su propia investigación por separado, sin poder producir ningún producto tangible. Hassabis combinó la exploración libre y el enfoque concentrado: cuando juzga que una dirección de investigación tiene condiciones para lograr un gran avance, ordena: "Vale, esta ruta puede materializarse, vamos a formar un equipo especial, avanzar a toda velocidad, implementando una gestión centralizada de arriba hacia abajo".
Llama a este tipo de equipos "strike teams" (equipos de突击). Desde el desarrollo inicial del agente inteligente para juegos de Atari, hasta el posterior AlphaGo, AlphaZero y una serie de modelos incluyendo AlphaFold, detrás ha habido tales equipos de突击. En un equipo de突击, hay un responsable que dirige de forma unificada, todos avanzan hacia un mismo objetivo, hay presión de tiempo y fecha límite, y la intensidad del trabajo es extremadamente alta.
Así que el genio de Hassabis radica en combinar la exploración libre con la transformación de resultados: utilizar avances en ciencia teórica para materializar y crear productos como AlphaGo.
Entiende la libertad académica porque él mismo hizo un doctorado y conoce el modelo de investigación universitaria; la idea de formar equipos de突击 proviene de su experiencia en la industria de los videojuegos: trabajó en una empresa de videojuegos e incluso fundó una propia, y sabe muy bien cómo las empresas de videojuegos cumplen plazos y entregan productos a tiempo. Fusionó perfectamente estos dos modelos.
InfoQ: ¿Cómo organiza y gestiona el talento un laboratorio de IA de élite como DeepMind? Por ejemplo, ¿cómo contrata científicos? ¿Cómo gestiona a investigadores de primer nivel? ¿Les ofrece salarios altos o más recursos?
Mallaby: En la fase inicial, el salario que ofrecía la empresa en realidad no era alto, porque en ese momento tenían fondos muy limitados. Aunque ofrecían stock options, la mayoría de los que se unieron no creían que estas opciones tuvieran valor en el futuro, porque en ese momento la IA no tenía productos maduros ni un modelo de negocio claro.
Por lo tanto, en las primeras etapas de la startup, atraer talento excelente era muy difícil. Creo que Demis pudo lograrlo en gran medida porque él y su cofundador, Shane Legg, eran científicos muy respetados, lo que hizo que otros investigadores estuvieran dispuestos a unirse a su equipo.
Además, algunas personas se unieron porque no querían lidiar con los asuntos "no científicos" de una startup, como tratar con abogados, conectar con inversores, considerar espacios de oficina, etc. Estas cosas les parecían tediosas y aburridas. Si Demis estaba dispuesto a encargarse de estos trabajos organizativos y de gestión, ellos podían concentrarse en su especialidad: la investigación científica. Por lo tanto, algunas personas (como el investigador que participó en el proyecto Atari, Mnihe) mencionaron que esta fue la razón por la que se unieron.
Sin embargo, después de 2014, la situación cambió significativamente. Tras la adquisición por Google, DeepMind obtuvo un apoyo financiero suficiente, pudiendo no solo ofrecer salarios más competitivos, sino también establecer un entorno de trabajo más estable y completo, incluyendo mejores condiciones de oficina y comidas gratuitas de alta calidad. En general, después de la adquisición, la experiencia laboral mejoró notablemente.
Además, con el continuo desarrollo de la tecnología de IA, la investigación científica depende cada vez más de la capacidad computacional. Para que los modelos logren realmente efectos revolucionarios, se necesitan muchos semiconductores avanzados y recursos de computación. Por lo tanto, para los científicos, poder obtener suficiente capacidad computacional se convierte en un factor clave. Y trabajar en DeepMind, donde pueden usar directamente la capacidad computacional y los recursos de chips de Google, también se convierte en una razón importante para atraer talento de primer nivel.
InfoQ: DeepMind no estaba completamente en una situación de "supervivencia pasiva" cuando fue adquirida por Google; en su última charla también mencionó que el CEO de Meta, Mark Zuckerberg, había invitado a Hassabis a cenar para discutir una posible adquisición, y Elon Musk también les había tendido una mano. Es decir, DeepMind ya tenía su propio halo antes de entrar en el sistema de Google. ¿Se puede interpretar que DeepMind disfruta de una gran poder de decisión dentro del sistema de Alphabet? ¿Es este uno de los factores de éxito de DeepMind?
Mallaby: Sí, creo que el hecho de que otras empresas también estuvieran interesadas en adquirirlos en ese momento, en realidad fortaleció su poder de negociación cuando finalmente se vendieron a Alphabet.
Sin embargo, también creo que un punto más crucial fue que el liderazgo de Alphabet, especialmente Larry Page, y más tarde Sundar Pichai, después de tratar con Demis, rápidamente se dieron cuenta de que era una persona muy especial. Realmente querían retenerlo y estaban dispuestos a hacer las cosas a su manera porque lo consideraban extremadamente valioso.
Al adquirir DeepMind, el pionero del aprendizaje profundo Geoffrey Hinton bromeó diciendo: "Solo por Demis, ya valdría entre 100 y 150 millones de libras". Esto refleja en realidad la alta estima que tenían por Demis: no solo era un emprendedor, sino una persona con una perspicacia de nivel genial.
Precisamente por eso, Google, después de la adquisición, dio a DeepMind una importancia extremadamente alta y un apoyo de recursos completo, incluyendo una gran cantidad de fondos de investigación. Esta es también una de las razones importantes por las que DeepMind pudo continuar teniendo éxito: esencialmente, porque Google reconoció y confió en Demis y estuvo dispuesto a apoyar su dirección de investigación a largo plazo.
InfoQ: Incluso con un alto poder de decisión, Google es después todo una empresa comercial. ¿Cómo logró DeepMind equilibrar la investigación a largo plazo y los resultados a corto plazo?
Mallaby: Durante un período bastante largo, el enfoque de DeepMind siempre fue la investigación a largo plazo, no la comercialización de productos. Básicamente, no lanzó productos comerciales reales, aunque intentó algunas aplicaciones médicas, pero eso fue más por el impulso de su cofundador Mustafa Suleyman que por una demanda central de Google.
Google en ese momento permitía, incluso apoyaba, que DeepMind se centrara en la investigación básica. Invertía casi 1000 millones de dólares anuales para apoyar estos proyectos de investigación, una inversión muy grande, pero asumible para Google, que tiene abundante efectivo.
Esta situación cambió fundamentalmente en 2022. Con el lanzamiento de ChatGPT, Google suddenly se dio cuenta de que los motores de búsqueda tradicionales podrían ser disruptos por nuevas formas de búsqueda basadas en grandes modelos de lenguaje. Esta amenaza puso nervioso a Google, por lo que rápidamente cambiaron de rumbo, queriendo competir con OpenAI, y comenzaron a exigir a DeepMind que pasara de centrarse principalmente en la investigación científica a una dirección más orientada a productos, especialmente desarrollando grandes modelos de lenguaje.
Al principio también me preguntaba si Demis se sentiría incómodo con esto, ya que en esencia es un científico.
Pero cuando hablé con él, su opinión fue interesante. Dijo: "Debes recordar que antes de fundar DeepMind, dirigía mi propia startup, Elixir Studios, una empresa de videojuegos, hacíamos productos. No me opongo a hacer productos, y además soy una persona muy competitiva, también quiero ganar en esta competencia".
También mencionó que en esta etapa, el desarrollo de la IA ha entrado en un nuevo estado: construir grandes modelos de lenguaje, por un lado, es crear productos, y por otro lado, en sí mismo está avanzando en la frontera científica.
De hecho, desde que apareció ChatGPT, hemos visto surgir continuamente muchos avances tecnológicos nuevos, como:
- Modelos con ventanas de contexto más largas (pueden recordar más información)
- Modelos multimodales que pueden procesar imágenes, video y audio
- Modelos con capacidad de razonamiento complejo
- Y modelos de agentes (Agent) que pueden ejecutar tareas
Estas exploraciones de vanguardia en sí mismas ocurren dentro de "formas de producto". Por lo tanto, en la etapa actual, la investigación científica y el desarrollo de productos no son una relación de elección, sino dos caminos que pueden avanzar simultáneamente.
Ganar miles de millones de dólares no equivale a ganar un Premio Nobel
InfoQ: En los primeros años después de la adquisición, ¿cuál fue el mayor conflicto cultural entre DeepMind y Google? ¿Hasta qué punto permitió Google que DeepMind mantuviera su independencia investigadora?
Mallaby: Estas divergencias culturales se centraron principalmente en el tema de la "seguridad". DeepMind quería establecer un mecanismo de gobernanza más independiente y especial para garantizar que la IA no se use solo para servir los intereses comerciales de una sola empresa. Se imaginaban crear una institu类似 "comité de revisión ética y de seguridad", cuyos miembros podrían incluir figuras como el expresidente estadounidense Obama, y que sería este organismo el que decidiera cómo debería usarse la IA.
Google a veces parecía apoyar esta idea superficialmente, pero en realidad no tenía intención de implementarla realmente. Por lo tanto, alrededor de este problema, ambas partes, junto con abogados, asesores de banca de inversión, etc., libraron una batalla prolongada durante tres años.
Durante este tiempo, Demis incluso intentó buscar otras salidas, como contactar con el fundador de Alibaba, Jack Ma, con la esperanza de obtener apoyo financiero para que DeepMind volviera a operar de forma independiente. Este fue probablemente el "conflicto cultural" central más importante entre ellos.
Sin embargo, a nivel de investigación científica, la divergencia no era realmente evidente. Google siempre apoyó mucho la investigación de vanguardia de DeepMind, como el proyecto AlphaGo.
De hecho, durante la competición de AlphaGo en Corea, los cofundadores de Google, Sergey Brin, y el entonces CEO, Eric Schmidt, y otros altos ejecutivos fueron personalmente a ver la competición. Estaban muy involucrados en este proyecto y disfrutaron mucho de este momento histórico.
InfoQ: Menciona que hubo un conflicto cultural intenso entre Google y DeepMind, y en su libro también dice que Demis casi se va de Google con su equipo. Pero al final, ¿por qué decidió quedarse? ¿Google hizo algún tipo de concesión?
Mallaby: En última instancia, lo que Demis más quería hacer en ese momento era seguir investigando. Porque si realmente quería independizarse y crear una nueva empresa, no solo tendría que correr de un lado a otro buscando inversión, sino también contratar a un montón de abogados para "enfrentarse" al departamento legal de Google, lo que sin duda enfurecería a Google. Para él, sumergirse en este interminable enredo comercial era claramente menos deseable que dedicar toda su energía a resolver problemas científicos de IA.
Así que creo que esta es la razón por la que finalmente decidió quedarse.
Hay otro punto interesante: la base de operaciones de Demis está en Londres, no en Silicon Valley. En Silicon Valley, el fervor emprendedor de "debes tener tu propia empresa" es casi una creencia; pero en Londres, esta atmósfera no es tan intensa. Demis claramente prefería mantener la intención original que tenía cuando vendió la empresa a Google.
Ante él, en realidad había dos caminos claramente diferentes: uno era luchar independientemente para construir un vasto imperio comercial, convertirse en un superrico con una fortuna de decenas de miles de millones; el otro era profundizar en el campo científico, inventar la IA real y finalmente ganar el Premio Nobel.
Evidentemente, más que esos decenas de miles de millones de dólares, anhelaba esa medalla del Premio Nobel.
InfoQ: ¿Podemos discutir una hipótesis? Si DeepMind no hubiera sido adquirida por Google, ¿cómo sería hoy?
Mallaby: En el Reino Unido, donde vivo, a menudo se oye una voz: "Ay, si DeepMind no se hubiera vendido a Google, ahora tendríamos un gigante de IA independiente británico".
Pero yo no lo veo así en absoluto.
Creo que en ese momento DeepMind necesitaba desesperadamente dinero. Se puede ver la adquisición desde otra perspectiva: esto no es en absoluto una "pérdida para la industria británica de IA", al contrario, es una gran victoria para el Reino Unido. Un emprendedor británico genial como Demis convenció a un gigante estadounidense para que invirtiera voluntariamente casi 1000 millones de dólares anuales en un laboratorio de IA en Londres.
Piensa, ¿no es una gran noticia que los estadounidenses inviertan grandes sumas de dinero en el Reino Unido?
Si Demis no hubiera vendido la empresa a Google en ese momento, con su talento y su naturaleza competitiva, sin duda también habría tenido éxito. Probablemente habría mantenido la independencia, o se habría vuelto para obtener inversión de grandes magnates como Elon Musk. Pero ese camino habría sido mucho más difícil, porque tendría menos dinero, y además tendría que enfrentarse a todo tipo de "fricciones internas": después de todo, Musk es una persona extremadamente belicosa.
Sin el apoyo financiero de Google, milagros como AlphaGo podrían haberse retrasado mucho. Pero en cualquier caso, Demis finalmente se habría convertido en una figura líder en el campo de la IA. Esa es su misión y su talento: si quiere lograr algo, probablemente nada en el mundo pueda detenerlo.
Detrás de AlphaGo y AlphaFold está la capacidad de elegir problemas
InfoQ: AlphaGo可以说让 DeepMind 一战成名。在谷歌内部,伴随着 AlphaGo 的成功,谷歌高层有没有重新评估 AGI 价值?您认为这场胜利是否改变了 DeepMind 在集团内部的话语权?具体体现在哪些方面?
Mallaby: Para todos en Google, la victoria de DeepMind con AlphaGo fue como una campanada de alerta impactante.
A través de esa competición, todos vieron claramente el poder aterrador que encierra la IA. Antes, Sergey Brin había afirmado: "Crear un sistema que juegue al Go debe ser extremadamente difícil". Resulta que Demis le demostró lo contrario con hechos. Los altos ejecutivos de Google tuvieron que admitir que la velocidad de evolución de la IA ya había superado con creces sus expectativas.
A partir de entonces, el presupuesto de I+D comenzó a dispararse. Originalmente, los fondos de DeepMind ya eran altos, pero después de AlphaGo se duplicaron nuevamente.
Se puede decir que esta victoria se convirtió en la baza más poderosa de Demis, permitiéndole persuadir a Google para que siguiera invirtiendo grandes sumas de dinero. Y la aparición un año después (2017) de AlphaZero consolidó aún más su posición, demostrando que esta inversión valía completamente la pena.
InfoQ: Tanto AlphaGo como AlphaFold han recibido mucha atención en la industria. En su opinión, ¿qué tienen en común AlphaGo y AlphaFold en cuanto a metodología?
Mallaby: En realidad, ambos son ejemplos de "máquina infinita".
Tomemos el Go como ejemplo: el primer jugador puede elegir colocar una piedra en cualquiera de los 361 puntos de intersección, luego le toca al segundo jugador, que tiene 360 opciones. A continuación,依次是 359, 358... Si multiplicas estas posibilidades, pronto obtendrás un número extremadamente grande: cada movimiento, cada respuesta, y la respuesta a esa respuesta, forman un espacio de posibilidades de crecimiento explosivo.
Por lo tanto, este es un espacio de búsqueda enorme, un conjunto de posibilidades casi infinito. Yo lo llamo "máquina infinita". Es decir, un sistema como AlphaGo es esencialmente una máquina capaz de extraer "significado" de movimientos posibles casi infinitos.
Si miras la estructura de una proteína, una imagen de una proteína, verás cómo se pliega. Hay innumerables pequeños pliegues, y cada pliegue puede cambiar en diferentes direcciones. Por lo tanto, las combinaciones de estructuras que puede formar una proteína son incluso mayores que las del Go, en cierto sentido, ya se acerca mucho al "infinito".
Pero DeepMind aún inventó una máquina capaz de predecir la estructura proteica correcta entre todas estas posibles combinaciones, combinaciones que involucran甚至 más átomos que los del universo. Así que, desde esta perspectiva, también es una "máquina infinita". Creo que esta es la conexión central entre ambos: cómo extraer resultados significativos de datos y posibilidades tan vastos.
AlphaFold es sin duda un logro muy importante y emblemático a nivel mundial. Entonces, ¿por qué DeepMind eligió hacerlo open source?
Por un lado, fue para ayudar al mundo y promover el progreso científico; por otro lado, también porque DeepMind consideró que poder crear AlphaFold se debía en gran medida a una comunidad científica acumulada a largo plazo.
Por ejemplo, la competición CASP, iniciada por el mundo académico, se celebra cada dos años, permitiendo a diferentes equipos de investigación competir en la predicción de estructuras proteicas. Antes de que DeepMind ganara en 2020, esta competición llevaba unos 18 años celebrándose.
Es decir, antes de que DeepMind resolviera este problema, todo el campo ya tenía una gran cantidad de trabajo de investigación básica. Por lo tanto, DeepMind también quiso agradecer devolviendo algo al mundo académico: abrieron el sistema AlphaFold para que todo el campo pudiera usar los resultados de las predicciones.
Si solo hubieran utilizado la investigación abierta de todos sin publicar la suya, moralmente no habría sido apropiado. Así que esta también es una de las razones importantes por las que eligieron el open source.
Por supuesto, también hay un factor práctico: en aplicaciones comerciales, como el desarrollo de fármacos, solo AlphaFold 2 (la versión que luego ganó el Premio Nobel) en realidad no es suficiente.
No solo necesitas saber la estructura de la proteína, sino también entender cómo interactúan las proteínas entre sí y con otras moléculas. Esto es precisamente lo que AlphaFold 3 y 4 intentan resolver.
Y AlphaFold 4 no es open source, es un sistema propietario. Esto también significa que se está moviendo gradualmente hacia una etapa de comercialización, por lo que DeepMind y Google eligieron mantenerlo internamente.
InfoQ: Tanto AlphaGo como AlphaFold son logros muy grandes. ¿Cómo elige DeepMind "temas que merecen una década de inversión"? ¿Qué criterios de juicio son replicables?
Mallaby: Demis often menciona un concepto llamado "Scientific Taste" (Gusto científico).
Tiene una intuición aguda: puede "olfatear" en el campo de la IA qué problemas pendientes, aunque extremadamente desafiantes, definitivamente resolverse si se esfuerzan durante dos años. Es extremadamente bueno haciendo estas apuestas estratégicas. Esta capacidad no solo proviene de su profunda comprensión de la frontera científica, sino también de que ve a través de la lógica operativa del grupo de científicos.
Una vez me contó una historia fascinante sobre AlphaFold.
En 2018, el equipo ya llevaba dos años investigando, el sistema que hicieron era el más potente del mundo, pero aún estaba lejos del objetivo final de predecir "todas las formas de proteínas". Solo era mejor que otras IA, pero aún lejos de resolver el problema. En ese momento, el responsable del equipo, Andrew Senior, incluso le dijo desanimado a Demis: "No podemos resolver este problema, es demasiado difícil. Hemos hecho todo lo posible, la versión 2018 del sistema funciona bien, ya lidera a toda la humanidad, pero por favor no nos obligues a predecir todas las proteínas de la naturaleza, eso es simplemente imposible".
Pero la intuición de Demis le decía que predecir todas las proteínas era posible. Para verificar su juicio, participó personalmente en cada seminario técnico del equipo de AlphaFold.
En las reuniones no hablaba mucho, sino que observaba con calma si la discusión del equipo era "fluida" (fluent).
La所谓的 "fluidez" se refería a si seguían surgiendo continuamente y rápidamente nuevas ideas de investigación. Demis creía que mientras la inspiración siguiera fluyendo, incluso si algunas ideas no parecían correctas en ese momento, mientras tuvieran la "capacidad de generar nuevas ideas", significaba que el espacio para el progreso científico estaba lejos de agotarse.
Basándose en esta observación, Demis decidió resistir la presión y rechazar cerrar el proyecto. No solo no escuchó el consejo de retirada del antiguo responsable, sino que cambió de líder, promoviendo al joven John Jumper.
Jumper estaba convencido de que el éxito estaba a la vista, y Demis le dio un apoyo incondicional. Dos años después, entregaron resultados de investigación suficientes para ganar el Premio Nobel.
Esta historia nos dice: como líder, no solo necesitas ese gusto científico para juzgar "qué puede tener éxito", sino que también debes aprender a sentarte en la sala de reuniones, captar esas chispas de colisión de pensamientos, escuchar el sonido del flujo de la inspiración.
InfoQ: AlphaGo y AlphaFold son solo experimentos de etapa en la ruta hacia AGI. ¿Está de acuerdo con esta afirmación?
Mallaby: Bueno, se puede decir así. Creo que ambos realmente promovieron el desarrollo de la ciencia de la inteligencia artificial. Y al final de este largo camino, estará la inteligencia artificial general (AGI).
Sin embargo, desde otra perspectiva, también se podría argumentar que el éxito de los grandes modelos de lenguaje proviene de otra ruta tecnológica en la investigación de IA, una ruta que no incluye el aprendizaje por refuerzo, por lo que es diferente a la ruta de AlphaGo.
Y también está somewhat separado de AlphaFold. AlphaFold确实使用了 Transformer 模型, pero era una forma especial de Transformer. La investigación relacionada con AlphaFold y Transformer se concentró大致 entre 2018 y 2020, más precisamente entre 2019 y 2020.
Al mismo tiempo, OpenAI ya estaba construyendo grandes modelos de lenguaje basados en la arquitectura Transformer. Por lo tanto, tiendo a ver esto como otra ruta tecnológica independiente en el progreso de la IA.
Así que,宏观上, cualquier avance importante en el campo de la IA promoverá el desarrollo futuro; pero desde una perspectiva más concreta de origen tecnológico, la ruta de nacimiento de los grandes modelos de lenguaje es relativamente independiente.
El panorama real de la competencia de AGI
InfoQ: Según su comprensión de la industria de la IA, ¿cuáles cree que son las diferencias centrales entre DeepMind, OpenAI y Anthropic?
Mallaby: En primer lugar, una gran diferencia radica en su relación con Google. Como dije antes, DeepMind tiene un gran apoyo financiero de Google, lo cual es una ventaja muy grande. Porque incluso hoy, el costo de entrenar estos modelos sigue siendo extremadamente alto, y los ingresos que generan en realidad no son muchos.
Así que en esta etapa, debes tener un apoyo financiero suficiente, y Demis tiene suerte de tener a Google respaldándolo. En comparación, Anthropic y OpenAI necesitan buscar constantemente inversores para financiarse, lo que ya es difícil de por sí: esta es una diferencia crucial.
Sin embargo, en otros aspectos, en realidad son muy similares. Por ejemplo, todos tienen sus propios grandes modelos de lenguaje, y el nivel general de estos modelos es muy alto. En diferentes momentos, uno puede liderar sobre los otros dos, pero este liderazgo es dinámico.
Si se mira sus diferencias desde otro ángulo, se puede partir de la "seguridad". Anthropic presta mucha atención a los problemas de seguridad, incluso hace poco tuvo una controversia con el Pentágono por el uso de IA en sistemas militares.
El desempeño de DeepMind en este aspecto es somewhat diferente. Creo que el propio Demis también valora la seguridad, incluyendo las aplicaciones militares, pero no ha tenido un enfrentamiento directo con el gobierno. Así que se podría decir que Anthropic es la empresa más dispuesta a asumir riesgos para impulsar el tema de la seguridad; DeepMind (y Google) están en el medio.
En cuanto a OpenAI, es interesante. Externamente,似乎 no enfatiza tanto la seguridad: por ejemplo, cuando Anthropic tuvo la controversia con el Pentágono, la actitud de OpenAI fue más bien: "No hay problema, podemos proporcionar IA".
Esto en cierto modo también se asemeja a su estrategia al lanzar ChatGPT: no les importa lanzar un producto que pueda tener riesgos, sino que eligen lanzarlo primero y iterar después. En comparación, tanto Anthropic como DeepMind han sido más cautelosos y no han lanzado algunos modelos.
Así que si hacemos una clasificación aproximada:
- Más agresivo (menos conservador): OpenAI
- Medio: Google DeepMind
- Más enfático en seguridad: Anthropic
Mencionas que OpenAI最近 reclutó al fundador del proyecto open source OpenClaw, Peter Steinberger, y preguntas si esto supondría una amenaza para Google o DeepMind, especialmente dado que OpenClaw está de moda ahora.
Creo que dentro de Google DeepMind, ya hay una gran cantidad de investigadores excelentes trabajando en agentes. Incluso reclutando a alguien que hizo OpenClaw, es poco probable que cambie fundamentalmente todo el panorama competitivo.
Otro punto clave: OpenClaw es确实 impresionante, pero también conlleva cierto riesgo. El verdadero desafío es crear un sistema que sea tanto potente como seguro; solo así tendrá un verdadero valor de aplicación a gran escala. Y en cuanto a si Peter podrá lograrlo, en realidad aún no se puede determinar.
InfoQ: Google, OpenAI, xAI, Anthropic y empresas chinas como DeepSeek, Alibaba, Tencent, etc. ¿Quién cree que está más cerca de AGI?
Mallaby: La definición de AGI (Inteligencia Artificial General) siempre ha sido imprecisa; la gente en realidad no tiene un estándar unificado y claro.
Desde cierto ángulo, se puede entender así: estos excelentes grandes modelos de lenguaje actuales, en sí mismos, poseen "generalidad" (general), "artificialidad" (artificial) y un cierto grado de "inteligencia" (intelligent). Por lo tanto,也有人认为, en cierto sentido, la AGI ya ha aparecido.
Pero esto depende esencialmente de cómo definas la AGI.
Una forma más pragmática de entenderlo es: la AGI debería ser una máquina extremadamente útil en el mundo real, especialmente en entornos comerciales, capaz de realizar trabajos que antes hacían los humanos. En otras palabras, no es solo "inteligente", sino "capaz de trabajar".
En esta dimensión, se pueden ver algunos avances muy concretos. Por ejemplo, sistemas como Claude Code ya pueden escribir código de manera muy eficiente, hasta el punto de que la estructura de demanda de programadores en las empresas puede cambiar: antes可能需要 20 ingenieros, en el futuro quizás solo 10, porque la mitad del código lo hace el modelo.
Por supuesto, esta no es una capacidad exclusiva de una sola empresa. Otras empresas también están haciendo cosas similares: como OpenAI Codex, y el propio modelo de generación de código de Google DeepMind; algunos modelos chinos también se desempeñan bien en la generación de código.
Así que la pregunta se convierte en: ¿quién es el mejor ahora? Quizás en este momento se pueda decir que es Claude, pero dentro de seis meses, es muy probable que el panorama cambie.
En otras palabras, en la cuestión de "estar cerca de la AGI", hemos entrado en una nueva etapa: la clave ya no es solo "tener o no", sino "quién es más práctico y tiene mayor capacidad de sustitución en qué tarea", y si esta capacidad puede mejorar de manera continua y estable.
InfoQ: Entonces, ¿cree que el avance hacia la AGI provendrá más probablemente de la escala del modelo o de nuevos algoritmos?
Mallaby: El progreso que hemos logrado hasta ahora es en realidad el resultado de la acción conjunta de múltiples aspectos.
Es importante entender: ya sea el progreso de Google, OpenAI o Anthropic, aunque确实 están ampliando continuamente la escala de capacidad computacional (scaling compute), esto no es todo. Al mismo tiempo, también están mejorando continuamente los algoritmos, optimizando la implementación de ingeniería y realizando diversas innovaciones tecnológicas; todo esto impulsa conjuntamente el desarrollo de toda la ciencia de la IA.
Así que, esencialmente, es un proceso impulsado por una combinación de "escala + tecnología". Y también creo que es muy probable que el futuro continúe con esta ruta combinada.
Por supuesto, ahora mucha gente discute una cuestión: ¿encontrará la escalabilidad de la capacidad computacional un cuello de botella? Mi opinión es que cada vez que la gente piensa que "la escalabilidad está llegando a su límite", aparece una nueva forma de escalar.
Por ejemplo, los primeros modelos base obtuvieron grandes mejoras al ampliar la escala de entrenamiento, pero luego este beneficio marginal puede comenzar a disminuir. Entonces, apareció una nueva ruta de escalado, como escalar los "modelos de inferencia" en la fase de inferencia, lo que trajo un nuevo espacio para mejorar el rendimiento.
Mirando hacia el futuro, quizás aparezcan nuevas dimensiones de escalado, como la escalabilidad de agentes o inteligencia embodied.
Por lo tanto, mi juicio es: la escalabilidad en sí no desaparecerá, solo seguirá apareciendo en formas cambiantes, y seguirá siendo una ventaja competitiva central que existirá a largo plazo.
Este artículo proviene del WeChat público "AI前线" (ID: ai-front), autor:冬梅, editor:蔡芳芳






