Demis Hassabis, CEO de DeepMind y padre de AlphaGo, lleva más de una década utilizando videojuegos para la investigación en IA.
Esta vez, ha metido a la IA en un "universo vivo" que lleva funcionando 23 años: EVE Online, un videojuego espacial multijugador online que incluso su tutorial puede hacer que los jugadores se rindan.
Un juego de Go tiene final, EVE no.
A principios de mayo, DeepMind anunció oficialmente una colaboración de investigación con EVE Online. La razón es simple: el universo complejo y dirigido por jugadores de EVE es la caja de arena perfecta y segura para probar la memoria, el aprendizaje continuo y la planificación a largo plazo de la IA.
DeepMind se asocia con EVE, no para buscar una experiencia de juego interesante o potenciar su jugabilidad, sino para abordar lo que se consideran los tres mayores retos en la investigación actual de agentes de IA. Hassabis apuesta la respuesta en un videojuego veterano con 23 años de historia.
Fenris Creations (anteriormente CCP Games) anuncia su colaboración con DeepMind
La empresa detrás de EVE Online anunció cuatro cosas el mismo día, 6 de mayo:
- Se independiza nuevamente del grupo de su empresa matriz, Pearl Abyss;
- Cambia su nombre a Fenris Creations;
- Completa una transacción de 120 millones de dólares;
- Como parte de esta independencia, Google adquiere una participación minoritaria en Fenris Creations y simultáneamente inicia una colaboración de investigación con Google DeepMind.
Hilmar Veigar Pétursson, CEO de Fenris Creations, afirmó en el anuncio:
Esta transformación no implica despidos ni reestructuraciones. El equipo, los productos y los planes de desarrollo se mantienen. EVE continúa.
Mirando las cifras operativas, esta empresa llega a la mesa de colaboración con "artillería real", no vendiendo activos para sobrevivir.
EVE Online superó los 70 millones de dólares en ingresos en 2025, batiendo un récord histórico de ingresos en noviembre, y el cuarto trimestre se convirtió en el segundo trimestre de mayor ingresos en los 20 años de historia del juego.
Que Fenris Creations se independice significa que EVE ahora tiene una empresa matriz capaz de decidir autónomamente sobre colaboraciones de investigación, sin estar supeditada a los objetivos estratégicos de una empresa editora de videojuegos más grande.
Caja de productos de juegos de mesa publicados por Fenris en 1997. El nombre "Fenris" es 6 años más antiguo que EVE Online. Cambiar el nombre a Fenris Creations es un retorno a los orígenes, no empezar de cero.
¿Por qué DeepMind eligió EVE?
23 años de "sociedad artificial"
Dificultad de replicar los puntos de referencia de IA
Muchas personas, al oír "videojuegos + investigación en IA", piensan inmediatamente en AlphaGo o AlphaStar. EVE es diferente de ambos.
El Go y StarCraft comparten una característica: una partida tiene un comienzo, un final y reglas de victoria y derrota claras.
El objetivo de AlphaGo era ganar partidas de Go, el de AlphaStar ganar un enfrentamiento en StarCraft. Ambos siguen el paradigma de investigación de la "inteligencia por partida". Pero EVE no tiene un final.
EVE Online es conocido por su "universo único compartido" (single-shard / single shared universe), donde un gran número de jugadores compiten, comercian, se alían y hacen la guerra a largo plazo en un mundo persistente.
Los jugadores han construido aquí un sistema económico real, alianzas políticas, grupos militares, rutas comerciales, rencores históricos y planes de guerra que abarcan años.
Algunas batallas tardan un año entero desde su preparación hasta su conclusión. El ascenso y la caída de algunas alianzas son estudiados por jugadores posteriores como historia real.
Hilmar dijo en el anuncio: "EVE es uno de los pocos lugares donde se pueden explorar problemas de inteligencia en un entorno que ya funciona como el mundo real".
Hassabis comentó que desde niño juega videojuegos, que el punto de partida de su carrera fue diseñar videojuegos de simulación con IA, y que las investigaciones de AlphaGo, AlphaStar y SIMA están profundamente vinculadas a los videojuegos. EVE es la elección para la siguiente etapa:
Estoy encantado de colaborar con Fenris Creations para explorar de forma segura nuevas experiencias de juego y avanzar en la investigación de IA dentro de este universo sin parangón en complejidad, construido por jugadores.
La mayoría de los puntos de referencia (benchmarks) de IA son como exámenes médicos. EVE es más bien como meter a la IA en una "sociedad artificial" que ya lleva 23 años en funcionamiento.
Los 3 retos más difíciles para los agentes inteligentes
Son justo el día a día de los jugadores de EVE
Esta vez, las tres líneas de investigación se enumeran explícitamente: planificación de largo alcance (long-horizon planning), memoria (memory) y aprendizaje continuo (continual learning).
Estas tres direcciones son consideradas los 3 mayores retos en el campo actual de la investigación de agentes de IA.
Si conoces a alguien que haya jugado a EVE Online durante más de diez años, pídele que abra su cuenta y te muestre su lista de amigos. Es muy probable que veas docenas de grupos, cientos de nombres, con notas que dicen: "Deuda de la batalla de Delve de 2018", "Traidor interno de la alianza Goonswarm, no cooperar", "Este tipo es un espía, todo el grupo lo sabe".
Esto no es una ventana de contexto, es memoria a largo plazo entre sesiones que empieza en una década.
El reto de la memoria, los jugadores de EVE lo superan a diario. Lo mismo ocurre con el aprendizaje continuo.
En enero de 2014, la batalla de B-R5RB duró unas 21 horas, con más de 7500 personajes participantes. Se destruyeron 75 Titanes, con pérdidas equivalentes a unos 300.000 dólares en dinero real. La chispa que desencadenó toda la batalla fue una factura de soberanía que no se pagó automáticamente.
Después de esa batalla, las tácticas de flota de todo el juego se reescribieron. Las configuraciones de flota y los sistemas tácticos de las alianzas en los años siguientes evolucionaron completamente basándose en el análisis posterior de esa batalla. Se actualizaban cada mes, cada fracaso se descomponía en actualizaciones estratégicas ejecutables.
En cuanto a la planificación de largo alcance, la unidad de tiempo estándar para una guerra entre alianzas en EVE no es la hora, es el mes. Una guerra interestelar, desde su preparación hasta su inicio —construcción de naves, transporte, diplomacia, infiltración, contraespionaje—, donde cientos de jugadores colaboran de forma espontánea sin ninguna coordinación de misiones, avanzando hacia un objetivo común a lo largo de meses.
Este sistema de colaboración surgió por sí mismo a lo largo de 23 años por parte de los propios jugadores.
Lo que actualmente se consideran los 3 mayores retos en la evaluación de agentes de IA son justo el día a día de los jugadores de EVE.
Los 23 años de evolución dirigida por los jugadores en EVE han generado un entorno que está en constante cambio, siempre complejo y sin atajos, una complejidad que no se puede sintetizar artificialmente en un laboratorio.
SIMA 2, publicado por DeepMind en noviembre de 2025, ya ha evolucionado desde "ejecutar instrucciones" hacia "comprender objetivos, razonar procesos, aprender mientras juega".
Desde el punto de vista del problema de investigación, el proyecto EVE y SIMA 2 pertenecen a la misma línea: "el videojuego como campo de entrenamiento para agentes inteligentes". La diferencia es que esta vez el campo se cambia por un universo real que ha estado funcionando durante 23 años.
Imagen de una batalla dentro de EVE Online. Este tipo de enfrentamientos masivos, organizados espontáneamente por jugadores y que a menudo duran horas, es la razón central por la que DeepMind eligió EVE como escenario de investigación para la planificación de largo alcance y el aprendizaje continuo.
DeepMind entra en una caja de arena offline
No en el universo de jugadores activos
La forma de colaboración de DeepMind con Fenris esta vez es más conservadora de lo que se podría pensar. DeepMind no obtiene permiso para conectarse directamente al servidor oficial con jugadores activos.
DeepMind declaró oficialmente en el anuncio: la investigación inicial se realizará en una versión offline de EVE Online, utilizando servidores locales, en un entorno controlado para probar y evaluar modelos, sin conectarse a los servidores oficiales en línea de EVE Online.
Por un lado, la versión offline significa que DeepMind no consumirá datos de enfrentamientos de jugadores activos ni perturbará la economía real del servidor, evitando así cualquier complejidad de privacidad y cumplimiento.
Por otro lado, la versión offline de EVE aún puede conservar su complejo sistema de reglas, mecanismos de naves y economía, estructura de sectores estelares y otros diseños fundamentales.
DeepMind obtiene un mundo complejo "probado bajo presión durante 23 años por jugadores" como campo de examen donde el agente inteligente debe sobrevivir.
De Atari a EVE
¿Hacia dónde lleva este camino?
Mirando hacia atrás en la elección de los campos de entrenamiento de DeepMind durante estos más de diez años, hay una línea de evolución clara.
De 2013 a 2015, Atari fue el punto de partida. DQN metía al agente en juegos de arcade con reglas fijas y cerradas como "Breakout" o "Space Invaders". Evaluaba la reacción y la estimación de valor.
De 2016 a 2017, AlphaGo y AlphaZero. El Go tiene reglas ordenadas, un espacio de acciones enorme pero cerrado. Evaluaba la búsqueda y el razonamiento en cadenas largas.
En 2019, AlphaStar entró en "StarCraft II". Primer entorno en tiempo real, con información imperfecta y juego de múltiples frentes. Evaluaba la toma de decisiones en tiempo real bajo observación parcial.
En 2024, SIMA quería crear un agente inteligente genérico para múltiples juegos. Evaluaba la generalización y transferencia.
En 2025, SIMA 2 se actualizó: no solo ejecuta instrucciones, sino que también puede conversar con el usuario, razonar sobre objetivos y mejorarse a sí mismo durante el juego.
SIMA 2, publicado por DeepMind en 2025, ya ha evolucionado desde "ejecutar instrucciones" hacia "comprender objetivos, razonar procesos, aprender mientras juega".
Cada nueva generación de entorno añadió más del "aspecto del mundo real" respecto a la anterior: desde reglas cerradas a reglas abiertas, desde información perfecta a imperfecta, desde el enfrentamiento por partida a la transferencia entre partidas.
Sin embargo, estos entornos anteriores eran en su mayoría campos de tareas relativamente cerrados, divisibles y evaluables de forma repetible. Por ejemplo, Atari son juegos de arcade con reglas fijas, AlphaStar se enfrentaba a partidas de StarCraft que terminaban una a una, y SIMA probaba la generalización entre juegos en múltiples entornos virtuales en 3D.
La diferencia de EVE radica en que es un mundo persistente que funciona a largo plazo, dirigido por jugadores, con estructuras económicas y políticas en continua evolución.
Es un mundo que ha evolucionado de forma espontánea a lo largo de 23 años por parte de un grupo de jugadores reales en un mundo de reglas abiertas: una economía completa impulsada por jugadores (la fluctuación de precios de ISK es comparable a los mercados financieros reales), estructuras políticas entre alianzas (diplomacia, espionaje, acuerdos de alto el fuego), todo un ecosistema bélico que va desde conflictos a pequeña escala hasta batallas de 21 horas.
Existe un consenso creciente en el sector sobre la evaluación de agentes inteligentes: hace tiempo que no se pueden descubrir cosas nuevas solo con puntuaciones en tareas puntuales, pero para la memoria a largo plazo, la planificación que abarca semanas y el aprendizaje a partir de fracasos, no ha habido un campo de evaluación adecuado.
Por lo tanto, la elección de DeepMind esta vez es: en lugar de crear otro entorno sintético, entrar en una "sociedad artificial" que ya ha sido probada bajo presión por jugadores humanos durante 23 años.
Pero también surgen preguntas más importantes:
Un agente de IA que pueda existir, aprender y planificar de forma continua en EVE, ¿qué le falta para ser equivalente a un agente inteligente que opere de forma autónoma en el mundo real?
Referencias:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Este artículo procede del WeChat Official Account "新智元" (New Wisdom), autor: ASI启示录, editor: 元宇











