Demis Hassabis, PDG de DeepMind et père d'AlphaGo, mène des recherches sur l'IA à travers les jeux depuis plus de dix ans.
Cette fois, il a plongé l'IA dans un « univers vivant » qui fonctionne depuis 23 ans : EVE Online, un MMORPG spatial dont même le tutoriel peut décourager les nouveaux joueurs.
Un jeu d'échecs a une fin, pas EVE.
Début mai, DeepMind a annoncé un partenariat de recherche avec EVE Online, pour une raison simple : l'univers complexe et façonné par les joueurs d'EVE est le bac à sable parfait et sécurisé pour tester la mémoire, l'apprentissage continu et la planification à long terme de l'IA.
L'alliance entre DeepMind et EVE ne vise pas une expérience de jeu amusante ou l'amélioration du gameplay, mais à s'attaquer à trois défis majeurs reconnus comme les plus ardus dans la recherche sur les agents intelligents. Hassabis a placé son pari sur un vieux jeu de 23 ans.
Fenris Creations (anciennement CCP Games) annonce le partenariat avec DeepMind
L'entreprise derrière EVE Online a annoncé quatre choses le même jour, le 6 mai :
- Redevenir indépendante de la société mère Pearl Abyss ;
- Changer de nom pour Fenris Creations ;
- Finaliser une transaction de 1,2 milliard de dollars ;
- Google détenant une participation minoritaire dans Fenris Creations dans le cadre de cette indépendance, et lançant simultanément un partenariat de recherche avec Google DeepMind.
Hilmar Veigar Pétursson, PDG de Fenris Creations, a déclaré dans l'annonce :
Cette transition n'implique pas de licenciements ou de restructuration, l'équipe, les produits et les plans de développement restent inchangés. EVE continue.
D'après les chiffres opérationnels, l'entreprise aborde cette collaboration avec de « vraies munitions », et non pour vendre ses actifs par nécessité.
EVE Online a généré un chiffre d'affaires supérieur à 70 millions de dollars en 2025, battant un record de revenus en novembre, le quatrième trimestre devenant le deuxième plus rentable de l'histoire du jeu sur 20 ans.
L'indépendance de Fenris Creations signifie qu'EVE a désormais une société mère capable de décider librement des collaborations de recherche, sans être entravée par les objectifs stratégiques d'un grand éditeur de jeux.
Boîte de jeu de société publiée par Fenris en 1997. Le nom « Fenris » précède EVE Online de six ans. Le changement de nom pour Fenris Creations est un retour aux sources, pas un nouveau départ.
Pourquoi DeepMind a-t-il choisi EVE ?
Une « société artificielle » de 23 ans
Difficile à reproduire dans les benchmarks IA
Beaucoup, entendant « jeux + recherche IA », pensent à AlphaGo ou AlphaStar, mais EVE est différent.
Le Go et StarCraft ont un point commun : une partie a un début, une fin, des règles de victoire claires.
L'objectif d'AlphaGo était de gagner une partie, celui d'AlphaStar de gagner un match StarCraft. C'était le paradigme de « l'intelligence par partie ». Mais EVE n'a pas de fin.
EVE Online est célèbre pour son « univers unique partagé » (single-shard / single shared universe), où de nombreux joueurs évoluent à long terme dans le même monde persistant pour rivaliser, commercer, s'allier et faire la guerre.
Les joueurs y ont établi de véritables systèmes économiques, alliances politiques, groupes militaires, routes commerciales, rancoeurs historiques et plans de guerre s'étalant sur des années.
Certaines batailles prennent une année entière entre la préparation et la conclusion. L'ascension et la chute de certaines alliances sont étudiées par les joueurs ultérieurs comme de l'histoire réelle.
Hilmar déclare dans l'annonce : « EVE est l'un des rares endroits où l'on peut explorer les problèmes d'intelligence dans un environnement qui fonctionne déjà comme le monde réel. »
Hassabis ajoute qu'il a grandi avec les jeux, que sa carrière a commencé par la conception de jeux de simulation IA, et que les recherches d'AlphaGo, AlphaStar et SIMA sont profondément liées aux jeux. EVE est le choix pour l'étape suivante :
Je suis ravi de collaborer avec Fenris Creations pour explorer en toute sécurité de nouvelles expériences de jeu et faire progresser la recherche sur l'IA dans cet univers sans précédent par sa complexité, façonné par les joueurs.
La plupart des benchmarks IA sont comme un examen médical, EVE ressemble plus à plonger l'IA dans une « société artificielle » qui dure depuis 23 ans.
Les 3 défis majeurs des agents intelligents
Sont le quotidien des joueurs d'EVE
Cette annonce liste clairement trois axes de recherche : la planification à long terme (long-horizon planning), la mémoire (memory) et l'apprentissage continu (continual learning).
Ces trois axes sont reconnus comme les trois défis les plus ardus dans le domaine de la recherche sur les agents intelligents.
Si vous connaissez quelqu'un qui joue à EVE Online depuis plus de dix ans, demandez-lui d'ouvrir son compte et de vous montrer sa liste d'amis. Vous verrez probablement des dizaines de groupes, des centaines de noms, avec des notes comme « dette de la campagne de Delve en 2018 », « traître interne à l'alliance Goonswarm, ne pas coopérer », « ce type est un espion, tout le monde dans l'organisation le sait ».
Ce n'est pas une fenêtre de contexte, c'est une mémoire à long terme multi-sessions, datant d'au moins dix ans.
Les joueurs d'EVE font face à ce défi de la mémoire quotidiennement, tout comme celui de l'apprentissage continu.
En janvier 2014, la bataille de B-R5RB dura environ 21 heures, impliquant plus de 7500 personnages, 75 Titans détruits, pour des pertes équivalant à environ 300 000 dollars. L'étincelle de la bataille fut le non-paiement automatique d'une facture de souveraineté.
Après cette bataille, toute la tactique des flottes du jeu fut réécrite. Les alliances ont révisé pendant des années leurs compositions de flottes et leurs systèmes tactiques. Des mises à jour avaient lieu chaque mois, chaque échec étant décomposé en enseignements stratégiques.
Quant à la planification à long terme, l'unité de temps standard d'une guerre d'alliance dans EVE n'est pas l'heure, c'est le mois. Une guerre interstellare, de la préparation au déclenchement, incluant la construction de vaisseaux, le transport, la diplomatie, l'infiltration, la contre-espionnage, implique la collaboration spontanée de centaines de joueurs, avançant pendant des mois vers un objectif commun.
Ce système de collaboration est né spontanément en 23 ans chez les joueurs.
Les trois défis considérés comme les plus durs dans l'évaluation des agents intelligents actuels sont justement le quotidien des joueurs d'EVE.
L'évolution pilotée par les joueurs sur 23 ans dans EVE a produit un environnement toujours changeant, toujours complexe, sans raccourci. Ce niveau de complexité est impossible à synthétiser en laboratoire.
SIMA 2, publié par DeepMind en novembre 2025, était déjà passé de « l'exécution d'instructions » à « la compréhension des objectifs, le raisonnement sur les processus, l'apprentissage en jouant ».
En termes de problématique de recherche, le projet EVE s'inscrit dans la même ligne que SIMA 2, « le jeu comme terrain d'entraînement pour les agents intelligents », mais cette fois, le terrain est un univers réel en fonctionnement continu depuis 23 ans.
Image d'une bataille dans EVE Online. Ces batailles massives, organisées spontanément par les joueurs et durent souvent plusieurs heures, sont la raison principale pour laquelle DeepMind a choisi EVE comme scénario d'étude pour la planification à long terme et l'apprentissage continu.
DeepMind entre dans un bac à sable hors ligne
Pas dans l'univers des joueurs
La forme de collaboration entre DeepMind et Fenris est plus prudente qu'imaginié. DeepMind n'a pas obtenu l'accès direct aux serveurs officiels actifs avec les joueurs.
DeepMind déclare officiellement dans son annonce : la recherche initiale se déroulera sur une version hors ligne d'EVE Online, utilisant des serveurs locaux, dans un environnement contrôlé pour tester et évaluer les modèles, sans connexion aux serveurs opérationnels officiels d'EVE Online.
D'une part, la version hors ligne signifie que DeepMind n'utilisera pas les données de combat des joueurs actifs, ni ne perturbera l'économie réelle des serveurs, évitant ainsi toute complexité liée à la confidentialité et la conformité.
D'autre part, la version hors ligne d'EVE conserve le système de règles complexe, les mécanismes des vaisseaux et de l'économie, la structure des systèmes stellaires, etc.
DeepMind obtient un monde complexe « testé en contrainte par 23 ans de joueurs », comme terrain d'examen pour la survie de ses agents intelligents.
D'Atari à EVE
Où mène cette voie
En revenant sur les choix des terrains d'entraînement de DeepMind ces dix dernières années, on voit une ligne d'évolution claire.
De 2013 à 2015, Atari était le point de départ. Le DQN plaçait les agents dans des jeux aux règles fermées comme Breakout ou Space Invaders. L'évaluation portait sur la réaction et l'estimation de valeur.
De 2016 à 2017, AlphaGo et AlphaZero. Les règles du Go sont strictes, l'espace d'actions est vaste mais fermé. L'évaluation portait sur la recherche et le raisonnement enchaîné.
En 2019, AlphaStar entra dans StarCraft II. Première entrée dans un environnement en temps réel, à information imparfaite, avec des jeux multi-agents. L'évaluation portait sur la prise de décision en temps réel avec observation partielle.
En 2024, SIMA visait à créer un agent intelligent générique pour plusieurs jeux. L'évaluation portait sur la généralisation et le transfert.
En 2025, SIMA 2 évolue : non seulement il exécute des instructions, mais il peut aussi dialoguer avec l'utilisateur, raisonner sur des objectifs, et s'améliorer en cours de jeu.
SIMA 2, publié par DeepMind en 2025, est passé de « l'exécution d'instructions » à « la compréhension des objectifs, le raisonnement sur les processus, l'apprentissage en jouant ».
Chaque génération d'environnement ajoute des caractéristiques du « monde réel » : des règles fermées aux règles ouvertes, de l'information parfaite à l'information imparfaite, de l'affrontement par partie au transfert entre parties.
Mais ces environnements restaient relativement fermés, segmentables, et évaluables de manière répétée, comme les jeux d'arcade Atari aux règles fixes, les parties de StarCraft pour AlphaStar, ou les multiples environnements 3D pour tester la généralisation inter-jeux de SIMA.
La différence d'EVE est qu'il s'agit d'un monde persistant, fonctionnant en continu, façonné par les joueurs, où les structures économiques et politiques évoluent sans cesse.
C'est un monde qui a évolué spontanément sur 23 ans, par l'action de joueurs réels dans un univers aux règles ouvertes : une économie complète pilotée par les joueurs (les fluctuations des prix ISK rivalisent avec les marchés financiers réels), des structures politiques inter-alliances (diplomatie, espionnage, accords de cessez-le-feu), tout un écosystème de guerre allant des escarmouches aux batailles de 21 heures.
Le consensus dans le domaine sur l'évaluation des agents intelligents est de plus en plus clair : les scores sur des tâches ponctuelles n'apportent plus grand-chose de nouveau. Mais la mémoire à long terme, la planification sur plusieurs semaines, l'apprentissage à partir des échecs, n'ont jamais eu de terrain d'évaluation digne de ce nom.
C'est pourquoi le choix de DeepMind cette fois est le suivant : plutôt que de recréer un environnement synthétique, autant entrer dans une « société artificielle » qui a déjà été testée en contrainte par 23 ans de joueurs humains.
Mais une question plus vaste émerge alors :
Un agent intelligent capable d'exister, d'apprendre et de planifier en continu dans EVE, que lui manque-t-il pour devenir un agent intelligent opérant de manière autonome dans le monde réel ?
Références :
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Cet article provient du compte WeChat public « 新智元 », auteur : ASI启示录, éditeur : 元宇











