Demis Hassabis, CEO DeepMind dan Bapak AlphaGo, telah lebih dari sepuluh tahun menggunakan permainan untuk penelitian AI.
Kali ini, ia melempar AI ke 'alam semesta hidup' yang telah berjalan selama 23 tahun: sebuah MMORPG luar angkasa bernama EVE Online yang bahkan tutorial pemula pun bisa membuat pemain menyerah.
Permainan papan memiliki akhir, EVE tidak.
Awal Mei, DeepMind mengumumkan kolaborasi penelitian dengan EVE Online, alasannya sederhana: alam semesta EVE yang kompleks dan digerakkan pemain adalah sandbox yang aman dan sempurna untuk menguji memori, pembelajaran berkelanjutan, dan perencanaan jangka panjang AI.
DeepMind bekerja sama dengan EVE bukan untuk mengejar pengalaman bermain yang menarik atau memberdayakan gameplay, melainkan untuk mengatasi tiga tantangan terberat yang diakui dalam penelitian agen cerdas AI saat ini. Hassabis mempertaruhkan jawabannya pada sebuah game lawas yang telah beroperasi selama 23 tahun ini.
Fenris Creations (dulunya CCP Games) mengumumkan kerja sama dengan DeepMind
Perusahaan di balik EVE Online, pada hari yang sama (6 Mei), mengumumkan empat hal:
- Kembali independen dari induk perusahaan Pearl Abyss;
- Berganti nama menjadi Fenris Creations;
- Menyelesaikan transaksi senilai $120 juta;
- Sebagai bagian dari kemerdekaan ini, Google memegang kepemilikan minoritas di Fenris Creations, dan secara bersamaan memulai kolaborasi penelitian dengan Google DeepMind.
CEO Fenris Creations, Hilmar Veigar Pétursson, menyatakan dalam pengumuman:
Transformasi ini tidak melibatkan PHK atau restrukturisasi, tim, produk, dan rencana pengembangan tetap sama. EVE terus berjalan.
Dilihat dari angka operasional, perusahaan ini datang dengan 'amunisi nyata' untuk kerja sama, bukan menjual aset untuk bertahan hidup.
Pendapatan EVE Online tahun 2025 melebihi $70 juta, mencetak rekor pendapatan tertinggi sepanjang masa pada November, dan Q4 menjadi kuartal dengan pendapatan tertinggi kedua dalam 20 tahun sejarah game tersebut.
Kemerdekaan Fenris Creations berarti EVE sekarang memiliki perusahaan induk yang dapat memutuskan kolaborasi penelitian secara mandiri, tidak lagi dibajak oleh tujuan strategis perusahaan penerbit game yang lebih besar.
Kotak produk board game yang diterbitkan Fenris tahun 1997. Nama "Fenris" ini bahkan lebih tua 6 tahun dari EVE Online. Berganti nama menjadi Fenris Creations adalah langkah mundur ke masa lalu, bukan memulai dari awal.
Mengapa DeepMind memilih EVE?
"Masyarakat Buatan" 23 Tahun
Benchmark AI Sulit Direplikasi
Banyak orang ketika mendengar 'permainan + penelitian AI', refleks pertama adalah mengingat AlphaGo atau AlphaStar, EVE berbeda dengan mereka semua.
Go (Weiqi) dan StarCraft memiliki kesamaan: satu putaran permainan memiliki awal, akhir, dan aturan kemenangan/kekalahan yang jelas.
Tujuan AlphaGo adalah memenangkan permainan papan, tujuan AlphaStar adalah memenangkan pertandingan StarCraft, keduanya adalah paradigma penelitian 'kecerdasan per-putaran'. Namun, EVE tidak memiliki akhir.
EVE Online terkenal dengan "single-shared universe" (alam semesta bersama tunggal), di mana banyak pemain bersaing, berdagang, bersekutu, dan berperang dalam dunia yang persisten dan berjalan lama.
Pemain di sini telah membangun sistem ekonomi nyata, aliansi politik, kelompok militer, rute perdagangan, dendam sejarah, dan rencana perang lintas tahun.
Beberapa pertempuran dari persiapan hingga penutupan membutuhkan waktu satu tahun penuh. Bangkit dan runtuhnya beberapa aliansi dipelajari oleh pemain kemudian sebagai sejarah nyata.
Hilmar dalam pengumumannya berkata: "EVE adalah salah satu dari sedikit tempat di mana kita dapat mengeksplorasi masalah kecerdasan dalam lingkungan yang sudah beroperasi seperti dunia nyata."
Hassabis bahkan menyebutkan bahwa dirinya bermain game sejak kecil, titik awal karirnya adalah merancang game simulasi AI, penelitian AlphaGo, AlphaStar, dan SIMA terikat erat dengan game, dan EVE adalah pilihan untuk tahap selanjutnya:
Saya sangat senang dapat bekerja sama dengan Fenris Creations untuk menjelajahi pengalaman bermain baru dan memajukan penelitian AI dengan aman di alam semesta yang dibangun oleh pemain ini, dengan tingkat kompleksitas yang tak tertandingi.
Sebagian besar benchmark AI seperti pemeriksaan kesehatan, EVE lebih seperti melempar AI ke dalam 'masyarakatakat buatan' yang telah berjalan selama 23 tahun.
3 Tantangan Terberat Agen Cerdas
Tepatnya Adalah Keseharian Pemain EVE
Kali ini, pihak resmi dengan jelas menyebutkan tiga arah penelitian: perencanaan jangka panjang (long-horizon planning), memori (memory), dan pembelajaran berkelanjutan (continual learning).
Tiga arah ini adalah 3 tantangan terberat yang diakui secara luas di bidang penelitian agen cerdas AI saat ini.
Jika di sekitar Anda ada yang pernah bermain EVE Online lebih dari sepuluh tahun, minta dia membuka akun dan lihat daftar temannya. Kemungkinan besar Anda akan melihat puluhan grup, ratusan nama, dengan kolom catatan bertuliskan "hutang dari Pertempuran Delve 2018", "pengkhianat dalam aliansi Goonswarm, jangan kerja sama", "orang ini mata-mata, semua orang di organisasi tahu".
Ini bukan konteks jendela (context window), ini adalah memori jangka panjang lintas-sesi yang dimulai dari sepuluh tahun.
Tantangan memori ini, pemain EVE lalui setiap hari, begitu juga dengan tantangan pembelajaran berkelanjutan.
Pada Januari 2014, Pertempuran B-R5RB berlangsung sekitar 21 jam, melibatkan lebih dari 7500 karakter, 75 Titan hancur, kerugian setara dengan mata uang nyata sekitar $300,000. Pemicu seluruh pertempuran ini adalah kegagalan pembayaran otomatis sebuah tagihan kedaulatan.
Setelah pertempuran ini selesai, seluruh taktik armada di game ditulis ulang. Konfigurasi armada dan sistem taktik aliansi-aliansi dalam beberapa tahun berikutnya semuanya berputar di sekitar iterasi berdasarkan analisis ulang (post-mortem). Diubah setiap bulan, setiap kegagalan dipecah menjadi pembaruan strategi yang dapat dieksekusi.
Adapun perencanaan jangka panjang, unit waktu standar perang aliansi di EVE bukan jam, tetapi bulan. Sebuah perang lintas wilayah (star system) dari persiapan hingga pecah, membangun kapal, transportasi, diplomasi, penyusupan, kontra-intelijen, ratusan pemain berkolaborasi secara spontan tanpa penjadwalan tugas apa pun, memajukan sebuah tujuan bersama selama berbulan-bulan.
Sistem kolaborasi ini tumbuh sendiri dari para pemain dalam 23 tahun.
3 tantangan terberat yang dianggap paling sulit dalam evaluasi agen cerdas AI saat ini, kebetulan adalah keseharian pemain EVE.
Evolusi yang digerakkan pemain selama 23 tahun di EVE telah menciptakan lingkungan yang selalu berubah, selalu kompleks, tanpa jalan pintas, kompleksitas seperti ini tidak dapat disintesis secara buatan di laboratorium.
SIMA 2 yang dirilis DeepMind pada November 2025, telah berkembang dari "mengeksekusi instruksi" menjadi "memahami tujuan, bernalar proses, belajar sambil bermain".
Dilihat dari masalah penelitian, proyek EVE dan SIMA 2 berada di jalur yang sama: "game sebagai arena pelatihan agen cerdas". Bedanya, kali ini arenanya diganti menjadi alam semesta nyata yang telah beroperasi selama 23 tahun.
Adegan pertempuran dalam game EVE Online. Pertempuran skala besar yang diorganisir secara spontan oleh pemain dan sering berlangsung berjam-jam seperti ini adalah alasan inti DeepMind memilih EVE sebagai skenario penelitian perencanaan jangka panjang dan pembelajaran berkelanjutan.
DeepMind Masuk ke Sandbox Offline
Bukan Alam Semesta Pemain Aktif
Cara kerja sama DeepMind dengan Fenris kali ini lebih konservatif dari yang dibayangkan. DeepMind tidak mendapatkan izin akses langsung ke server resmi yang berisi pemain aktif.
DeepMind secara resmi menyatakan dalam pengumuman: penelitian awal akan dilakukan pada versi offline EVE Online, menggunakan server lokal, menguji dan mengevaluasi model dalam lingkungan terkendali, tidak terhubung ke server operasional resmi EVE Online.
Di satu sisi, versi offline berarti DeepMind tidak akan mengonsumsi data pertempuran pemain aktif, juga tidak akan mengganggu ekonomi server yang sebenarnya, ini menghindari kompleksitas privasi dan kepatuhan apa pun.
Di sisi lain, versi offline EVE masih dapat mempertahankan sistem aturan yang kompleks, mekanisme kapal dan ekonomi, struktur wilayah bintang, dan desain inti lainnya.
DeepMind mendapatkan sebuah dunia kompleks yang telah 'diuji tekanan oleh pemain selama 23 tahun', sebagai ujian bagi agen cerdas untuk bertahan hidup.
Dari Atari ke EVE
Ke Mana Jalan Ini Menuju
Melihat kembali pilihan arena pelatihan DeepMind selama lebih dari sepuluh tahun ini, ada garis evolusi yang sangat jelas.
2013 sampai 2015, Atari adalah titik awal. DQN memasukkan agen cerdas ke dalam game seperti "Breakout", "Space Invaders" yang levelnya jelas dan aturannya tertutup. Menguji reaksi dan estimasi nilai.
2016 sampai 2017, AlphaGo dan AlphaZero. Aturan Go rapi, ruang aksi besar tetapi tertutup. Menguji pencarian dan penalaran rantai panjang.
2019, AlphaStar masuk ke "StarCraft 2". Pertama kali masuk ke lingkungan waktu nyata, informasi tidak sempurna, permainan multi-saluran. Menguji pengambilan keputusan waktu nyata dengan observasi parsial.
2024, SIMA ingin membuat agen cerdas umum yang dapat bermain di banyak game. Menguji generalisasi transfer.
2025, SIMA 2 ditingkatkan: tidak hanya mengeksekusi instruksi, tetapi juga dapat berbicara dengan pengguna, bernalar tujuan, memperbaiki diri selama proses bermain.
SIMA 2 yang dirilis DeepMind tahun 2025, telah berkembang dari "mengeksekusi instruksi" menjadi "memahami tujuan, bernalar proses, belajar sambil bermain"
Setiap generasi lingkungan, memiliki lebih banyak 'ciri dunia nyata' dibanding generasi sebelumnya: dari aturan tertutup ke aturan terbuka, dari informasi sempurna ke informasi tidak sempurna, dari pertandingan per-putaran ke transfer lintas-putaran.
Tapi lingkungan-lingkungan sebelumnya sebagian besar masih merupakan arena tugas yang relatif tertutup, dapat dipisah-pisah, dapat dievaluasi berulang, misalnya Atari adalah game arcade dengan aturan tetap, AlphaStar menghadapi pertandingan StarCraft yang berakhir per-putaran, SIMA menguji generalisasi lintas game di beberapa lingkungan virtual 3D.
Perbedaan EVE terletak pada kenyataan bahwa ia adalah dunia persisten yang berjalan lama, digerakkan pemain, dengan struktur ekonomi dan politik yang terus berevolusi.
Dunia ini berevolusi selama 23 tahun, melalui sekelompok pemain nyata dalam dunia dengan aturan terbuka yang muncul secara spontan: ekonomi lengkap yang digerakkan pemain (fluktuasi harga ISK mirip pasar keuangan nyata), struktur politik lintas aliansi (diplomasi, spionase, perjanjian gencatan senjata), seluruh ekosistem perang dari konflik skala kecil hingga pertempuran 21 jam.
Konsensus dalam lingkaran tentang evaluasi agen cerdas semakin jelas, nilai benchmark (skor) untuk tugas-tugas tunggal sudah tidak bisa menghasilkan sesuatu yang baru, tetapi memori jangka panjang, perencanaan lintas minggu, belajar dari kegagalan, belum memiliki arena evaluasi yang memadai.
Jadi, pilihan DeepMind kali ini adalah: daripada membuat lagi lingkungan sintetis, lebih baik masuk ke dalam sebuah 'masyarakat buatan' yang telah diuji tekanan oleh pemain manusia selama 23 tahun.
Tapi masalah yang lebih besar juga muncul:
Sebuah agen cerdas AI yang dapat terus ada, terus belajar, terus merencanakan di dalam EVE, apa bedanya dengan agen cerdas yang beroperasi secara mandiri di dunia nyata?
Referensi:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Artikel ini dari akun WeChat "Xin Zhi Yuan" (新智元), penulis: ASI启示录, editor: Yuan Yu (元宇)











