CEO của DeepMind, Demis Hassabis - cha đẻ của AlphaGo, đã dành hơn một thập kỷ nghiên cứu AI thông qua game.
Lần này, ông ấy đưa AI vào một "vũ trụ sống" đã tồn tại 23 năm: EVE Online, một trò chơi nhập vai không gian trực tuyến phức tạp đến mức có thể làm nản lòng ngay cả những người chơi mới.
Cờ vây có hồi kết, EVE thì không.
Đầu tháng 5, DeepMind thông báo hợp tác nghiên cứu với EVE Online, lý do rất đơn giản: Vũ trụ phức tạp và do người chơi thúc đẩy của EVE là môi trường sandbox an toàn hoàn hảo để kiểm tra trí nhớ, học tập liên tục và lập kế hoạch dài hạn của AI.
DeepMind hợp tác với EVE, không phải để theo đuổi trải nghiệm chơi game thú vị, hay để nâng cao lối chơi, mà là để xử lý ba vấn đề được coi là khó nhất trong nghiên cứu tác tử AI hiện nay. Hassabis đặt cược câu trả lời vào một trò chơi cũ đã vận hành 23 năm.
Fenris Creations (tên cũ là CCP Games) thông báo hợp tác với DeepMind
Công ty đứng sau EVE Online, trong cùng ngày 6 tháng 5, đã thông báo bốn sự kiện:
- Tái độc lập khỏi hệ thống công ty mẹ Pearl Abyss;
- Đổi tên thành Fenris Creations;
- Hoàn tất giao dịch trị giá 1,2 tỷ USD;
- Google, như một phần của lần tái độc lập này, nắm giữ một số cổ phần thiểu số tại Fenris Creations, và đồng thời bắt đầu hợp tác nghiên cứu với Google DeepMind.
CEO của Fenris Creations, Hilmar Veigar Pétursson, tuyên bố trong thông báo:
Quá trình chuyển đổi này không liên quan đến việc sa thải hay tái cơ cấu, đội ngũ, sản phẩm, kế hoạch phát triển vẫn giữ nguyên. EVE tiếp tục.
Xét về con số vận hành, công ty này mang "vốn liếng thực sự" đến để hợp tác, chứ không phải bán tài sản để sinh tồn.
Doanh thu của EVE Online năm 2025 vượt quá 70 triệu USD, tháng 11 đạt kỷ lục doanh thu cao nhất lịch sử, quý 4 trở thành quý có doanh thu cao thứ hai trong lịch sử 20 năm của trò chơi này.
Việc Fenris Creations tách ra độc lập có nghĩa là EVE giờ đây có một công ty mẹ có thể tự quyết định hợp tác nghiên cứu, không còn bị ràng buộc bởi mục tiêu chiến lược của một công ty phát hành game lớn hơn.
Hộp sản phẩm trò chơi board game do Fenris xuất bản năm 1997. Cái tên "Fenris" xuất hiện sớm hơn EVE Online tới 6 năm. Việc đổi tên thành Fenris Creations là một lần hồi tưởng, không phải là một khởi đầu mới.
Tại sao DeepMind lại chọn EVE?
Xã hội nhân tạo 23 năm
Khó sao chép trong bài kiểm tra chuẩn AI
Nhiều người nghe đến "trò chơi + nghiên cứu AI", phản ứng đầu tiên là nhớ về AlphaGo hoặc AlphaStar, EVE khác với tất cả chúng.
Cờ vây và StarCraft có một đặc điểm chung: một ván đấu có bắt đầu, có kết thúc, có quy tắc thắng thua rõ ràng.
Mục tiêu của AlphaGo là thắng ván cờ, mục tiêu của AlphaStar là thắng một trận đấu StarCraft, đều thuộc mô hình nghiên cứu "trí tuệ đơn ván", nhưng EVE không có hồi kết.
EVE Online nổi tiếng với "vũ trụ chia sẻ duy nhất" (single-shard / single shared universe), số lượng lớn người chơi lâu dài cạnh tranh, giao thương, liên minh và chiến tranh trong cùng một thế giới bền vững.
Người chơi ở đây đã xây dựng nên hệ thống kinh tế thực, liên minh chính trị, tập đoàn quân sự, tuyến đường thương mại, mối thù lịch sử và kế hoạch chiến tranh xuyên năm tháng.
Một số chiến dịch mất cả năm để chuẩn bị và kết thúc. Sự trỗi dậy và sụp đổ của một số liên minh, được người chơi sau này nghiên cứu như lịch sử thực.
Hilmar tuyên bố: "EVE là một trong số ít nơi có thể khám phá các vấn đề trí tuệ trong một môi trường đã vận hành như thế giới thực."
Hassabis thậm chí còn chia sẻ, ông chơi game từ nhỏ, điểm khởi đầu sự nghiệp là thiết kế trò chơi mô phỏng AI, nghiên cứu của AlphaGo, AlphaStar và SIMA đều gắn chặt với game, và EVE là lựa chọn cho giai đoạn tiếp theo:
Tôi rất vui được hợp tác với Fenris Creations để khám phá một cách an toàn những trải nghiệm chơi game mới và thúc đẩy nghiên cứu AI trong vũ trụ do người chơi tạo nên, với độ phức tạp không thể so sánh này.
Hầu hết các bài kiểm tra chuẩn AI giống như khám sức khỏe, EVE giống như việc ném AI vào một "xã hội nhân tạo" đã tồn tại suốt 23 năm.
Ba điểm khó nhất của tác tử thông minh
Vừa khớp với cuộc sống hàng ngày của người chơi EVE
Lần này, họ đã liệt kê rõ ràng ba hướng nghiên cứu: Lập kế hoạch tầm xa (long-horizon planning), trí nhớ (memory), học tập liên tục (continual learning).
Ba hướng này được công nhận là 3 điểm khó nhất trong lĩnh vực nghiên cứu tác tử AI hiện nay.
Nếu bạn có người quen chơi EVE Online trên 10 năm, hãy để họ mở tài khoản cho bạn xem danh sách bạn bè, bạn rất có thể sẽ thấy hàng chục nhóm, hàng trăm cái tên, cột ghi chú viết "Nợ từ chiến dịch Delve 2018", "Kẻ phản bội trong Liên minh Goonswarm, không hợp tác", "Tên này là gián điệp, cả tổ chức đều biết".
Đây không phải là cửa sổ ngữ cảnh, mà là trí nhớ dài hạn xuyên phiên với điểm khởi đầu là mười năm.
Về trí nhớ, người chơi EVE vượt qua mỗi ngày, và việc học tập liên tục cũng vậy.
Tháng 1 năm 2014, trận chiến B-R5RB kéo dài khoảng 21 giờ, hơn 7500 nhân vật tham chiến, 75 chiếc Titan bị phá hủy, thiệt hại tương đương khoảng 300.000 USD tiền thật. Ngòi nổ của toàn bộ chiến dịch là một hóa đơn chủ quyền không được tự động thanh toán.
Sau trận chiến này, toàn bộ chiến thuật hạm đội trong game đều được viết lại. Cấu hình hạm đội, hệ thống chiến thuật của các liên minh trong những năm sau đó, đều được lặp lại xung quanh việc phân tích lại. Thay đổi mỗi tháng, mỗi thất bại đều bị chia nhỏ thành các cập nhật chiến lược có thể thực hiện.
Về lập kế hoạch dài hạn, đơn vị thời gian tiêu chuẩn cho chiến tranh liên minh trong EVE không phải là giờ, mà là tháng. Một cuộc chiến xuyên vùng sao, từ chuẩn bị đến nổ ra, đóng tàu, vận chuyển, ngoại giao, ẩn náu, phản gián, hàng trăm người chơi tự phát hợp tác trong khi không có bất kỳ lịch trình nhiệm vụ nào, tiến tới một mục tiêu chung xuyên tháng.
Hệ thống hợp tác này đã tự nảy sinh trong 23 năm bởi chính người chơi.
Ba điểm được coi là khó nhất trong đánh giá tác tử AI hiện nay, vừa khớp với cuộc sống hàng ngày của người chơi EVE.
Sự tiến hóa do người chơi thúc đẩy suốt 23 năm trong EVE đã tạo ra một môi trường luôn thay đổi, luôn phức tạp, không có đường tắt, phòng thí nghiệm không thể tổng hợp nhân tạo được độ phức tạp này.
SIMA 2 mà DeepMind phát hành vào tháng 11 năm 2025, đã tiến hóa từ "thực hiện chỉ thị" lên "hiểu mục tiêu, lập luận quá trình, vừa chơi vừa học".
Xét về vấn đề nghiên cứu, dự án EVE và SIMA 2 thuộc cùng tuyến "trò chơi như sân tập cho tác tử thông minh", khác biệt là lần này địa điểm được thay thế bằng một vũ trụ thực sự đã vận hành liên tục 23 năm.
Cảnh trận chiến trong game EVE Online. Những trận hội chiến quy mô lớn, kéo dài hàng giờ do người chơi tự tổ chức này, là lý do cốt lõi khiến DeepMind chọn EVE làm bối cảnh nghiên cứu lập kế hoạch tầm xa và học tập liên tục.
DeepMind tiến vào sandbox ngoại tuyến
Không phải vũ trụ người chơi chính thức
Cách thức hợp tác giữa DeepMind và Fenris lần này bảo thủ hơn tưởng tượng, DeepMind không nhận được quyền truy cập trực tiếp vào máy chủ chính thức với người chơi hiện tại.
DeepMind chính thức tuyên bố trong thông báo: Nghiên cứu ban đầu sẽ được tiến hành trên phiên bản ngoại tuyến của EVE Online, sử dụng máy chủ cục bộ, kiểm tra và đánh giá mô hình trong môi trường được kiểm soát, không kết nối với máy chủ vận hành chính thức của EVE Online.
Một mặt, phiên bản ngoại tuyến có nghĩa là DeepMind sẽ không sử dụng dữ liệu đấu của người chơi hiện tại, cũng không làm xáo trộn nền kinh tế máy chủ thực sự, điều này tránh được bất kỳ sự phức tạp nào về quyền riêng tư và tuân thủ.
Mặt khác, phiên bản ngoại tuyến của EVE vẫn có thể giữ lại hệ thống quy tắc phức tạp, cơ chế tàu và kinh tế, cấu trúc vùng sao, v.v., những thiết kế cốt lõi.
DeepMind nhận được một thế giới phức tạp "đã được kiểm tra áp lực bởi người chơi trong 23 năm", để làm nơi kiểm tra mà tác tử thông minh phải sinh tồn.
Từ Atari đến EVE
Con đường này dẫn đến đâu
Nhìn lại lựa chọn sân tập của DeepMind trong hơn chục năm qua, có thể thấy một đường tiến hóa rất rõ ràng.
Từ 2013 đến 2015, Atari là điểm khởi đầu. DQN đưa tác tử thông minh vào các trò chơi có cấp độ rõ ràng, quy tắc đóng như "Breakout", "Space Invaders". Kiểm tra phản ứng và ước tính giá trị.
2016 đến 2017, AlphaGo và AlphaZero. Quy tắc cờ vây gọn gàng, không gian hành động lớn nhưng đóng. Kiểm tra tìm kiếm và suy luận chuỗi dài.
2019, AlphaStar vào "StarCraft 2". Lần đầu tiên vào môi trường thời gian thực, thông tin không hoàn hảo, đa tuyến cờ bạc. Kiểm tra quyết định thời gian thực dưới sự quan sát một phần.
2024, SIMA muốn tạo tác tử thông minh chung xuyên nhiều trò chơi. Kiểm tra khả năng chuyển giao và khái quát hóa.
2025, SIMA 2 nâng cấp: không chỉ thực hiện chỉ thị, mà còn có thể trò chuyện với người dùng, lập luận mục tiêu, tự cải thiện trong quá trình chơi game.
SIMA 2 do DeepMind phát hành năm 2025, đã tiến hóa từ "thực hiện chỉ thị" lên "hiểu mục tiêu, lập luận quá trình, vừa chơi vừa học".
Mỗi thế hệ môi trường đều có thêm một số "đặc điểm của thế giới thực" so với thế hệ trước: từ quy tắc đóng sang quy tắc mở, từ thông tin hoàn hảo sang thông tin không hoàn hảo, từ đối kháng đơn ván sang chuyển giao xuyên ván.
Tuy nhiên, những môi trường trước đây phần lớn vẫn là sân nhiệm vụ tương đối đóng, có thể phân chia, có thể đánh giá lặp lại, ví dụ Atari là trò chơi arcade với quy tắc cố định, AlphaStar đối mặt với các trận đấu StarCraft kết thúc từng ván, SIMA kiểm tra khả năng khái quát hóa xuyên trò chơi trong nhiều môi trường 3D ảo.
Điểm khác biệt của EVE là nó là một thế giới bền vững, chạy dài hạn, do người chơi thúc đẩy, cấu trúc kinh tế và chính trị liên tục tiến hóa.
Nó được tiến hóa tự phát trong 23 năm, thông qua một nhóm người chơi thực trong một thế giới với quy tắc mở: nền kinh tế đầy đủ do người chơi thúc đẩy (biến động giá ISK tương tự thị trường tài chính thực), cấu trúc chính trị xuyên liên minh (ngoại giao, gián điệp, hiệp định đình chiến), toàn bộ hệ sinh thái chiến tranh từ xung đột quy mô nhỏ đến trận chiến 21 giờ.
Sự đồng thuận trong giới về đánh giá tác tử thông minh ngày càng rõ ràng, việc chạy điểm nhiệm vụ đơn lẻ từ lâu đã không còn gì mới mẻ, nhưng trí nhớ dài hạn, lập kế hoạch xuyên tuần, học từ thất bại, vẫn chưa có sân đánh giá phù hợp.
Vì vậy, lựa chọn của DeepMind lần này là: Thay vì tạo ra một môi trường tổng hợp khác, hãy bước vào một "xã hội nhân tạo" đã được kiểm tra áp lực bởi người chơi trong 23 năm.
Nhưng vấn đề lớn hơn cũng xuất hiện:
Một tác tử AI có thể tồn tại liên tục, học tập liên tục, lập kế hoạch liên tục trong EVE, nó còn thiếu gì so với một tác tử thông minh hoạt động tự chủ trong thế giới thực?
Tài liệu tham khảo:
https://x.com/GoogleDeepMind/status/2052011542707630461
https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind
https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/
Bài viết đến từ tài khoản công khai WeChat "Tân Trí Nguyên" (新智元), tác giả: ASI Khải Thị Lục, biên tập: Nguyên Vũ.











