AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

marsbit发布于2026-05-25更新于2026-05-25

文章摘要

DeepMind与运营23年的太空网游《EVE Online》背后的公司Fenris Creations（原CCP Games）合作，计划利用这款游戏的复杂持久世界作为AI研究的新“训练场”。此次合作目标明确，旨在攻克当前AI智能体研究中公认最难的三大挑战：长程规划、记忆和持续学习。与以往围棋、星际争霸等有明确终局的游戏不同，《EVE Online》是一个由玩家驱动、持续演化的“单一共享宇宙”，拥有真实的经济体系、政治联盟和跨越数月的战争。玩家的日常操作——如管理跨越数年的社交关系、从大规模战役中学习并迭代战术、进行以月为单位的战略筹备——恰好对应了AI智能体需要突破的三个核心难题。 DeepMind将在一个离线版本的《EVE》环境中进行研究，这意味着AI不会干扰真实玩家的游戏世界，但可以在这个经过23年“压力测试”的复杂规则系统中进行安全测试。从Atari游戏到《星际争霸》，再到如今的《EVE》，DeepMind的研究环境正变得越来越开放、持久和贴近真实世界的复杂性。这次合作的核心问题是：一个能在《EVE》这样长期运行、动态演化的“人造社会”中生存和学习的AI，距离在真实世界中自主运作还有多远？

DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。

这一次,他把AI扔进了跑了23年的「活宇宙」:一款连新手引导都能劝退玩家的太空网游EVE Online。

棋局有终局,EVE没有。

5月初,DeepMind官宣了与EVE Online建立研究合作,原因很简单:EVE复杂且有玩家驱动的宇宙,是测试AI记忆、持续学习和长期规划的完美安全沙盒。

DeepMind联手EVE,不是为了追求有趣的游戏体验,或者赋能游戏玩法,而是要啃下当前AI智能体研究里公认最难啃的三块骨头,Hassabis把答案押在了一款运营23年的老游戏上。

Fenris Creations(原CCP Games)宣布与DeepMind合作

EVE Online背后的公司,5月6日同一天宣布了四件事:

从母公司Pearl Abyss体系中重新独立;
更名为Fenris Creations;
完成1.2亿美元交易;
Google作为本次独立的一部分,持有Fenris Creations少数股权,并同步启动与Google DeepMind的研究合作。

Fenris Creations CEO Hilmar Veigar Pétursson在公告中声称:

这次转型不涉及裁员或重组,团队、产品、开发计划保持不变。EVE继续。

从运营数字看,这家公司是带着「真实弹药」来谈合作的,而不是卖资产求生。

EVE Online 2025年营收超过7000万美元,11月创下历史最高收入纪录,Q4成为该游戏20年历史上营收第二高的季度。

Fenris Creations独立出来,意味着EVE现在有了一个能自主决定研究合作的母公司,不再被一家更大的游戏发行公司的战略目标绑架。

1997年Fenris出版的桌游产品盒。「Fenris」这个名字比EVE Online还早了6年,更名为Fenris Creations是一次回溯,不是另起炉灶

DeepMind为何会选中EVE?

23年「人造社会」

AI基准测试难以复制

很多人听到「游戏+AI研究」,第一反应是回想AlphaGo或AlphaStar,EVE和它们都不同。

围棋和星际争霸有一个共同特点:一局比赛有开始,有结束,有明确的胜负规则。

AlphaGo的目标是打赢棋局,AlphaStar的目标是打赢一场星际对战,都是「单局智能」的研究范式,但EVE没有终局。

EVE Online以「单一共享宇宙」(single-shard / single shared universe)著称,大量玩家长期在同一个持久世界中竞争、贸易、结盟和战争。

玩家在这里建立起了真实的经济体系、政治联盟、军事集团、贸易路线、历史恩怨和跨年度的战争计划。

有些战役从筹备到落幕要花掉整整一年。有些联盟的崛起和覆灭,被后来的玩家当作真实历史研究。

Hilmar在公告中说:「EVE是少数几个能在已经像真实世界运转的环境中探索智能问题的地方。」

Hassabis更是谈到,自己从小玩游戏,职业生涯起点是设计AI模拟游戏,AlphaGo、AlphaStar和SIMA的研究都和游戏深度绑定,而EVE是下一阶段的选择:

我很高兴能与Fenris Creations合作,在这个由玩家打造、复杂程度无与伦比的宇宙里,安全地探索全新的游戏体验并推进AI研究。

大多数AI基准测试像是体检,EVE更像是把AI扔进一个已经持续了23年的「人造社会」。

智能体3块最硬骨头

刚好是EVE玩家日常

这次官方明确列出了三个研究方向:长程规划(long-horizon planning)、记忆(memory)、持续学习(continual learning)。

这三个方向,是当前AI智能体研究领域公认的3块最难啃的骨头。

如果你身边有人玩过十年以上的EVE Online,让他打开账号给你看一眼好友列表,你很可能会看到几十个分组、上百个名字,备注栏里写着「2018年Delve战役欠的债」「鹅群联盟(Goonswarm)内部叛徒,别合作」「这哥们儿是间谍,组织里都知道」。

这不是上下文窗口,而是十年起步的跨会话长程记忆。

记忆这一关,EVE玩家天天都在过,持续学习这一关也一样。

2014年1月,B-R5RB一战持续约21小时,参战角色超过7500个,75艘Titan被毁,损失折合真实货币约30万美元。整场战役的导火索,是一笔主权账单未能自动支付。

这一仗打完,整个游戏的舰队战术全部改写。各联盟之后几年的舰队配置、战术体系,全部围绕复盘在迭代。每月都在改,每场失败都被拆成可执行的策略更新。

至于长程规划,EVE联盟战争的标准时间单位不是小时,是月。一场跨星域战争从筹备到打响,造船、运输、外交、潜伏、反间,几百号玩家在没有任何任务调度的情况下自发协作,跨月推进一个共同目标。

这套协作体系是23年里玩家自己长出来的。

当前AI智能体评估里被认为最硬的3块骨头,恰好是EVE玩家的日常。

EVE中23年的玩家驱动演化,产生了一个始终在变、始终复杂、没有捷径的环境,实验室里人工合成不了这种复杂度。

DeepMind在2025年11月发布的SIMA 2,已经从「执行指令」进化到「理解目标、推理过程、边玩边学」。

从研究问题上看,EVE项目与SIMA 2同属「游戏作为智能体训练场」这条路线,不同的是这次场地换成了一个持续运转23年的真实宇宙。

EVE Online游戏内战役画面,这种由玩家自发组织、动辄持续数小时的大规模会战,是DeepMind选中EVE作为长程规划与持续学习研究场景的核心原因

DeepMind进的是离线沙盒

不是玩家宇宙

DeepMind这次和Fenris的合作方式,比想象中保守,DeepMind拿到的不是直接接入现役玩家正式服的权限。

DeepMind官方在公告中声明:初始研究将在离线版本的EVE Online上进行,使用本地服务器,在受控环境里测试和评估模型,不连接EVE Online正式运营服务器。

一方面,离线版意味着DeepMind不会去消费现役玩家的对战数据,也不会扰动真正的服务器经济,这避免了任何隐私和合规上的复杂度。

另一方面,离线版EVE仍可保留复杂的规则系统、舰船与经济机制、星域结构等核心设计。

DeepMind拿到的是一个「被23年玩家压力测试过」的复杂世界,作为智能体要去活下去的考场。

从Atari到EVE

这条路走向哪里

从DeepMind这十几年的训练场选择往回看,有一条很清晰的进化线。

2013到2015年,Atari是起点。DQN把智能体放进《打砖块》《太空入侵者》这种关卡明确、规则封闭的游戏。考的是反应和价值估计。

2016到2017年,AlphaGo和AlphaZero。围棋规则规整、动作空间巨大但封闭。考的是搜索和长链推理。

2019年,AlphaStar进了《星际争霸2》。第一次进入实时、不完美信息、多线博弈的环境。考的是部分可观察下的实时决策。

2024年,SIMA想做跨多个游戏的通用智能体。考的是迁移泛化。

2025年,SIMA 2升级:不只执行指令,还能和用户对话、推理目标、在游戏过程中自我改进。

DeepMind 2025年发布的SIMA 2,已从「执行指令」进化到「理解目标、推理过程、边玩边学」

每一代环境,都比上一代多了一些「真实世界的样子」:从规则封闭到规则开放,从完美信息到不完美信息,从单局对抗到跨局迁移。

但此前这些环境大多仍是相对封闭、可切分、可重复评测的任务场,比如Atari是固定规则的街机游戏,AlphaStar面对的是一局一局结束的星际对战,SIMA则在多个3D虚拟环境中测试跨游戏泛化。

EVE的不同之处在于,它是一个长期运行、玩家驱动、经济和政治结构持续演化的持久世界。

它是在23年间,经由一群真实玩家在开放规则的世界里自发演化出来的:完整的玩家驱动经济(ISK价格波动堪比真实金融市场),跨联盟的政治结构(外交、间谍、停战协议),从小规模冲突到21小时大战的整套战争生态。

圈内对智能体评估的共识越来越清楚,单点任务跑分早就玩不出什么新花样了,但长程记忆、跨周规划、从失败中学习,一直没有像样的评估场。

所以,DeepMind这次的选择是:与其再造一个合成环境,不如走进一个已经被人类玩家用23年压力测试过的「人造社会」。

但更大的问题也随之浮现:

一个能在EVE里持续存在、持续学习、持续规划的AI智能体,它和在真实世界里自主运作的智能体之间,还差什么?

参考资料:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

本文来自微信公众号“新智元”,作者:ASI启示录,编辑:元宇

你可能也喜欢

疯狂烧了数十亿美元 Token 之后，硅谷大厂开始限制员工 Token 用量了

近日，多家硅谷科技公司开始限制员工使用AI工具的Token（使用量），以应对高昂且效益不明的成本。此前，企业曾鼓励员工“tokenmaxxing”（最大化Token使用量）以体现数字化转型，但随后发现大量Token被用于非核心工作，如查天气或写祝福，且AI生成的代码存在高“流失率”（被抛弃或重写），导致隐性成本激增。数据显示，企业每花1美元在AI Token上，可能产生近80%的额外损耗用于修复Bug和审查。管理层开始质疑AI投资的回报率（ROI），仅有少数CFO能看到明确回报。个人效率的提升未能转化为公司整体收益增长。例如，Uber和Salesforce面临数亿美元的年化AI支出，却难以将其与业务成果直接挂钩。微软已取消部分员工的Claude Code许可，Meta也下线了内部鼓励使用的排行榜。市场随之出现AI成本管理工具，帮助企业监控支出并与业务成果关联。同时，部分AI厂商开始调整计费模式，从按Token用量转向按实际产出（如解决的对话数）收费。行业正从盲目追求使用量转向理性评估价值。分析指出，真正的挑战在于用AI重新设计工作流程和商业模式，而非仅仅优化现有任务。如果企业仅将AI用于加速旧工作，成本压力终将迫使它们面对这一根本问题。

marsbit5分钟前

marsbit5分钟前

Gate 真实股票交易正式推出，打通加密资产与传统金融市场连接通道

Gate 正式推出真实股票交易服务，用户可使用 USDT 直接交易美国主流证券市场的股票与 ETF 等资产。该服务通过对接 Alpaca 等持有美国合规牌照的券商，直接连接纽交所、纳斯达克等市场，提供真实股票交易而非代币化衍生品。合作券商为美国证券投资者保护公司成员，为用户资产提供相应保障。 Gate 当前支持超过 10,000 支股票及 ETF，覆盖美国主流交易市场，并计划逐步拓展至 24/7 全天候交易。用户通过统一账户，可在 App 内使用 USDT 便捷参与股票交易，实现加密资产与全球证券市场的高效连接。该服务为现货交易，不涉及资金费率或隔夜费用，适合长期配置。 Gate 此举标志着其正从单一数字资产平台向覆盖加密资产、股票等多资产的综合交易基础设施演进，强化了其全球资产交易平台的定位。

链捕手27分钟前

链捕手27分钟前

我在Web3做了九年VC：亚洲基金正在经历「地狱模式」

作者联系了二十多位Crypto VC投资人，发现超过一半已离开行业，转投AI、创业或停止投资，反映了当前Web3投资市场的急剧降温。与2021-2024年的融资狂热相比，如今市场每日融资消息寥寥，活跃VC大幅减少。 IOSG Ventures创始人Jocy回顾了九年经历三轮牛熊的经验。他指出，当前Crypto VC的投资逻辑已彻底改变。IOSG调整了策略，目前投资组合约为50%一级市场、30%项目发币后(Post-TGE)和20%场外交易(OTC)，以寻找价值错配机会并改善基金流动性。他认为，未来头部20%能为出资人(LP)提供清晰退出路径的VC将吸引市场80%的资金。 Jocy强调，当前市场对亚洲基金而言是“地狱模式”，融资极其困难，因此投资必须更加精准，只投行业顶尖项目。他指出，行业核心问题在于代币与真实价值长期脱轨：过去许多项目将盈利业务与公司股权绑定，而代币沦为融资工具，持有者无法分享协议收益。现在，趋势正向“价值代币”转变，即代币需与协议利益强绑定，通过透明机制（如程序化价值累积或回购）来捕获真实价值，类似Uniswap、Morpho等项目正在推动这一变化。当下的市场低谷被视作去伪存真、重建秩序的机会。投资逻辑从赌叙事回归商业本质，重点关注有真实收入、清晰用户需求和现金流的项目。IOSG目前聚焦两大方向：一是真实收益与金融基础设施（如稳定币支付、链上信贷），二是AI与Crypto交叉的加密原生AI基础设施。 Jocy总结道，伟大项目常诞生于行业最悲观之时。泡沫退去后，坚持下来的构建者将决定行业的未来面貌。

marsbit31分钟前

marsbit31分钟前

Cango发布一季度财报：总收入1.02亿美元，业务延伸至AI算力基础设施

比特币矿企Cango公布2026年第一季度财报，总收入为1.02亿美元，主要来自挖矿业务。公司报告期内净亏损2.611亿美元，主要受比特币价格下跌导致的非现金项目影响。其总算力为37.01 EH/s，并成功将平均每枚比特币现金成本降至76,928美元。同时，Cango正将业务延伸至AI算力基础设施领域，推出了新平台EcoHash，计划复用能源管理经验提供算力服务。公司通过淘汰旧矿机、削减算力规模并偿还债务，将长期债务大幅降至3060万美元，以优化资产负债表并支持向多元化基础设施平台转型。

marsbit31分钟前

marsbit31分钟前

30年美债收益率再破5%，「一切都廉价」的时代落幕了

30年期美国国债收益率近期再度突破5%，市场反应显示投资者正逐渐接受高利率将长期持续的现实。这一变化源于支撑美国过去50年低通胀、低利率的三大支柱——廉价资本、廉价劳动力和廉价能源——正在同步瓦解。廉价资本时代因全球化逆转、供应链回流及石油美元体系受侵蚀而结束；廉价劳动力因劳动力短缺、罢工潮及部分工会增长推高工资，但被企业医保成本上升和人工智能冲击部分抵消；廉价能源则因中东紧张局势及美国退出气候承诺面临挑战。此外，政府债务攀升、地缘政治摩擦和民粹主义等“慢变量”也推高了长期利率。人工智能（AI）成为未来通胀走势的最大变数：乐观情景下，AI提升生产力、降低债务和通胀；悲观情景下，AI加剧企业裁员、推高资源成本，并可能增加政府债务。目前AI巨头已对房地产、芯片、水电等资源价格产生上行压力。文章指出，多数投资者的经验和模型均基于低利率环境，面临“预期惯性”的挑战。市场需调整旧有预期，适应高利率持续的新阶段。

marsbit37分钟前

marsbit37分钟前

交易

现货

合约

AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

文章摘要

23年「人造社会」

AI基准测试难以复制

智能体3块最硬骨头

刚好是EVE玩家日常

DeepMind进的是离线沙盒

不是玩家宇宙

从Atari到EVE

这条路走向哪里

相关问答

你可能也喜欢

疯狂烧了数十亿美元 Token 之后，硅谷大厂开始限制员工 Token 用量了

Gate 真实股票交易正式推出，打通加密资产与传统金融市场连接通道

我在Web3做了九年VC：亚洲基金正在经历「地狱模式」

Cango发布一季度财报：总收入1.02亿美元，业务延伸至AI算力基础设施

30年美债收益率再破5%，「一切都廉价」的时代落幕了

交易

热门文章

加密市场宏观研报：原油飓风、AI巨浪与比特币的十字路口

自主AI经济的基石：Talus如何重塑链上智能代理

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

相关讨论

热门问答

热门分类

热门标签