AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

marsbit发布于2026-05-25更新于2026-05-25

文章摘要

DeepMind与运营23年的太空网游《EVE Online》背后的公司Fenris Creations（原CCP Games）合作，计划利用这款游戏的复杂持久世界作为AI研究的新“训练场”。此次合作目标明确，旨在攻克当前AI智能体研究中公认最难的三大挑战：长程规划、记忆和持续学习。与以往围棋、星际争霸等有明确终局的游戏不同，《EVE Online》是一个由玩家驱动、持续演化的“单一共享宇宙”，拥有真实的经济体系、政治联盟和跨越数月的战争。玩家的日常操作——如管理跨越数年的社交关系、从大规模战役中学习并迭代战术、进行以月为单位的战略筹备——恰好对应了AI智能体需要突破的三个核心难题。 DeepMind将在一个离线版本的《EVE》环境中进行研究，这意味着AI不会干扰真实玩家的游戏世界，但可以在这个经过23年“压力测试”的复杂规则系统中进行安全测试。从Atari游戏到《星际争霸》，再到如今的《EVE》，DeepMind的研究环境正变得越来越开放、持久和贴近真实世界的复杂性。这次合作的核心问题是：一个能在《EVE》这样长期运行、动态演化的“人造社会”中生存和学习的AI，距离在真实世界中自主运作还有多远？

DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。

这一次,他把AI扔进了跑了23年的「活宇宙」:一款连新手引导都能劝退玩家的太空网游EVE Online。

棋局有终局,EVE没有。

5月初,DeepMind官宣了与EVE Online建立研究合作,原因很简单:EVE复杂且有玩家驱动的宇宙,是测试AI记忆、持续学习和长期规划的完美安全沙盒。

DeepMind联手EVE,不是为了追求有趣的游戏体验,或者赋能游戏玩法,而是要啃下当前AI智能体研究里公认最难啃的三块骨头,Hassabis把答案押在了一款运营23年的老游戏上。

Fenris Creations(原CCP Games)宣布与DeepMind合作

EVE Online背后的公司,5月6日同一天宣布了四件事:

从母公司Pearl Abyss体系中重新独立;
更名为Fenris Creations;
完成1.2亿美元交易;
Google作为本次独立的一部分,持有Fenris Creations少数股权,并同步启动与Google DeepMind的研究合作。

Fenris Creations CEO Hilmar Veigar Pétursson在公告中声称:

这次转型不涉及裁员或重组,团队、产品、开发计划保持不变。EVE继续。

从运营数字看,这家公司是带着「真实弹药」来谈合作的,而不是卖资产求生。

EVE Online 2025年营收超过7000万美元,11月创下历史最高收入纪录,Q4成为该游戏20年历史上营收第二高的季度。

Fenris Creations独立出来,意味着EVE现在有了一个能自主决定研究合作的母公司,不再被一家更大的游戏发行公司的战略目标绑架。

1997年Fenris出版的桌游产品盒。「Fenris」这个名字比EVE Online还早了6年,更名为Fenris Creations是一次回溯,不是另起炉灶

DeepMind为何会选中EVE?

23年「人造社会」

AI基准测试难以复制

很多人听到「游戏+AI研究」,第一反应是回想AlphaGo或AlphaStar,EVE和它们都不同。

围棋和星际争霸有一个共同特点:一局比赛有开始,有结束,有明确的胜负规则。

AlphaGo的目标是打赢棋局,AlphaStar的目标是打赢一场星际对战,都是「单局智能」的研究范式,但EVE没有终局。

EVE Online以「单一共享宇宙」(single-shard / single shared universe)著称,大量玩家长期在同一个持久世界中竞争、贸易、结盟和战争。

玩家在这里建立起了真实的经济体系、政治联盟、军事集团、贸易路线、历史恩怨和跨年度的战争计划。

有些战役从筹备到落幕要花掉整整一年。有些联盟的崛起和覆灭,被后来的玩家当作真实历史研究。

Hilmar在公告中说:「EVE是少数几个能在已经像真实世界运转的环境中探索智能问题的地方。」

Hassabis更是谈到,自己从小玩游戏,职业生涯起点是设计AI模拟游戏,AlphaGo、AlphaStar和SIMA的研究都和游戏深度绑定,而EVE是下一阶段的选择:

我很高兴能与Fenris Creations合作,在这个由玩家打造、复杂程度无与伦比的宇宙里,安全地探索全新的游戏体验并推进AI研究。

大多数AI基准测试像是体检,EVE更像是把AI扔进一个已经持续了23年的「人造社会」。

智能体3块最硬骨头

刚好是EVE玩家日常

这次官方明确列出了三个研究方向:长程规划(long-horizon planning)、记忆(memory)、持续学习(continual learning)。

这三个方向,是当前AI智能体研究领域公认的3块最难啃的骨头。

如果你身边有人玩过十年以上的EVE Online,让他打开账号给你看一眼好友列表,你很可能会看到几十个分组、上百个名字,备注栏里写着「2018年Delve战役欠的债」「鹅群联盟(Goonswarm)内部叛徒,别合作」「这哥们儿是间谍,组织里都知道」。

这不是上下文窗口,而是十年起步的跨会话长程记忆。

记忆这一关,EVE玩家天天都在过,持续学习这一关也一样。

2014年1月,B-R5RB一战持续约21小时,参战角色超过7500个,75艘Titan被毁,损失折合真实货币约30万美元。整场战役的导火索,是一笔主权账单未能自动支付。

这一仗打完,整个游戏的舰队战术全部改写。各联盟之后几年的舰队配置、战术体系,全部围绕复盘在迭代。每月都在改,每场失败都被拆成可执行的策略更新。

至于长程规划,EVE联盟战争的标准时间单位不是小时,是月。一场跨星域战争从筹备到打响,造船、运输、外交、潜伏、反间,几百号玩家在没有任何任务调度的情况下自发协作,跨月推进一个共同目标。

这套协作体系是23年里玩家自己长出来的。

当前AI智能体评估里被认为最硬的3块骨头,恰好是EVE玩家的日常。

EVE中23年的玩家驱动演化,产生了一个始终在变、始终复杂、没有捷径的环境,实验室里人工合成不了这种复杂度。

DeepMind在2025年11月发布的SIMA 2,已经从「执行指令」进化到「理解目标、推理过程、边玩边学」。

从研究问题上看,EVE项目与SIMA 2同属「游戏作为智能体训练场」这条路线,不同的是这次场地换成了一个持续运转23年的真实宇宙。

EVE Online游戏内战役画面,这种由玩家自发组织、动辄持续数小时的大规模会战,是DeepMind选中EVE作为长程规划与持续学习研究场景的核心原因

DeepMind进的是离线沙盒

不是玩家宇宙

DeepMind这次和Fenris的合作方式,比想象中保守,DeepMind拿到的不是直接接入现役玩家正式服的权限。

DeepMind官方在公告中声明:初始研究将在离线版本的EVE Online上进行,使用本地服务器,在受控环境里测试和评估模型,不连接EVE Online正式运营服务器。

一方面,离线版意味着DeepMind不会去消费现役玩家的对战数据,也不会扰动真正的服务器经济,这避免了任何隐私和合规上的复杂度。

另一方面,离线版EVE仍可保留复杂的规则系统、舰船与经济机制、星域结构等核心设计。

DeepMind拿到的是一个「被23年玩家压力测试过」的复杂世界,作为智能体要去活下去的考场。

从Atari到EVE

这条路走向哪里

从DeepMind这十几年的训练场选择往回看,有一条很清晰的进化线。

2013到2015年,Atari是起点。DQN把智能体放进《打砖块》《太空入侵者》这种关卡明确、规则封闭的游戏。考的是反应和价值估计。

2016到2017年,AlphaGo和AlphaZero。围棋规则规整、动作空间巨大但封闭。考的是搜索和长链推理。

2019年,AlphaStar进了《星际争霸2》。第一次进入实时、不完美信息、多线博弈的环境。考的是部分可观察下的实时决策。

2024年,SIMA想做跨多个游戏的通用智能体。考的是迁移泛化。

2025年,SIMA 2升级:不只执行指令,还能和用户对话、推理目标、在游戏过程中自我改进。

DeepMind 2025年发布的SIMA 2,已从「执行指令」进化到「理解目标、推理过程、边玩边学」

每一代环境,都比上一代多了一些「真实世界的样子」:从规则封闭到规则开放,从完美信息到不完美信息,从单局对抗到跨局迁移。

但此前这些环境大多仍是相对封闭、可切分、可重复评测的任务场,比如Atari是固定规则的街机游戏,AlphaStar面对的是一局一局结束的星际对战,SIMA则在多个3D虚拟环境中测试跨游戏泛化。

EVE的不同之处在于,它是一个长期运行、玩家驱动、经济和政治结构持续演化的持久世界。

它是在23年间,经由一群真实玩家在开放规则的世界里自发演化出来的:完整的玩家驱动经济(ISK价格波动堪比真实金融市场),跨联盟的政治结构(外交、间谍、停战协议),从小规模冲突到21小时大战的整套战争生态。

圈内对智能体评估的共识越来越清楚,单点任务跑分早就玩不出什么新花样了,但长程记忆、跨周规划、从失败中学习,一直没有像样的评估场。

所以,DeepMind这次的选择是:与其再造一个合成环境,不如走进一个已经被人类玩家用23年压力测试过的「人造社会」。

但更大的问题也随之浮现:

一个能在EVE里持续存在、持续学习、持续规划的AI智能体,它和在真实世界里自主运作的智能体之间,还差什么?

参考资料:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

本文来自微信公众号“新智元”,作者:ASI启示录,编辑:元宇

你可能也喜欢

最新消息：唐纳德·特朗普就伊朗问题发表强硬声明！他叫停了攻击行动

美国总统唐纳德·特朗普表示，沙特阿拉伯、阿拉伯联合酋长国、卡塔尔和伊朗呼吁他推迟计划中的军事打击行动。特朗普称，针对伊朗的计划规模巨大且威力强劲，但在地区国家请求为外交谈判留出时间后，他暂缓了攻击计划。特朗普指出，地区盟友认为协议已接近达成，首阶段谈判重点在于安全保障和恢复霍尔木兹海峡通航。他表示，一旦就此达成一致，将开启关于伊朗核计划的谈判。霍尔木兹海峡是全球石油和液化天然气运输的关键通道，该地区的军事冲突被认为将对能源价格和全球贸易产生重大影响。此外，特朗普宣布将于明日开始与伊朗进行新一轮谈判。他还就日元汇率事件发表评论，称美国出于与日本的良好关系干预了市场，并强调华盛顿一贯支持东京，且美国也从相关规则中获得了经济利益。

cryptonews.ru54分钟前

cryptonews.ru54分钟前

意大利央行未发现稳定币在汇款中存在系统性优势

意大利银行的一项研究显示，稳定币在跨境汇款中并未展现出持续的成本与速度优势。其潜在优势被法币出入金手续费以及本地支付基础设施的处理流程所抵消。研究比较了通过200 USDC在意大利与巴西、阿根廷、日本、阿联酋和南非等10条双向通道进行汇款的成本与结算时间，并与标准汇款服务进行对比。结果显示，稳定币转账的总成本在0.3%到近9%之间波动，具体取决于汇款方向。在具备即时支付系统的通道中，结算可在20分钟内完成；若缺乏此类基础设施，则需一至两个工作日。主要成本和延迟源于货币兑换以及当地基础设施的质量。区块链网络手续费并非主要因素。尽管在大多数研究通道中，稳定币成本低于世界银行统计的全球平均汇款成本（6.65%），但与传统汇款服务商Wise相比，仅在七条可比通道中的三条具备成本优势。研究者认为，若稳定币能直接用于商品服务消费而无需兑换成当地货币，其优势将更为明显。同时指出，禁令性监管无法消除市场对稳定币的需求，而过严的规则只会增加零售用户的使用难度。此外，报告提及，稳定币总市值在7月已从5月峰值下跌超100亿美元，至约3100亿美元，创下自2022年5月Terra崩溃以来的最大月度跌幅。

cryptonews.ru1小时前

cryptonews.ru1小时前

比特币图表形态「头肩底」预示将上涨至67,200美元

尽管比特币在8月初缓慢下跌，但其价格图表上正在形成一个反转形态——“头肩底”模型。目前，比特币价格在63,200美元附近波动，构成该模型的右肩。分析师TechCharts的Axel Kibar指出，这是本月多头短期乐观的唯一现实理由。比特币仍处于上升起点，关键问题在于买家是否有足够动力推动价格突破至67,000美元。与此同时，ETH/BTC交易对已向上突破类似的反转底部。以太坊已确立上升趋势，正朝着0.0312的技术目标前进，表明大资金目前更青睐投资以太坊而非比特币。这种流动性轮动消耗了比特币的动能，使其缺乏快速启动所需的交易量。以太坊兑美元汇率正测试1,875美元支撑位，若能守住，则可能打开通往2,163美元的道路。以太坊的相对强势对整个市场是积极信号，但比特币持有者面临紧张局面。比特币需要快速上涨突破67,200美元以确认反转形态，否则该模式可能失效。根据Kibar的观点，若未来几天未能突破颈线，空头将重新掌控局面，推动比特币跌向60,000及58,000美元的支撑位。

cryptonews.ru1小时前

cryptonews.ru1小时前

比特币热潮正酣：塞勒尔新声明引发关于购买的猜测

纳斯达克上市公司MicroStrategy（代码：MSTR）的执行董事长迈克尔·塞勒于8月2日发布信息“Bitcoin Drive engaged”（比特币驱动已启动），再次引发市场对于该公司将在周一宣布新一轮比特币购买的猜测。其周日的帖子附带了该公司惯用的购买追踪图表，这符合塞勒通常在每周财报发布前暗示其金库变动的做法。塞勒的附图报告显示，MicroStrategy的比特币储备为843,775枚BTC，市值约532.5亿美元。平均购买成本为每枚75,653美元，未实现亏损为105.8亿美元（-16.58%）。截至8月2日，累计进行了113次购买操作。此前在7月27日，类似的周日信号曾预告了公司的公告，当时塞勒发文称“我们还需要一种颜色”，随后MicroStrategy披露了其更大的现金储备。这种时间上的巧合强化了市场对周一将发布新金库状况公告的预期。然而，该公司实时账本显示，在最近两次共计出售3,588枚BTC（包括1,363枚和2,225枚）后，其比特币储备已从847,363枚降至843,775枚。根据提交给美国证券交易委员会（SEC）的文件，这些出售是为了资助优先股支付并补充美元储备。最近的报告还显示，在截至7月26日的一周内，MicroStrategy没有购买任何比特币，同时将其美元储备增加至约37.5亿美元，这使其优先股股息和债务利息的预计覆盖期限延长至约2.1年。财务风险依然高企，该公司报告2026年第二季度运营亏损83.3亿美元，与上年同期140.3亿美元的运营利润形成急剧逆转。这些业绩包含了公司数字资产方面83.2亿美元的未实现亏损，而2025年第二季度为未实现利润140.5亿美元。管理层还可能通过额外出售比特币获得高达12.5亿美元，以补充用于支付优先股股息和债务利息的美元储备。因此，预计周一的披露将揭示“Bitcoin Drive”信息是否标志着资产积累的恢复，因为MicroStrategy需要在平衡其843,775枚BTC自有储备与不断增长的现金负债和积极的资本管理之间做出抉择。

cryptonews.ru1小时前

cryptonews.ru1小时前

人工智能公司股票像“迷因币”一样交易，而比特币价格几乎不变——一周回顾

本周市场焦点集中在人工智能（AI）股票的大幅波动，而比特币价格相对稳定，在62,500至64,000美元区间窄幅震荡。主要事件是Leopold Aschenbrenner管理的规模达200亿美元的“Situational Awareness”基金因巨额亏损被迫清仓，导致AI股票和韩国股市（KOSPI指数月内下跌35%）等市场剧烈波动。Citadel被指参与了其资产收购。有分析认为，类似LTCM、Archegos等历史事件显示，一次重大清盘可能标志着市场触底。加密货币市场方面，行业仍处熊市：BitMart宣布逐步关闭，Storj Labs申请破产，Coinbase等多家公司持续裁员。MicroStrategy则继续增持比特币并回购自身股票。DeFi领域，Trade.xyz在Hyperliquid上的成功可能带来中心化风险，而Solana上超过90%活跃钱包与Pump.fun交互的现象也引发类似担忧。 AI与加密结合的项目Bittensor ($TAO) 获得部分投资人关注，但需警惕其宣传风险。最后，文章再次警告了Coldcard硬件钱包存在的安全漏洞，并强调在自我托管资产时保持高度警惕和个人责任感的重要性。

cryptonews.ru2小时前

交易

现货

AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

文章摘要

23年「人造社会」

AI基准测试难以复制

智能体3块最硬骨头

刚好是EVE玩家日常

DeepMind进的是离线沙盒

不是玩家宇宙

从Atari到EVE

这条路走向哪里

热门币种推荐

相关问答

你可能也喜欢

最新消息：唐纳德·特朗普就伊朗问题发表强硬声明！他叫停了攻击行动

意大利央行未发现稳定币在汇款中存在系统性优势

比特币图表形态「头肩底」预示将上涨至67,200美元

比特币热潮正酣：塞勒尔新声明引发关于购买的猜测

人工智能公司股票像“迷因币”一样交易，而比特币价格几乎不变——一周回顾

交易

热门文章

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

从H2A到A2A：AI Agent经济体与Crypto新机遇

美股TradFi：传统金融在AI IPO浪潮下的稳健锚点

相关讨论

热门问答

热门分类

热门标签