AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

marsbit发布于2026-05-25更新于2026-05-25

文章摘要

DeepMind与运营23年的太空网游《EVE Online》背后的公司Fenris Creations（原CCP Games）合作，计划利用这款游戏的复杂持久世界作为AI研究的新“训练场”。此次合作目标明确，旨在攻克当前AI智能体研究中公认最难的三大挑战：长程规划、记忆和持续学习。与以往围棋、星际争霸等有明确终局的游戏不同，《EVE Online》是一个由玩家驱动、持续演化的“单一共享宇宙”，拥有真实的经济体系、政治联盟和跨越数月的战争。玩家的日常操作——如管理跨越数年的社交关系、从大规模战役中学习并迭代战术、进行以月为单位的战略筹备——恰好对应了AI智能体需要突破的三个核心难题。 DeepMind将在一个离线版本的《EVE》环境中进行研究，这意味着AI不会干扰真实玩家的游戏世界，但可以在这个经过23年“压力测试”的复杂规则系统中进行安全测试。从Atari游戏到《星际争霸》，再到如今的《EVE》，DeepMind的研究环境正变得越来越开放、持久和贴近真实世界的复杂性。这次合作的核心问题是：一个能在《EVE》这样长期运行、动态演化的“人造社会”中生存和学习的AI，距离在真实世界中自主运作还有多远？

DeepMind CEO、AlphaGo之父Demis Hassabis用游戏做AI研究已走过十余年。

这一次,他把AI扔进了跑了23年的「活宇宙」:一款连新手引导都能劝退玩家的太空网游EVE Online。

棋局有终局,EVE没有。

5月初,DeepMind官宣了与EVE Online建立研究合作,原因很简单:EVE复杂且有玩家驱动的宇宙,是测试AI记忆、持续学习和长期规划的完美安全沙盒。

DeepMind联手EVE,不是为了追求有趣的游戏体验,或者赋能游戏玩法,而是要啃下当前AI智能体研究里公认最难啃的三块骨头,Hassabis把答案押在了一款运营23年的老游戏上。

Fenris Creations(原CCP Games)宣布与DeepMind合作

EVE Online背后的公司,5月6日同一天宣布了四件事:

从母公司Pearl Abyss体系中重新独立;
更名为Fenris Creations;
完成1.2亿美元交易;
Google作为本次独立的一部分,持有Fenris Creations少数股权,并同步启动与Google DeepMind的研究合作。

Fenris Creations CEO Hilmar Veigar Pétursson在公告中声称:

这次转型不涉及裁员或重组,团队、产品、开发计划保持不变。EVE继续。

从运营数字看,这家公司是带着「真实弹药」来谈合作的,而不是卖资产求生。

EVE Online 2025年营收超过7000万美元,11月创下历史最高收入纪录,Q4成为该游戏20年历史上营收第二高的季度。

Fenris Creations独立出来,意味着EVE现在有了一个能自主决定研究合作的母公司,不再被一家更大的游戏发行公司的战略目标绑架。

1997年Fenris出版的桌游产品盒。「Fenris」这个名字比EVE Online还早了6年,更名为Fenris Creations是一次回溯,不是另起炉灶

DeepMind为何会选中EVE?

23年「人造社会」

AI基准测试难以复制

很多人听到「游戏+AI研究」,第一反应是回想AlphaGo或AlphaStar,EVE和它们都不同。

围棋和星际争霸有一个共同特点:一局比赛有开始,有结束,有明确的胜负规则。

AlphaGo的目标是打赢棋局,AlphaStar的目标是打赢一场星际对战,都是「单局智能」的研究范式,但EVE没有终局。

EVE Online以「单一共享宇宙」(single-shard / single shared universe)著称,大量玩家长期在同一个持久世界中竞争、贸易、结盟和战争。

玩家在这里建立起了真实的经济体系、政治联盟、军事集团、贸易路线、历史恩怨和跨年度的战争计划。

有些战役从筹备到落幕要花掉整整一年。有些联盟的崛起和覆灭,被后来的玩家当作真实历史研究。

Hilmar在公告中说:「EVE是少数几个能在已经像真实世界运转的环境中探索智能问题的地方。」

Hassabis更是谈到,自己从小玩游戏,职业生涯起点是设计AI模拟游戏,AlphaGo、AlphaStar和SIMA的研究都和游戏深度绑定,而EVE是下一阶段的选择:

我很高兴能与Fenris Creations合作,在这个由玩家打造、复杂程度无与伦比的宇宙里,安全地探索全新的游戏体验并推进AI研究。

大多数AI基准测试像是体检,EVE更像是把AI扔进一个已经持续了23年的「人造社会」。

智能体3块最硬骨头

刚好是EVE玩家日常

这次官方明确列出了三个研究方向:长程规划(long-horizon planning)、记忆(memory)、持续学习(continual learning)。

这三个方向,是当前AI智能体研究领域公认的3块最难啃的骨头。

如果你身边有人玩过十年以上的EVE Online,让他打开账号给你看一眼好友列表,你很可能会看到几十个分组、上百个名字,备注栏里写着「2018年Delve战役欠的债」「鹅群联盟(Goonswarm)内部叛徒,别合作」「这哥们儿是间谍,组织里都知道」。

这不是上下文窗口,而是十年起步的跨会话长程记忆。

记忆这一关,EVE玩家天天都在过,持续学习这一关也一样。

2014年1月,B-R5RB一战持续约21小时,参战角色超过7500个,75艘Titan被毁,损失折合真实货币约30万美元。整场战役的导火索,是一笔主权账单未能自动支付。

这一仗打完,整个游戏的舰队战术全部改写。各联盟之后几年的舰队配置、战术体系,全部围绕复盘在迭代。每月都在改,每场失败都被拆成可执行的策略更新。

至于长程规划,EVE联盟战争的标准时间单位不是小时,是月。一场跨星域战争从筹备到打响,造船、运输、外交、潜伏、反间,几百号玩家在没有任何任务调度的情况下自发协作,跨月推进一个共同目标。

这套协作体系是23年里玩家自己长出来的。

当前AI智能体评估里被认为最硬的3块骨头,恰好是EVE玩家的日常。

EVE中23年的玩家驱动演化,产生了一个始终在变、始终复杂、没有捷径的环境,实验室里人工合成不了这种复杂度。

DeepMind在2025年11月发布的SIMA 2,已经从「执行指令」进化到「理解目标、推理过程、边玩边学」。

从研究问题上看,EVE项目与SIMA 2同属「游戏作为智能体训练场」这条路线,不同的是这次场地换成了一个持续运转23年的真实宇宙。

EVE Online游戏内战役画面,这种由玩家自发组织、动辄持续数小时的大规模会战,是DeepMind选中EVE作为长程规划与持续学习研究场景的核心原因

DeepMind进的是离线沙盒

不是玩家宇宙

DeepMind这次和Fenris的合作方式,比想象中保守,DeepMind拿到的不是直接接入现役玩家正式服的权限。

DeepMind官方在公告中声明:初始研究将在离线版本的EVE Online上进行,使用本地服务器,在受控环境里测试和评估模型,不连接EVE Online正式运营服务器。

一方面,离线版意味着DeepMind不会去消费现役玩家的对战数据,也不会扰动真正的服务器经济,这避免了任何隐私和合规上的复杂度。

另一方面,离线版EVE仍可保留复杂的规则系统、舰船与经济机制、星域结构等核心设计。

DeepMind拿到的是一个「被23年玩家压力测试过」的复杂世界,作为智能体要去活下去的考场。

从Atari到EVE

这条路走向哪里

从DeepMind这十几年的训练场选择往回看,有一条很清晰的进化线。

2013到2015年,Atari是起点。DQN把智能体放进《打砖块》《太空入侵者》这种关卡明确、规则封闭的游戏。考的是反应和价值估计。

2016到2017年,AlphaGo和AlphaZero。围棋规则规整、动作空间巨大但封闭。考的是搜索和长链推理。

2019年,AlphaStar进了《星际争霸2》。第一次进入实时、不完美信息、多线博弈的环境。考的是部分可观察下的实时决策。

2024年,SIMA想做跨多个游戏的通用智能体。考的是迁移泛化。

2025年,SIMA 2升级:不只执行指令,还能和用户对话、推理目标、在游戏过程中自我改进。

DeepMind 2025年发布的SIMA 2,已从「执行指令」进化到「理解目标、推理过程、边玩边学」

每一代环境,都比上一代多了一些「真实世界的样子」:从规则封闭到规则开放,从完美信息到不完美信息,从单局对抗到跨局迁移。

但此前这些环境大多仍是相对封闭、可切分、可重复评测的任务场,比如Atari是固定规则的街机游戏,AlphaStar面对的是一局一局结束的星际对战,SIMA则在多个3D虚拟环境中测试跨游戏泛化。

EVE的不同之处在于,它是一个长期运行、玩家驱动、经济和政治结构持续演化的持久世界。

它是在23年间,经由一群真实玩家在开放规则的世界里自发演化出来的:完整的玩家驱动经济(ISK价格波动堪比真实金融市场),跨联盟的政治结构(外交、间谍、停战协议),从小规模冲突到21小时大战的整套战争生态。

圈内对智能体评估的共识越来越清楚,单点任务跑分早就玩不出什么新花样了,但长程记忆、跨周规划、从失败中学习,一直没有像样的评估场。

所以,DeepMind这次的选择是:与其再造一个合成环境,不如走进一个已经被人类玩家用23年压力测试过的「人造社会」。

但更大的问题也随之浮现:

一个能在EVE里持续存在、持续学习、持续规划的AI智能体,它和在真实世界里自主运作的智能体之间,还差什么?

参考资料:

https://x.com/GoogleDeepMind/status/2052011542707630461

https://www.ccpgames.com/news/2026/studio-behind-eve-online-goes-independent-rebrands-as-fenris-creations-enters-research-partnership-with-google-deepmind

https://deepmind.google/blog/sima-2-an-agent-that-plays-reasons-and-learns-with-you-in-virtual-3d-worlds/

本文来自微信公众号“新智元”,作者:ASI启示录,编辑:元宇

你可能也喜欢

XRP未平仓合约达26亿美元，衍生品需求激增

XRP期货未平仓合约总额已飙升至26亿美元，24小时内增幅超过10%，使其成为按该指标计算的第四大加密货币资产。未平仓合约增长表明衍生品市场对XRP的兴趣显著升温，更多资本正在进入。但这本身并不等同于现货买入，可能反映多头、空头、对冲或杠杆投机等多种策略。因此，单纯这一数据无法判断市场看涨或看跌。 XRP衍生品活动激增可能源于对市场结构、ETF相关猜测或瑞波公司动态的预期，但现有信息不支持将此直接解读为机构在积累现货。高杠杆是一把双刃剑。未平仓合约的增加既能助推价格大幅波动，也可能在市场反转时引发连锁清算，增加市场脆弱性。关键在于后续走势：若价格上涨伴随稳定的衍生品条件，则新增头寸可能被健康吸收；若价格突然逆转，则可能转化为强平压力。对于看涨者而言，最有力的确认信号将来自现货市场的配合。如果未平仓合约增长的同时，现货交易量、交易所需求和市场广度也同步走强，则更具建设性；反之，若现货需求疲软，则本轮活动可能更偏向投机。总之，26亿美元的里程碑标志着XRP重新吸引了大量衍生品市场的关注，但并未预示明确方向。下一步的关键是观察这些资本是能支撑起更强劲的趋势，还是仅仅为这个本就活跃的市场增添了更多波动性。

bitcoinist40分钟前

bitcoinist40分钟前

比特币2030年价格预测：关于下一次牛市你需要了解的信息

比特币自2025年10月10日暴跌后一直处于熊市。分析指出，需关注稳定币流入交易所的动向，因为大量流入是推动牛市的必要“燃料”。目前该指标为负值，需转为正值才能预示市场情绪转向。分析师Joao Wedson基于历史对称性预测，本轮周期底部可能在2026年10月上半月到达，区间约为4.15万至4.5万美元。从技术分析看，若遵循上一周期模式，比特币可能回撤至3.91万美元附近，随后有望突破15.23万美元的斐波那契扩展位。长期展望认为，随着机构加速采用，比特币在2030年可能达到20万至22万美元的高点，然后进入下一个熊市周期。但需要注意的是，当前周期可能比以往更长。

ambcrypto1小时前

ambcrypto1小时前

BTC市场脉搏：第30周

比特币市场脉搏：第30周。比特币从58,000美元下方反弹后短暂测试65,000美元，随后转入约64,500美元的区间盘整，上涨动能放缓，现货交易量依然清淡。尽管反弹得以维持，但短期势头减弱表明市场仍在寻找更稳固的平衡点。同时，波动率利差收窄，显示随着市场情绪不再那么防御性，衍生品市场不再计价显著的风险溢价。尽管现货参与度不高，但投机需求正逐步回归。期货和期权未平仓合约增加，永续合约资金流向转为净买入，对下行保护的需求有所缓解。较低的看多资金费率表明头寸正被更谨慎地重建，未出现通常与过热行情相关的激进杠杆。链上活动也在企稳，经济吞吐量和参与者活跃度的小幅改善提供了支撑。资金流动依然谨慎，月度已实现市值收缩反映了这一点，但美国现货ETF资金流恢复以及ETF持仓接近回本，显示机构抛压正在消退。总体而言，市场似乎趋于平衡，长期信念提供支撑，而投机参与依然受限。综上，比特币仍处于盘整阶段，投资者盈利水平良好和衍生品头寸稳定提供了支撑。然而，短期、价格敏感性资金占比增加，可能加剧波动性，使得市场虽具韧性，但对势头转变和卖盘压力将更为敏感。

insights.glassnode2小时前

insights.glassnode2小时前

尽管ETF持续流入，新资金踌躇致比特币现货需求疲软

尽管比特币现货ETF资金自7月14日起持续净流入，但新增资本犹豫不前，导致比特币现货需求减弱，价格仍难以有效突破6.5万美元附近的局部阻力区。数据显示，30天比特币现货需求已从7月初的-8万枚恶化至-17万枚。同时，衡量新资本活动的“比特币新投资者”指标虽有小幅回升，但仍接近年度低位，表明新增资金力度不足以推动趋势反转。此外，短期持有者支出产出利润率（STH SOPR）的7日移动平均值低于1.0，意味着短期持有者普遍处于亏损状态，市场情绪尚未转向积极。综合来看，当前市场呈现局部企稳特征，而非真正的看涨反转，卖压依然占据主导。

ambcrypto4小时前

ambcrypto4小时前

Chainlink巨鲸转移3260万美元LINK，如何影响其冲击9美元之路？

一笔涉及389万枚Chainlink（价值约3258万美元）的大额转账吸引了市场关注，该资金从Coinbase机构钱包转移至未知钱包，这通常被解读为大户在进行战略布局而非立即抛售。此举凸显了机构对LINK的参与度正在上升。链上数据显示，交易所净流入在长期流出后首次转为正值，约62万美元的流入量虽不大，但标志着短期市场行为的转变。然而，衍生品市场情绪仍偏谨慎，90日期货订单流持续由卖方主导，表明杠杆交易者看空信念依旧。技术面上，LINK交易价格约为8.35美元，正测试阻力位。相对强弱指数（RSI）升至57.71，显示买压增强但未超买。若能成功突破8.35美元阻力，价格有望挑战9美元；若受阻，则可能回撤至8.18美元附近。综上，机构活动和现货净流入增加为LINK带来关注，但期货市场的看空情绪以及关键阻力位的压制，使得短期走势仍存不确定性。

ambcrypto5小时前

ambcrypto5小时前

交易

现货

AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

文章摘要

23年「人造社会」

AI基准测试难以复制

智能体3块最硬骨头

刚好是EVE玩家日常

DeepMind进的是离线沙盒

不是玩家宇宙

从Atari到EVE

这条路走向哪里

热门币种推荐

相关问答

你可能也喜欢

XRP未平仓合约达26亿美元，衍生品需求激增

比特币2030年价格预测：关于下一次牛市你需要了解的信息

BTC市场脉搏：第30周

尽管ETF持续流入，新资金踌躇致比特币现货需求疲软

Chainlink巨鲸转移3260万美元LINK，如何影响其冲击9美元之路？

交易

热门文章

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

从H2A到A2A：AI Agent经济体与Crypto新机遇

美股TradFi：传统金融在AI IPO浪潮下的稳健锚点

相关讨论

热门问答

热门分类

热门标签