AGI不是终点,DeepMind新论文:迈向ASI,真正的AI进步才刚开始

marsbit发布于2026-06-16更新于2026-06-16

文章摘要

DeepMind团队最新研究报告提出,通用人工智能(AGI)很可能不是AI发展的终点。AI将继续超越人类水平,走向超级人工智能(ASI)。报告区分了AGI(达到人类中位认知水平)、ASI(在所有重要领域整体超越人类专家集体)和UAI(理论智能上界)三个概念,并探讨了从AGI迈向ASI的四条潜在路径:持续扩展计算、模型与数据规模;算法持续演化乃至范式转变;系统通过递归自我改进形成正反馈;以及通过多智能体协作形成超越单体的集体智能。 报告同时指出了发展过程中可能面临的六大关键瓶颈:高质量人类数据可能面临枯竭的“数据墙”;能源、芯片等经济和自然资源压力;现有神经网络范式在持续学习、稳定推理等方面的根本性局限;研究难度随领域成熟而增加;AI可能难以自主提炼新概念原语的“抽象壁垒”;以及监管、治理与社会反弹带来的影响。 报告最后强调,一旦AI能力超越人类,现有以人类水平为参照的评估体系将失效,需要建立面向后AGI时代的新评估机制。ASI的发展仍受物理规律、资源等现实约束,其具体路径与速度存在高度不确定性,未来需持续开展跨学科研究以应对这一前景。

如果通用人工智能(AGI)明天就实现了,AI 的下一个阶段会是什么样的?

Google DeepMind 团队及其合作者在最新研究报告中提出,AGI 很可能不是终点。在他们看来,AI 不会停留在接近人类的水平,而是会继续变强,超过最顶尖的人类专家团队,最终走向超级人工智能(ASI)。

正如艾伦·图灵曾在 1950 年写道:“我们只能看到前方很短的一段距离,但也能看到,那里还有大量工作有待完成。”

在这份报告中,研究团队梳理了 AI 从 AGI 变迁到 ASI 的四条潜在路径、可能出现的关键瓶颈,以及最值得推进的研究问题。

论文链接:https://arxiv.org/abs/2606.12683

研究团队表示,由于预测 ASI 进展存在较大不确定性,目前无法排除 AI 在未来数年内持续加速发展的可能性。这可能意味着,将人类水平 AGI 引入社会所引发“单一变革性跃迁”的图景,或许并不准确。

更为贴切的前景,可能是 AI 驱动的进步与突破将在科学技术的众多领域相继涌现,进而引发一系列变革性的社会变化。

为应对这一前景,需要开展一项具有全球视野与广泛关切的大规模跨学科工程

AGI 之后,是 ASI

在讨论 AI 会如何继续变强之前,研究团队先区分了三个容易混用的概念:AGI、ASI 和 UAI。

AGI (Artificial General Intelligence):一个在大多数认知任务上达到人类中位水平的通用智能系统。对应的是普通人的一般认知能力,而不是顶尖专家的水平。研究团队也指出,第一代 AGI 可能已在部分任务上超越人类,只是尚未具备足够广泛的通用性。

ASI (Artificial Super Intelligence):它不是只在少数任务上超越人类,而是在几乎所有人类关心的领域都整体超过人类;对应的参照对象也不是单个专家,而是大规模、协调良好的人类专家集体。

UAI(Universal Artificial Intelligence):机器智能的理论上界,由 AIXI 框架形式化描述。AIXI 对应的是一种理论上的最优通用智能体。现实中的 AI 只能逐步逼近这一上界,无法直接实现。

同时,研究团队指出, AGI 走向 ASI 可能不止一条路径,他们提出了四条可能并行推进的路径,具体如下:

路径一:继续扩展计算、模型与数据

这一路径延续了过去十年AI进步的基本逻辑,包括更强的硬件、更大的训练运行、更高的算法效率、更大的模型和更多的数据。研究团队指出,近年的“有效算力”大致相当于每年增长 10 倍。沿着这一路径,AI 的提升不只来自单个模型变强,也可能来自更多实例、更快推理和更大规模协作带来的集体能力扩展。

路径二:算法继续演化,甚至出现新的范式转变

研究团队指出,更长上下文、持续学习、检索增强、工具使用、环境交互中的鲁棒决策、世界模型等,都属于现有范式的延伸;而新的架构、训练目标或学习机制,则更接近真正的范式转变。研究团队没有具体预测下一次范式转变会是什么,但认为这仍可能是 AGI之后 AI 持续进步的重要来源。

路径三:递归自我改进

更强的 AI 可以帮助研发下一代更强的 AI,形成正反馈。研究团队提到,这种机制可以体现在算法和代码、硬件设计、数据生成与筛选,以及分工效率的改进上。像 AlphaZero 那样先用搜索改进输出,再把结果蒸馏回模型,就是一个相关例子。更重要的是,这种正反馈在现实中究竟能发展到哪一步。

路径四:多智能体协调与群体智能

这一路径关注的不是单个模型变得多强,而是大量 AGI 系统通过分工和协作,形成超出单体上限的集体智能。研究团队把自动化公司、研究组织和虚拟经济系统等,都看作这一路径可能出现的形态。按照这一路径,ASI 未必是一个极强的单体模型,也可能是一个高度协调的 AI 集体。

研究团队也提醒,AGI 走向 ASI,未必只是算力越多越好。算力扩张当然重要,但很快会撞上资源天花板,还要靠新的算法思路,甚至新的范式。更值得注意的是,即便单个 AGI 只是接近人类水平,大量 AGI 一旦能高效分工、协同合作,整体能力也可能超过人类。

真正的难点在哪里?

在讨论四条潜在路径之后,研究团队也归纳了六类可能影响 AI 继续变强的关键瓶颈。具体如下:

1.数据墙

研究团队指出,高质量的人类生成数据是有限的,适合大规模预训练的人类文本数据,可能在本十年内逼近上限。合成数据、模拟环境数据,以及 AI 与现实世界交互产生的数据,能不能足够快地补上这个缺口,研究团队没有下结论,而是把它列为核心不确定性之一。

2.经济和自然资源压力

如果 AI 的进步继续主要依赖规模扩展,那么能源、芯片、数据中心、供应链和资本投入都必须同步增长。研究团队认为这是现实约束,但也指出,AI 本身也可能提高经济产出、提升算法和硬件效率,从而缓解这些压力。

3.现有神经网络范式可能不够用

研究团队没有排除当前路线通向 ASI 的可能性,但也提醒,这一路线在持续学习、稳定推理、交互式决策、不确定性表达,以及幻觉提示注入等问题上,仍可能存在根本性局限。

4.研究本身会越来越难

研究团队指出,随着领域成熟,继续取得进展往往需要更高投入;AI 能否通过自动化研究抵消这一趋势,仍有待后续研究。

5.抽象壁垒

研究团队认为,如果今天的 AI 主要学习的是人类已经形成的概念和符号体系,它或许擅长重组已有概念,却未必擅长从原始世界中自主提炼新的概念原语。例如,如果一个现代大模型只基于前牛顿时代的知识训练,它几乎不可能仅凭这些材料自行推导出广义相对论或量子力学。

6.监管、治理和社会反弹

研究团队认为,监管门槛、许可制度、事件报告要求,以及事故引发的社会反应,都会影响AI 能力扩展的节奏。这背后不只是技术问题,也牵涉政策、制度、市场和公众的风险感知。

不足与未来发展

最后,研究团队提出了一个非常现实的问题:如果 AI 已经超过人类,我们该如何继续评估它的能力?

如今,很多 benchmark 都以人类水平为参照,一旦 AI 在考试、编程、数学、问答和专业知识测试上接近或超过顶尖人类,原有的评测指标可能就失去了意义。因此,未来需要建立面向后 AGI 时代的新评测与预测体系,包括多智能体竞争与合作任务自动生成测试通用压缩任务经济生产率等间接指标,以及能够持续更新、不过早饱和的评估机制。

不过,从内容上看,这不是一篇实验论文,而更像是一份围绕后 AGI 时代展开的技术报告。研究团队指出,未来值得关注的方向包括:继续扩展现有 AGI 系统、探索新的 AI 范式、实现系统的递归式自我改进,以及通过大规模多智能体协作形成更强的整体能力

最后,研究团队指出,ASI 也不是全知全能的“魔法系统”,它仍受物理规律计算复杂性数据资源实验时间现实反馈速度等约束。AI 会沿哪条路径推进、速度多快,目前仍高度不确定。未来,仍需要建立持续更新的基准、预测和研究机制,以降低判断中的不确定性。

本文来自微信公众号 “学术头条”(ID:SciTouTiao),作者:学术头条

相关问答

QDeepMind的新研究报告认为,在实现通用人工智能(AGI)之后,人工智能的下一个发展阶段是什么?

ADeepMind的新研究报告认为,在实现通用人工智能(AGI)之后,人工智能不会停留在人类水平,而是会继续发展,超越最顶尖的人类专家团队,最终走向超级人工智能(ASI)。

Q报告中提出了从AGI发展到ASI的哪四条潜在路径?

A报告提出了四条潜在路径:一、继续扩展计算、模型与数据;二、算法继续演化,甚至出现新的范式转变;三、递归自我改进,即AI系统帮助研发下一代更强的AI,形成正反馈;四、多智能体协调与群体智能,即大量AGI系统通过分工协作形成超出单体上限的集体智能。

Q报告中指出了哪些可能阻碍AI向ASI发展的关键瓶颈或挑战?

A报告中指出了六类关键瓶颈:一、高质量人类生成数据有限可能面临“数据墙”;二、经济和自然资源(如能源、芯片)的压力;三、现有神经网络范式可能存在根本性局限;四、研究本身会随着领域成熟而越来越难;五、AI可能面临从原始世界自主提炼新概念原语的“抽象壁垒”;六、监管、治理和社会反弹。

Q为什么研究团队认为现有的AI评估体系(如基准测试)在未来可能不再适用?

A研究团队指出,现有的许多AI评估基准(benchmark)都以人类水平为参照。一旦AI在各项任务上接近或超过顶尖人类,这些原有的评测指标就失去了意义,将无法有效衡量超越人类水平后的AI能力。

Q研究团队对未来ASI的性质和发展做了怎样的判断或说明?

A研究团队指出,ASI不是全知全能的“魔法系统”,它仍受物理规律、计算复杂性、数据、资源、实验时间和现实反馈速度等现实约束。同时,AI向ASI推进的具体路径和速度仍高度不确定,需要建立持续更新的研究机制来降低判断中的不确定性。

你可能也喜欢

你交给Claude的订阅费,光模块公司能拿到多少?

一张将Claude Pro约20美元月费拆解给模型公司、云算力、GPU折旧、电力及供应链的估算图,引发了投资者对AI应用估值逻辑的重新审视。 核心问题在于:用户为AI应用支付的订阅费,有多少能像传统SaaS(软件即服务)那样沉淀为高软件毛利?传统SaaS新增用户成本极低,毛利率可达70%-80%。而AI应用不同,用户每一次调用模型(推理)都会消耗GPU算力、电力和云资源,导致边际成本显著。固定月费背后是随使用量波动的成本链,重度用户的成本可能急剧上升。 因此,AI应用公司要获得高估值,不仅需证明用户付费意愿,更需证明在考虑使用量后,其毛利率能持续改善并接近传统软件公司。当前阶段,AI使用量的增长更直接地转化为对底层基础设施(如英伟达GPU、台积电芯片、HBM内存、电力及数据中心)的需求,这使得基础设施供应商的业绩和估值更早、更确定地得到验证。 支持AI应用高毛利前景的观点认为,当前推理成本高是早期现象。通过模型优化、缓存技术、使用小模型、自研芯片以及提高集群利用率,单位成本有望快速下降。行业已有案例显示,部分模型的单位成本大幅降低。 然而,挑战在于,AI应用正从简单问答转向更复杂、耗能更高的任务(如代码生成、长文档处理)。关键在于,推理成本下降的速度能否超越用户使用量和任务复杂度的增长速度。 总之,该分析图的价值在于提醒市场:在AI应用公司缺乏透明毛利率数据的情况下,不应简单将其收入等同于高毛利SaaS收入。投资者需要关注其成本结构、用户使用行为分层以及效率提升的实际证据。模型公司最终需要证明,即使在重度使用下,订阅收入也能转化为可观的利润。

marsbit11分钟前

你交给Claude的订阅费,光模块公司能拿到多少?

marsbit11分钟前

OpenAI的Hyperliquid盘前定价生意,为何只撑了半年?

文章讨论了在Hyperliquid平台上两家从事“盘前定价”业务的团队:Trade.xyz和Ventuals的不同命运。 Trade.xyz团队匿名,却成为平台上最大的盘前合约市场,成功抓住了SpaceX上市前的交易机会。其策略聪明之处在于,选择像SpaceX这样上市日期和发行价都已确定的标的,最终价格能与现实市场“锚定”,风险相对可控。 而获得顶级风投Paradigm支持的Ventuals,手握OpenAI和Anthropic这类更稀缺但无明确上市计划的标的,反而在运营九个月后关停。其失败关键在于定价机制存在缺陷:合约价格一半依赖外部非公开的老股报价,另一半则参考其自身价格的均线,形成了一个自我强化的循环。这导致价格长期虚高,缺乏真实市场流动性的支撑和纠错,最终失去市场认可。 Ventuals关停时,其定出的OpenAI(1341.80美元)和Anthropic(1618.90美元)的最终价,甚至被部分内部人士作为估值参考,凸显了未上市公司对流动定价的强烈需求,也暴露了这类定价的脆弱性。 文章指出,为未上市明星公司提供实时交易价格正成为一门热门生意,Coinbase等大机构也已入场。但Ventuals的案例表明,这门生意的核心挑战在于,缺乏一个公开、有效、能持续纠错的市场机制来形成真正公允的价格。在标的公司真正上市前,任何定价都可能面临“悬空”的风险。

marsbit27分钟前

OpenAI的Hyperliquid盘前定价生意,为何只撑了半年?

marsbit27分钟前

日活冲到行业第二的3-4倍,腾讯WorkBuddy撕开了办公Agent的哪条裂缝?

2026年上半年,腾讯推出的办公智能体(Agent)产品WorkBuddy日活跃用户已达行业第二名产品的3到4倍,其高速增长的核心在于成功吸引了大量非技术岗位用户(如HR、运营、行政)。这与OpenAI同期披露的Codex趋势相似(非开发者增速是开发者的3倍以上),但二者路径截然不同。 WorkBuddy并非预设产品,其前身是代码助手CodeBuddy。转折点在于腾讯内部非技术员工自发用它处理研究、报告等非编码任务。团队洞察到“产物才是目的”,于2026年1月快速推出极简版WorkBuddy,公测前已有超2000名内部非技术员工每日使用。 其成功源于三个关键设计决策: 1. **用自然语言替代技术概念**:用户无需理解Agent、prompt等术语,直接以日常语言下达任务。 2. **预封装场景模板**:内置超20种Skills技能包(如数据处理、竞品调研),开箱即用,无需自建流程。 3. **深度原生集成生态**:深度“住进”腾讯文档、微信等国内高频办公软件,成为现有工作流的一部分,而非独立工具。 这些设计拆除了认知、场景和环境三重门槛。相比之下,Codex和Claude Code从命令行/IDE出发,面向开发者,非技术用户需跨越安装、配置和理解交互逻辑的障碍。尽管OpenAI和Anthropic已开始推出角色插件或简化界面(如Claude Cowork)向非技术用户转向,但交互范式和生态集成的重构需要时间,这为WorkBuddy创造了约半年的领先窗口。 数据显示,WorkBuddy在2026年3月公测后增速迅猛(环比达831%),PC端月访问量领先第二名2.6倍。其定价(个人版起价39元/月)也低于海外同类产品(20美元/月起),在国内市场触及面更广。 WorkBuddy代表“场景封装”路线,追求用户使用路径最短;海外产品则侧重“底层能力”,追求功能最强。当前,WorkBuddy已发布企业版以巩固优势,但面对海外巨头在底层模型能力和快速追赶,其先发优势将面临长期考验。核心差异在于:用户无需懂技术,只需知道自己要什么。

marsbit35分钟前

日活冲到行业第二的3-4倍,腾讯WorkBuddy撕开了办公Agent的哪条裂缝?

marsbit35分钟前

比特币矿场变AI数据中心:Sangha的“卖身”抉择

2025年12月,Spencer Marr在美国德州为名为Genesis的比特币矿场剪彩。这座规模19.9兆瓦的矿场采用“表后直供”模式,直接从相邻的太阳能农场获取低价电力,实现了低至约32美元/兆瓦时的运营成本,使其在比特币行情下行时仍能盈利。 然而,通电仅半年后的2026年6月,Marr的公司Sangha便通过投行放出消息,考虑出售、合资或引入战略伙伴。其根本原因并非经营不善,而是AI算力需求爆发带来了新的估值逻辑。对于亟需电力与数据中心资源的AI公司而言,Genesis这样一个已通电、有扩容潜力(规划至110.4兆瓦)且电力接入手续齐全的站点,价值远超过其作为矿场的本身。 Sangha的商业模式是项目制,通过设立特殊目的载体(SPV)吸引投资。如今,他们计划在估值高点出售这份“电力资产”,这比自行扩建为AI数据中心更为划算。其推介重点也已从比特币挖矿转向AI计算、高性能计算等多元场景。 这一转变并非个例,Core Scientific等上市矿企也已纷纷转向AI/HPC业务。Sangha的案例凸显了一个趋势:在AI的巨大需求下,拥有稳定、低价电力资源的比特币矿场基础设施,正成为被争抢的稀缺资产。矿工们面临的抉择是:是坚守挖矿,还是将阵地拱手让给AI,换取丰厚的资本回报。

marsbit1小时前

比特币矿场变AI数据中心:Sangha的“卖身”抉择

marsbit1小时前

交易

现货
合约

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

574人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片