AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

marsbit发布于2026-06-30更新于2026-06-30

文章摘要

OpenAI首席研究官Mark Chen近日表示，通用人工智能（AGI）即将到来，人类面临的窗口期“很小”。他认为，AI模型正快速接近能够自主进行“自我维持研究”的阶段，届时创新和进化或将由AI主导。 Chen指出，如今在各个领域都已出现AI的“神之一手”——做出超越人类直觉的突破。他坚信，扩展定律（Scaling Laws）尚未失效，技术进步仍处在指数曲线上。此前OpenAI在内部大力押注的推理模型o1的成功，也增强了这一信心。随着AI执行能力的大幅提升，人类在研究中的角色可能演变为“氛围研究员”（Vibe Researcher），即主要负责提出关键问题和凭借“品味”判断成果价值，而将具体的实施、编排工作交给AI。OpenAI的路线图目标正是实现端到端的AI自主研究。然而，通往AGI之路仍充满挑战。一是评估危机（Benchmaxxing），现有评测方法易被钻空子，缺乏真正有效的评估标准；二是“参差的前沿”问题，AI可能在复杂任务上表现出色，却在需要常识或持续学习的简单任务上失败。Chen承认这些难题，但相信正在被攻克。最后，Chen谈及一个温馨的隐喻：当AGI实现后，他个人的愿望是开一家面馆。这暗示在AI主导认知与创新的未来，人类独有的体验、情感与故事，可能成为最宝贵的价值。

通用人工智能AGI,即将到来。

刚刚,OpenAI首席研究官Mark Chen豪言:

在某种意义上,就像希望你能感觉到,AGI(通用人工智能)即将到来......

我们正越来越接近这样一个世界:模型能够自主提出更多创新——它们能够进行自我维持的研究。

这不仅仅是效率的提升,「进化」本身也被外包给了硅基生命。

当Mark Chen在镜头前熟练地切着蘑菇和洋葱时,他谈论的不仅是一碗汤,而是人类文明最后的一块阵地。

如果AI能够自己研究自己,那在AGI到来的前夜,人类究竟该扮演什么角色?

每个领域都在经历自己的「神之一手」

要明白这句话的分量,得先回到Mark入行的那一刻。

2016年,AlphaGo对战李世石。

第二局里有一手「第37手」,落子的瞬间,全人类棋手集体看不懂。

后来才明白,那是机器走出的、人类根本想不到的一手。那一刻点燃了无数人,也把Mark Chen拽进了这个领域。

而如今呢?

「最疯狂的是,」Mark说,「你现在在几乎每一个领域,都能看到『神之一手』。」

数学里有,计算机科学里有,编程里有。

他描述了一个很微妙的时间点:很多人是在今年年初「一觉醒来」,突然意识到:AI agent在我这一行,真的能干活了。

不是玩具。不是demo。是能替你完成有意义的、长周期的真实工作(long-horizon work)。

这意味「模型自己做研究」这件事,不再是科幻片里的桥段。

它是从一连串已经发生的「神之一手」里,自然外推出来的下一步。

你顺着这条线往前看,终点处站着的,就是那个会自己搞研究的模型。

Scaling不止,预训练未死

可这种乐观,到底靠什么撑着?

靠一个信念:Scaling曲线还没到头。

这两年,「预训练已死」「语言模型到不了AGI」的论调隔三差五就要冒出来。

Mark Chen对这些唱衰「相当激烈地反对」。

他点破了套路。

「预训练已死」听着很新鲜,其实是部老掉牙的剧本,过去这些年被反复重播。

每一次,都有人指着某个瓶颈说「到顶了,过不去了」;每一次,OpenAI又总能掏出一个新的工程技巧、或某个研究上的新洞见,把那堵墙凿穿。

Mark Chen坚信,「我们正处在指数曲线上。它已经撑过了将近10个数量级,没有任何理由它不会继续撑下去。」

而最有说服力的证据,是OpenAI自己亲手赌赢过一次。

赌的,就是推理(reasoning)。

o1刚立项时,连OpenAI内部都有人不信。

当时「预训练+后训练」的范式太能打了,有人会很自然地问:机器已经转得好好的,何必再去折腾别的?

是Jakub Pachocki、Ilya Sutskever等几个有信念、有判断力的人硬推,才慢慢把它变成全公司的根本性赌注。

一年后,o1出世,推理范式引爆整个行业。

曲线还没到头,加上最大的突破往往来自一开始没人信的赌注,这两条加在一起,就是Mark Chen敢说「模型自我维持研究不远了」的底气。

当模型开始在长达数周、甚至数月的任务上进行思考时,它所产生的创新,可能已经超出了人类专家的认知盲区。

这正是「自我维持科研」的基石:如果它能推导出人类没见过的数学公式,它当然也能写出比人类更优的算法架构。

Vibe Researcher:当执行力变得廉价

我们已经有了vibe coder——动动嘴,让AI写代码。

研究,也在往这个方向滑。

在访谈中,一个极具争议的概念被反复提及:Vibe Researcher(氛围研究员)。

这是一个略带自嘲但深思熟虑的职业预测。

Mark认为,未来的顶级研究员将不再是那个写下每一行PyTorch代码的人,而是那个「拿捏感觉」的人。

无论是OpenAI还是其他实验室,你都开始看到,大量的工作正在变成以「编排」(orchestration)为主。

翻译成人话:人负责出主意,模型负责把活全干完。

研究员动脑子想点子,剩下的实现、执行、调度,模型自己搞定。

OpenAI的三年路线图,终点写得明明白白:让模型做端到端(end-to-end)的研究,从出主意到出成果,全程自己来。

但这条路上,全是还没填平的坑

随着AI能够自主执行和编排(Orchestration)任务,人类的工作将被极限压缩到两端:

1、提出真正的问题。

2、判断AI给出的答案是否有「灵魂」。

这就是所谓的「品味」(Taste)。

因为机器没有「生活」,所以它没有「常识」,也就无从产生「品味」。

但冷静下来想,Mark Chen自己比谁都清楚,这条路远没有铺平。

第一个坑:评测,崩了。

他用了一个内部词,叫「Benchmaxxing」(刷榜)——找一堆和测试集长得几乎一模一样的题,往死里训,分数好看得不得了,泛化能力半点没涨。

更糟的是,公认的金标准benchmark数量太少。

「我们真的处在一场评测危机里。」他说,SAT那种经典测试,对今天的模型全都饱和了。

甚至,一个评测一旦被公开到世界上,它就已经不是好评测了,就像一张印出来就立刻作废的考卷。

应对这一问题的两种策略:

1、将评估创建团队与模型优化团队分离,形成一种对抗性激励。

2、大规模部署模型并观察实际应用中的失败模式。

他还指出,每一项新能力的出现都会伴随着对应的评估需求,而引导评估方向是他工作中相当重要的一部分。

第二个坑:参差的前沿(jagged frontier)。

模型能拿下奥数、信奥级别的难题,却可能搞不定人类随手就能做的琐事,就一个能心算微积分、却不会自己系鞋带的天才。

差在哪?差在「上下文」,差在持续学习(continual learning)——把一个任务里学到的教训,用到下一个任务上。

这对人太自然了,对模型,却是全行业正在死磕的硬骨头。

被问到通往AGI是不是还需要两三个根本性的突破,Mark没接。

他说,持续学习这种东西是「必须解锁的基础能力」,至于算不算"突破"他说不好,但「很多发都已经瞄准了球门,我相当确定它们会进。」

这就是他的态度:坑是真的,每一个坑都已经有人在填,而且他赌填得上。

汤的隐喻:在AGI之后去开个面馆

访谈中最温馨的一幕,是关于「汤」的故事。

据说Mark Zuckerberg曾试图用自制的汤去挖走OpenAI的研究员,而Mark Chen的回应则是:直接把汤带到办公室分给大家。

当被问到AGI实现后的终极愿望时,这位掌管着全球最强大AI大脑的人,回答:

「我想去开个面馆。这可能是我的AGI后爱好。」

这个回答里藏着深意。

当AI能够完成所有「自我维持的科研」,当所有的知识和创新都能以光速产生,人类最稀缺的资源将不再是智力,而是「体验」。

机器可以算出一碗汤的最佳咸度,但它永远无法赋予这碗汤以「温度」和「故事」。

参考资料:

https://www.youtube.com/watch?v=fpAthTtha8c

https://finance.biggo.com/podcast/1241bc21164ccc75

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜欢

估值倒挂显现，比特币财库企业爆发信任危机

**比特币财库企业正面临严峻的估值与信任危机，市场逻辑发生根本转变。** 过去，企业增持比特币的行为本身就能推高其股价。但现在，投资者的关注点已从“囤积总量”转向“股东实际权益”。他们会仔细核算融资造成的股权稀释、优先股分红、债务利息等成本，以判断普通股股东每股对应的比特币持有量是否真正增加。关键指标“修正资产净值”（企业市值/持有比特币总价值）的收缩揭示了这一困境。当该值低于1，意味着企业市值已低于其持有的比特币价值，估值溢价消失。例如，亚洲头部企业Metaplanet的修正资产净值已跌至0.9倍，其股价年内重挫约47%。行业龙头MicroStrategy同样面临挑战。尽管持有大量比特币，但其普通股股东的实际份额因持续的股权融资（尤其是为保障优先股股息）而被稀释。其衡量股东收益的核心指标“比特币收益率”也已下滑。欧洲新晋企业如法国的Capital B和瑞典的BTC AB，正在推行激进的融资计划，但其复杂的融资工具（如高股息优先股）尚未经过市场充分定价，成本风险不明确。 **市场转向的深层原因在于比特币现货ETF的普及**，它为投资者提供了更直接、低成本持有比特币的渠道，削弱了财库企业股票的稀缺性。如今，这类企业必须证明自己能通过杠杆、高效资本运作带来超额收益，而非仅仅提供一个附带稀释成本的比特币敞口。此变化正倒逼行业优化：健康融资的企业将获得信任并持续发展；而无法维持估值溢价、融资闭环断裂的企业，将陷入被迫出售资产、转型高风险业务（如借贷）或损害股东利益的困境。下一阶段的赢家，将是那些能证明每次融资都切实增加了普通股股东比特币份额的企业。

Foresight News13分钟前

Foresight News13分钟前

NanoBit加密货币骗局以美国SEC胜诉并获赔552万美元告终——详情解析

美国证券交易委员会（SEC）在对加密货币平台NanoBit的诉讼中获胜。SEC指控NanoBit及其关联方在2023年9月至2024年6月期间实施“杀猪盘”诈骗，通过WhatsApp等通讯应用接触受害者，利用虚假的加密货币首次代币发行项目承诺高额回报以骗取信任，并谎称其关联公司NanobitUS Securities是SEC注册经纪商。 2024年6月29日，SEC宣布了这一胜利。此前，美国纽约东区联邦地区法院对涉及NanoBit欺诈案的两名个人和四家实体作出了最终判决。法官指出，NanoBit平台并未发生真实交易，投资者资金被转入香港银行账户，且数十万美元的加密资产被挪用。除NanoBit外，被告还包括Radiant Horizons Limited、Sweet Karma Fashion Inc.、Zhao Tropical Deli Inc.以及个人Jiajie Liu和Hua Zhao。法院判决永久禁止被告违反美国证券法中的反欺诈条款，并责令他们支付总计约552万美元的罚金，其中包括追缴非法所得、判决前利息和民事罚款。其中NanoBit被罚约180万美元，其他三家实体各被罚超118万美元。法官认定被告故意缺席，未提出有效抗辩，若不作出缺席判决，SEC将遭受不公损害。

ambcrypto16分钟前

ambcrypto16分钟前

Claude Code官宣下一版大升级，你在聊天，后台把活干完了

Claude Code 即将推出重大升级，未来版本将默认让子智能体在后台运行。这意味着用户在与 Claude 聊天讨论时，后台的子智能体可以同步执行如代码重构、测试、提交拉取请求等任务，真正实现“边聊边干活”。用户只需在对话结束后查看结果，并可随时将特定智能体切换到前台。这一改进标志着 Claude Code 正从传统的问答式工具演变为能并行管理多条任务线的工作流引擎。其设计哲学是“不是聊天，是基建”。此前，Anthropic 已陆续推出了定时任务（Routines）和动态工作流（Dynamic workflows）功能，允许将复杂任务编排成脚本，调度大量子智能体协作完成。此次更新是将这些能力打包为开箱即用的默认行为。实际影响显著。据报道，Claude Code 已将 Anthropic 内部工程师的有效产出提升至实际人数的三倍，导致公司更需要能决定“写什么代码”的产品思考者，而非单纯写代码的工程师。Spotify 的案例更具说服力：其超过2000万行的代码库中，73%的拉取请求由 AI 辅助完成，部署频率提升75%以上。工程副总裁可同时管理多个后台智能体并行工作，非工程师也能通过自然语言描述来生成端到端原型。核心转变在于，当后台智能体成为标配，工程师的核心价值将从“编写代码”转向“决策与判断”——即思考下一步做什么，并评估结果是否正确。这预示着 AI 编程工具正进入一个以工作流自动化和智能协作为特征的新量级。

marsbit18分钟前

marsbit18分钟前

a16z 简报：预测市场连续第三周刷新纪录，单周交易量首破 144 亿美元

a16z Crypto数据显示，预测市场上周单周交易量首次突破144亿美元，连续第三周创历史新高，年初该数字仅为50-60亿美元。所有平台总交易量已达一年前的10倍以上。同时，未平仓合约（未结算持仓总额）上周达到16亿美元，同样连续第三周刷新周度纪录。自去年秋季以来，该指标已增长约8倍，表明持续有新增资金流入市场。值得注意的是，非体育类（涵盖政治、经济、地缘等）预测市场增长尤为迅猛。上周仅Kalshi和Polymarket两家平台的非体育类交易量合计就达36亿美元，超过了去年包含体育在内的全市场单周总量。自2025年7月以来，非体育类周交易量已飙升约18倍，增长势头强劲。数据表明，预测市场的热度早已超越体育赛事范畴，呈现全面扩张态势。

marsbit18分钟前

marsbit18分钟前

从交易到支付，代币化黄金正在获得更多链上使用场景

代币化黄金（如Matrixdock的XAUm）的应用场景正从单纯的资产发行扩展到链上交易与支付。近期，XAUm和代币化白银XAGm已上线Sui生态交易平台Deeptrade，并开放与USDC的交易对，获得流动性支持，开始参与链上交易网络。同时，XAUm已支持通过AnomaPay在BNB Chain上进行隐私支付，用户可在保护交易隐私的前提下进行持有、转账和支付，拓展了其作为价值交换工具的功能。这反映出RWA（现实世界资产）行业关注点的转变：从注重资产上链的规模，转向资产在链上的实际使用与流动性。代币化黄金在保持价值存储属性的基础上，正通过交易和支付等场景融入数字金融生态。未来，资产能否真正参与交易、流动和价值交换，将成为RWA发展的关键方向。

marsbit38分钟前

交易

现货

AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

文章摘要

每个领域都在经历自己的「神之一手」

Scaling不止,预训练未死

Vibe Researcher:当执行力变得廉价

但这条路上,全是还没填平的坑

汤的隐喻:在AGI之后去开个面馆

热门币种推荐

相关问答

你可能也喜欢

估值倒挂显现，比特币财库企业爆发信任危机

NanoBit加密货币骗局以美国SEC胜诉并获赔552万美元告终——详情解析

Claude Code官宣下一版大升级，你在聊天，后台把活干完了

a16z 简报：预测市场连续第三周刷新纪录，单周交易量首破 144 亿美元

从交易到支付，代币化黄金正在获得更多链上使用场景

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签