AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

marsbit发布于2026-06-30更新于2026-06-30

文章摘要

OpenAI首席研究官Mark Chen近日表示，通用人工智能（AGI）即将到来，人类面临的窗口期“很小”。他认为，AI模型正快速接近能够自主进行“自我维持研究”的阶段，届时创新和进化或将由AI主导。 Chen指出，如今在各个领域都已出现AI的“神之一手”——做出超越人类直觉的突破。他坚信，扩展定律（Scaling Laws）尚未失效，技术进步仍处在指数曲线上。此前OpenAI在内部大力押注的推理模型o1的成功，也增强了这一信心。随着AI执行能力的大幅提升，人类在研究中的角色可能演变为“氛围研究员”（Vibe Researcher），即主要负责提出关键问题和凭借“品味”判断成果价值，而将具体的实施、编排工作交给AI。OpenAI的路线图目标正是实现端到端的AI自主研究。然而，通往AGI之路仍充满挑战。一是评估危机（Benchmaxxing），现有评测方法易被钻空子，缺乏真正有效的评估标准；二是“参差的前沿”问题，AI可能在复杂任务上表现出色，却在需要常识或持续学习的简单任务上失败。Chen承认这些难题，但相信正在被攻克。最后，Chen谈及一个温馨的隐喻：当AGI实现后，他个人的愿望是开一家面馆。这暗示在AI主导认知与创新的未来，人类独有的体验、情感与故事，可能成为最宝贵的价值。

通用人工智能AGI,即将到来。

刚刚,OpenAI首席研究官Mark Chen豪言:

在某种意义上,就像希望你能感觉到,AGI(通用人工智能)即将到来......

我们正越来越接近这样一个世界:模型能够自主提出更多创新——它们能够进行自我维持的研究。

这不仅仅是效率的提升,「进化」本身也被外包给了硅基生命。

当Mark Chen在镜头前熟练地切着蘑菇和洋葱时,他谈论的不仅是一碗汤,而是人类文明最后的一块阵地。

如果AI能够自己研究自己,那在AGI到来的前夜,人类究竟该扮演什么角色?

每个领域都在经历自己的「神之一手」

要明白这句话的分量,得先回到Mark入行的那一刻。

2016年,AlphaGo对战李世石。

第二局里有一手「第37手」,落子的瞬间,全人类棋手集体看不懂。

后来才明白,那是机器走出的、人类根本想不到的一手。那一刻点燃了无数人,也把Mark Chen拽进了这个领域。

而如今呢?

「最疯狂的是,」Mark说,「你现在在几乎每一个领域,都能看到『神之一手』。」

数学里有,计算机科学里有,编程里有。

他描述了一个很微妙的时间点:很多人是在今年年初「一觉醒来」,突然意识到:AI agent在我这一行,真的能干活了。

不是玩具。不是demo。是能替你完成有意义的、长周期的真实工作(long-horizon work)。

这意味「模型自己做研究」这件事,不再是科幻片里的桥段。

它是从一连串已经发生的「神之一手」里,自然外推出来的下一步。

你顺着这条线往前看,终点处站着的,就是那个会自己搞研究的模型。

Scaling不止,预训练未死

可这种乐观,到底靠什么撑着?

靠一个信念:Scaling曲线还没到头。

这两年,「预训练已死」「语言模型到不了AGI」的论调隔三差五就要冒出来。

Mark Chen对这些唱衰「相当激烈地反对」。

他点破了套路。

「预训练已死」听着很新鲜,其实是部老掉牙的剧本,过去这些年被反复重播。

每一次,都有人指着某个瓶颈说「到顶了,过不去了」;每一次,OpenAI又总能掏出一个新的工程技巧、或某个研究上的新洞见,把那堵墙凿穿。

Mark Chen坚信,「我们正处在指数曲线上。它已经撑过了将近10个数量级,没有任何理由它不会继续撑下去。」

而最有说服力的证据,是OpenAI自己亲手赌赢过一次。

赌的,就是推理(reasoning)。

o1刚立项时,连OpenAI内部都有人不信。

当时「预训练+后训练」的范式太能打了,有人会很自然地问:机器已经转得好好的,何必再去折腾别的?

是Jakub Pachocki、Ilya Sutskever等几个有信念、有判断力的人硬推,才慢慢把它变成全公司的根本性赌注。

一年后,o1出世,推理范式引爆整个行业。

曲线还没到头,加上最大的突破往往来自一开始没人信的赌注,这两条加在一起,就是Mark Chen敢说「模型自我维持研究不远了」的底气。

当模型开始在长达数周、甚至数月的任务上进行思考时,它所产生的创新,可能已经超出了人类专家的认知盲区。

这正是「自我维持科研」的基石:如果它能推导出人类没见过的数学公式,它当然也能写出比人类更优的算法架构。

Vibe Researcher:当执行力变得廉价

我们已经有了vibe coder——动动嘴,让AI写代码。

研究,也在往这个方向滑。

在访谈中,一个极具争议的概念被反复提及:Vibe Researcher(氛围研究员)。

这是一个略带自嘲但深思熟虑的职业预测。

Mark认为,未来的顶级研究员将不再是那个写下每一行PyTorch代码的人,而是那个「拿捏感觉」的人。

无论是OpenAI还是其他实验室,你都开始看到,大量的工作正在变成以「编排」(orchestration)为主。

翻译成人话:人负责出主意,模型负责把活全干完。

研究员动脑子想点子,剩下的实现、执行、调度,模型自己搞定。

OpenAI的三年路线图,终点写得明明白白:让模型做端到端(end-to-end)的研究,从出主意到出成果,全程自己来。

但这条路上,全是还没填平的坑

随着AI能够自主执行和编排(Orchestration)任务,人类的工作将被极限压缩到两端:

1、提出真正的问题。

2、判断AI给出的答案是否有「灵魂」。

这就是所谓的「品味」(Taste)。

因为机器没有「生活」,所以它没有「常识」,也就无从产生「品味」。

但冷静下来想,Mark Chen自己比谁都清楚,这条路远没有铺平。

第一个坑:评测,崩了。

他用了一个内部词,叫「Benchmaxxing」(刷榜)——找一堆和测试集长得几乎一模一样的题,往死里训,分数好看得不得了,泛化能力半点没涨。

更糟的是,公认的金标准benchmark数量太少。

「我们真的处在一场评测危机里。」他说,SAT那种经典测试,对今天的模型全都饱和了。

甚至,一个评测一旦被公开到世界上,它就已经不是好评测了,就像一张印出来就立刻作废的考卷。

应对这一问题的两种策略:

1、将评估创建团队与模型优化团队分离,形成一种对抗性激励。

2、大规模部署模型并观察实际应用中的失败模式。

他还指出,每一项新能力的出现都会伴随着对应的评估需求,而引导评估方向是他工作中相当重要的一部分。

第二个坑:参差的前沿(jagged frontier)。

模型能拿下奥数、信奥级别的难题,却可能搞不定人类随手就能做的琐事,就一个能心算微积分、却不会自己系鞋带的天才。

差在哪?差在「上下文」,差在持续学习(continual learning)——把一个任务里学到的教训,用到下一个任务上。

这对人太自然了,对模型,却是全行业正在死磕的硬骨头。

被问到通往AGI是不是还需要两三个根本性的突破,Mark没接。

他说,持续学习这种东西是「必须解锁的基础能力」,至于算不算"突破"他说不好,但「很多发都已经瞄准了球门,我相当确定它们会进。」

这就是他的态度:坑是真的,每一个坑都已经有人在填,而且他赌填得上。

汤的隐喻:在AGI之后去开个面馆

访谈中最温馨的一幕,是关于「汤」的故事。

据说Mark Zuckerberg曾试图用自制的汤去挖走OpenAI的研究员,而Mark Chen的回应则是:直接把汤带到办公室分给大家。

当被问到AGI实现后的终极愿望时,这位掌管着全球最强大AI大脑的人,回答:

「我想去开个面馆。这可能是我的AGI后爱好。」

这个回答里藏着深意。

当AI能够完成所有「自我维持的科研」,当所有的知识和创新都能以光速产生,人类最稀缺的资源将不再是智力,而是「体验」。

机器可以算出一碗汤的最佳咸度,但它永远无法赋予这碗汤以「温度」和「故事」。

参考资料:

https://www.youtube.com/watch?v=fpAthTtha8c

https://finance.biggo.com/podcast/1241bc21164ccc75

本文来自微信公众号“新智元”,作者:ASI启示录

你可能也喜欢

AI 时代，比特币还剩什么呢？

作者认为，在AI时代，信息生成成本趋近于零，导致真实与虚假内容难以辨别，“可验证性”变得稀缺。与此对比，比特币虽然因能耗高被诟病，但其本质是消耗能源来确保账本历史的不可篡改，从而提供一种不依赖任何中心化信任、仅靠数学与全网节点即可验证的机制。文章将AI比作降低“创造”成本的现代印刷机，而区块链（如比特币）则像降低“验证”成本的复式记账法。两者并非竞争关系：AI负责高效生成内容，区块链负责为数字资产与记录提供去中心化的验证基础。因此，比特币可被视为一台“制造可验证性的机器”。在AI生成内容泛滥的未来，独立验证的事实可能成为新的价值所在。

链捕手7分钟前

链捕手7分钟前

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

比特浸入科技（Bitmine Immersion Technologies）近期再次成为头条，其在一周内增持了27,084枚以太坊（ETH）。这使得其以太坊总持有量达到5,700,040枚，按每枚1,569美元计算，价值约90.1亿美元，占以太坊总供应量的4.7%。此次增持发生在以太坊价格从约1780美元下跌至1578.54美元（撰稿时）的一周内。同时，根据SoSo Value数据，以太坊ETF在整个六月大部分时间出现资金外流，总额达5.0139亿美元。针对疲软的市场状况，比特浸入科技董事长汤姆·李（Tom Lee）表示，近期市场对加密货币投资者颇具挑战，并指出临近季度末的“粉饰橱窗”行为导致投资者减持过去三个月表现不佳的资产是常见现象。此外，迈克尔·赛勒（Michael Saylor）的公司Strategy正面临持续审查，据报道其持有约140亿美元未实现亏损，而其普通股和优先股价格均跌破100美元水平，引发加密社区部分人士建议其停止扩张比特币持仓。由于比特浸入科技常被称为“以太坊的Strategy”，市场担忧其持续的以太坊积累行为可能面临类似困境与批评。目前上市公司共持有价值约749.4亿美元的比特币和114.8亿美元的以太坊，Strategy是最大的比特币持仓上市公司。然而，目前这些担忧仅是推测。比特浸入科技并非单纯积累以太坊，其每年质押收入估计达2.11亿美元，同时持有5.55亿美元现金及等价物以及488万枚质押的ETH。该公司还于6月26日被纳入罗素1000大型股指数。汤姆·李强调，公司计划稳步增长至2026年，并认为市场正开启新一轮牛市周期，代币化和人工智能的快速进展将推动区块链和去中心化加密领域的指数级需求增长。最终摘要： * 新增持后，比特浸入科技持有5,700,040枚ETH，价值约90.1亿美元。 * 尽管以太坊价格疲软、ETF资金外流且Strategy面临批评，比特浸入科技仍持续购入以太坊。

ambcrypto1小时前

ambcrypto1小时前

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

英国金融行为监管局公布新的加密货币监管框架，采取风险为本方法而非“一刀切”规则，将于2027年10月生效。新规要求加密公司持有充足资本覆盖潜在损失，具体金额将根据其风险状况浮动，较小或风险较低的公司可减少信息披露负担以节省合规成本。企业需自行评估资产负债表风险并进行年度压力测试，以确定所需资本水平，FCA将审核评估结果但不强加统一规则。此举旨在提升市场信心，吸引额外300-400万英国用户使用加密货币。针对稳定币，FCA保留了基本框架但简化了部分合规要求，例如取消储备构成预测估算，同时强化消费者保护，要求储备资产置于法定信托下并允许最多5%的流通稳定币作为储备。大型系统性发行机构可能面临更严监管。监管机构强调新规为加密行业提供了明确性与稳健基础，但也有市场人士提醒，监管虽可增强保护、减少欺诈，但无法完全消除风险。FCA将于下月开始提供许可申请前支持会议，以协助企业适应新规。

ambcrypto2小时前

ambcrypto2小时前

你天天用的Claude和Codex，Meta内部不让随便用了

今年5月，Meta为其应用AI工程部门的工程师划定了红线：限制内部使用Claude Code和Codex这两款流行的AI编程工具，相关限制至今仍在生效。作为这些工具的主要客户之一，Meta此举并非因其不好用，而是恰恰相反——担心其过于强大和好用。 Meta正在自研名为MetaCode的AI编程助手，旨在替代外部模型以节省成本并掌握核心技术。限制使用外部模型的核心原因，是防止“蒸馏陷阱”：即担忧员工在构建MetaCode的训练数据、编程题库和评测标准时，过度依赖或掺入Claude/Codex的输出。这会导致自研模型在不知不觉中学习对手的“本事”和判断标准，使能力来源模糊，并可能违反与OpenAI、Anthropic等竞争对手的服务条款，引发法律风险。内部指南明确禁止了可能让外部AI模型“定义能力”的三类任务：不能用其输出来生成测试题目、不能用其分析代码或设计测试点、其生成内容不得进入被测模型的访问环境。仅允许AI处理搭建工作流、整理文件等“打下手”的辅助性任务，且所有AI产出必须经过人工审核。这一事件揭示了AI行业的一个普遍困境：在利用强大外部工具加速自身研发的同时，如何清晰界定并守护自身模型能力的原创性，避免陷入知识产权与合同风险。随着AI参与创造AI的循环加深，“本事究竟是谁的”这条界线正变得越来越模糊。

marsbit2小时前

marsbit2小时前

为什么今天我们需要AI内容观？

亚马逊AI动画《朋克鸭》因伦理争议被叫停，折射出AI内容当前面临的困境。2026年AI视频技术取得突破，能产出完整视觉故事，推动短剧和仿真人内容爆发，院线级AI长片加速涌现。然而，AI在影视行业的应用也引发激烈争议，尤其围绕替代真人表演的伦理问题。 AI内容在不同媒介场景中适配度不同。短视频等“文化速食”内容追求快节奏、浅层情绪和免费模式，AI能高效提供海量供给，满足用户碎片化娱乐需求。但进入影视等“文化正餐”领域则面临挑战，因为影视承载着更深的情感表达、艺术创新和社会意义构建功能，其核心价值在于人的独特参与。 AI难以完全替代真人创作的价值。人在创作中的创新能力、劳动付出凝结的生命经验，以及基于真实情感和个性化表达的互动，是文化作品珍贵性的核心。尽管AI能提升生产效率、拉高质量均值，但易导致内容同质化，并可能通过低成本优势挤压人类创作空间，引发侵权和低质内容泛滥的风险。因此，发展AI内容需要建立明确的边界和规则，即“AI内容观”。其核心原则是：确保AI放大而非挤压人的创作空间；尊重而非掠夺人的创作成果；坚持人在创作中的主导地位与责任；保障AI创作的公开、透明与可溯源。最终目标是让人成为技术的“掌舵者”，在利用AI提升效率的同时，守护文化创作中人的主体性和核心价值，推动AI向善、文化向美。

marsbit3小时前

marsbit3小时前

交易

现货

AGI倒计时，OpenAI首席研究官重磅表态：留给人类的窗口“很小”

文章摘要

每个领域都在经历自己的「神之一手」

Scaling不止,预训练未死

Vibe Researcher:当执行力变得廉价

但这条路上,全是还没填平的坑

汤的隐喻:在AGI之后去开个面馆

热门币种推荐

相关问答

你可能也喜欢

AI 时代，比特币还剩什么呢？

Bitmine以太坊储备增至98亿美元："加密货币最好的年份尚未到来"

英国FCA公布加密资产监管规则手册：基于风险的方法将于2027年10月启动

你天天用的Claude和Codex，Meta内部不让随便用了

为什么今天我们需要AI内容观？

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签