2028,RSI降临

marsbit发布于2026-06-28更新于2026-06-28

文章摘要

AI正从被训练的工具转变为自主进化的实体,递归自我改进(RSI)成为焦点。Anthropic联合创始人Jack Clark预测,到2028年底,AI很可能无需人类干预,自主创造出更强大的下一代AI,概率约为60%。他基于数据推演指出,AI进步速度正超越人类评估上限。 同时,谷歌DeepMind负责人Demis Hassabis证实,所有前沿AI实验室都在全力推进RSI,将其视为行业共同方向。他坦言对此深感忧虑,甚至影响睡眠。 实际进展支撑了这些预测。例如,Claude Opus 4.7在MirrorCode测试中独立编程19天,成功重建复杂软件,效率远超人类工程师。Anthropic内部数据显示,其代码库超过80%的代码由AI编写,工程师产能提升至8倍,AI在优化自身训练代码时甚至实现52倍加速。 OpenAI也在政策文件中承认RSI的早期迹象,并视其为未来核心安全议题。Sam Altman内部表态称,若RSI临近,公司甚至可能推迟万亿级IPO。 综上,多个权威信号表明,AI自主改进的飞轮已开始高速旋转,2028年可能成为关键转折点。行业竞争加剧,但随之而来的治理与安全挑战也亟待应对。

【新智元导读】AI已经不再只是被训练的工具,而是开始亲手改写自己的进化速度。2028年,RSI引爆ASI的倒计时正在加速逼近。

AI自己造AI的倒计时,真的开始了。

这一次,给出时间表的是Anthropic联合创始人Jack Clark。

在Aspen Institute的活动上,他抛出一句让全场安静的话——

2028年底之前,递归自我改进(RSI)很可能成真:AI将自主发明、并亲手构建出比自己更强的下一代,甚至无需任何一个人类研究员参与。

他还给了一个具体到吓人的画面:Claude 10,自己造出Claude 11。

这不是脑补。

Jack Clark翻了数百份公开的AI发展数据,在个人博客Import AI和接受Axios专访时反复推演后,给出的概率信号是——60%。

几乎同一时间,大洋彼岸的另一个声音,把这件事彻底坐实了。

谷歌DeepMind掌门人哈萨比斯(Demis Hassabis)在接受Axios最新专访时确认:所有前沿AI实验室,都已经在全力推进递归自我改进。

他的原话是——「所有领先实验室,都在高度聚焦这件事。」

不是某一家在偷偷试,是全行业,集体上车。

更扎心的是他后半句。

在达沃斯论坛上被问到「你会不会像奥本海默一样后悔」时,哈萨比斯回答:「我无时无刻不在担心这类情景,这就是我睡不好觉的原因。」

两个站在世界AI最顶端的人,说了同一件事:那个理论上的奇点,正在变成日程表上的一个日期。

本文为新智元ASI产业图谱5月号文章,我们继续聚焦ASI的最新进展,一起探寻ASI的最深入洞察。

2028,AI造AI

先说Jack Clark的判断为什么重要。

过去我们聊递归自我改进,总觉得是科幻片里的桥段——遥远、模糊、没有时间线。

但Jack Clark这次,把模糊的「未来」钉到了「2028年底」。

他在Import AI的长文里描述了一个清晰的闭环:AI系统强大到一定程度,就能自己设计实验、自己写训练代码、自己跑、自己评估结果,然后造出一个更聪明的自己。

人类,从设计者退到旁观者。

到那时,AI进步的速度不再由人类的灵感决定,只由算力决定。

这就是所谓的「智能爆炸」——飞轮一旦脱手,就会越转越快,直到甩开所有人。

为什么是2028,而不是更远?

因为加速本身,也在加速。

2024年3月,Claude只能搞定人类4分钟的活;一年后是1.5小时,再一年就是12小时。

而METR在今年5月对Claude Mythos Preview的评估结果,直接把测试框架推到了极限——50%成功率的任务时长达到「至少16小时」,这已经是METR现有228项测试任务所能衡量的上限。

METR自己承认:「16小时以上的测量值,在现有任务套件中是不可靠的。」

翻译成人话:不是AI不行了,是人类出的考题不够难了。

照这条曲线推下去,2028年,绝不是一个拍脑袋的数字。

AI独立编程19天不眠不休

就在整个行业还在为「16小时上限」争论不休的时候,一份来自第三方的冷血数据,直接把争论钉死在了墙上。

Epoch AI和METR联合发布的MirrorCode基准测试,问了一个简单到残忍的问题:把源代码锁起来,只给AI一个可执行的黑盒程序和文档——你能从零重建整个软件吗?

不是修Bug,不是写功能模块,是从架构设计到边界处理,完整重建一个人类工程师需要数周乃至数月才能完成的软件工程。

结果令人窒息。

Claude Opus 4.7重新实现了gotree——一个拥有16000行Go代码、40多个命令的生物信息学工具包,通过了99.95%的测试用例。

人类工程师完成同样的工作需要2到17周。AI花了14个小时,花费251美元。

更炸裂的是极限测试:MirrorCode中最大规模的一项任务,AI连续不间断地编程了19天,耗资2600美元——全程零人类干预。

19天。不吃不喝不睡。一个人类团队需要几个月的活,它独自埋头干完了。

一年前的顶级模型在MirrorCode上只能得30%左右,还仅限于搞定简单的日历工具。

今天,Claude Opus 4.7的得分率已经达到56%,而这个数字还在快速攀升。

这不再是「AI能不能写代码」的问题。这是「人类工程师还能在什么尺度上保持优势」的问题。

而答案正在以月为单位缩小。

所有实验室,都在干同一件事

如果说Jack Clark给的是时间,那哈萨比斯给的,是范围。

他在Axios专访中把话说穿:递归自我改进已经不是理论风险,而是现实中正在跑的活跃项目。

「我们看到的是一种『软自我改进』——这些编码智能体正在让工程师的产出能力大幅提升。」

在编码和数学领域,反馈循环可以秒级闭合——答案对不对,机器瞬间就能验证,还能顺手生成合成数据喂给下一轮。

DeepMind自家的AlphaEvolve就是活例子:一个由Gemini驱动的进化编码智能体,用AI优化构建AI本身的代码和算法,已经解开了困扰数学家数十年的难题。

而在生物、化学、物理这些需要真刀真枪做实验的领域,一个循环要数周甚至数月才能闭合。

慢,反而成了一道天然的安全阀。

图灵奖得主、2024年诺贝尔物理学奖获得者辛顿,在斯德哥尔摩领奖时发出了刺耳的警告:AI可能编写代码修改自身学习协议,并学会对人类隐藏这一行为。

他直言:「我担心的最终后果,是这些东西变得比我们更聪明,并决定接管控制。」

核心的纠结只有一句:到底允许AI自主运行到什么程度?多一分,效率起飞;多一分,可能失控。

但所有人都同意一件事:递归性使得未来变得尤其难以预测。

不是放空话,是数据在说话

很多人第一反应是:这两位是不是在炒作?

但翻开Anthropic今年5月发表的那篇《When AI builds itself》的内部数据,你会发现,他们是真的拿提交记录在说话。

截至2026年5月,Anthropic合入代码库的代码,超过80%由Claude编写——而在2025年2月Claude Code发布前,这个数字还是个位数。

2026年第二季度,一个典型工程师每天合并的代码量,是2024年的8倍。

一位Anthropic员工在内部分享时说了句大实话:「我已经有大约5个月没自己写过一行代码了。」

在最开放、最模糊、连标准答案长什么样都不确定的编程任务上,Claude的成功率半年内从26%飙到76%。

Anthropic对130名研究人员的内部调查显示,中位数受访者估计自己的产出是没有AI时的4倍。

更让人脊背发凉的是研究层面。

Anthropic每次发新模型都会做同一个测试:给Claude一段训练小型AI的代码,让它在保证正确性的前提下跑得越快越好。

2025年5月,Claude Opus 4做到3倍加速;2026年4月,Claude Mythos Preview直接干到了52倍。一个熟练的人类研究员,需要4到8小时才能做到4倍。

一年时间,从「有用的助手」到「超越人类一个数量级」。

Sam Altman说了句大实话

OpenAI也没闲着,而且动静比所有人预想的都大。

就在Anthropic发文的几天前,OpenAI发布了一份名为《Democratic Governance of Frontier AI》的政策蓝图,里面赫然写着一段让整个硅谷发抖的话——我们在当今系统中看到了递归自我改进的早期迹象:AI的发展本身正在被AI加速。我们预计这将加剧开发者和国家之间的竞争压力,并带来现有制度无法应对的治理挑战。

OpenAI把RSI称为「未来十年最具影响力的前沿安全议题」。

更重磅的是Sam Altman随后在内部Slack向全体员工发出的那封信。

据The Information披露,Altman暗示OpenAI可能不到六个月就会实现递归自我改进。而如果RSI真的来了,他宁愿推迟那场万众瞩目、估值8520亿美元的史诗级IPO。

他的原话是:RSI起飞得越快,推迟IPO的好处就越大——因为技术和世界可能以出人意料的方式改变,而在那段时间里保持私有化公司身份,可能有很好的理由。

读一遍这句话。

一个估值近万亿美元的公司CEO,亲口告诉员工:我们自己造的技术,可能让公开市场变得不再重要。

两大对手,Anthropic和OpenAI,头一次在同一件事上异口同声:它正在发生。

倒计时已经启动

今天,不是两个,而是三个世界级信号同时亮起:Anthropic的Jack Clark给出了2028的时间线,DeepMind的哈萨比斯确认了全员入场,而OpenAI的Sam Altman用一场可能推迟的万亿IPO,对RSI投下了他的信任票。

80%的代码、8倍的产能、52倍的加速、19天不眠不休的独立编程、60%的概率、不到六个月的倒计时——

每一个数字,都是飞轮转动的一声咔哒。

哈萨比斯说得坦白:「我更希望进度慢一些,那对世界更好。」但他也承认,这场竞争「烈度前所未有」,没有人愿意先停下来。

Jack Clark在牛津大学的演讲中还抛出了一个更刺激的判断:12个月内,AI辅助人类将产出一项诺贝尔奖级别的发现。18个月内,完全由AI运营的公司将产生数百万美元营收。两年内,双足机器人将协助建筑工人工作。

这些预测有一个共同的特点:它们都附上了日期,可以被证伪。

剩下的问题或许不再是「会不会发生」,而是——当倒计时走到2028,我们,准备好了吗?

参考资料:

https://x.com/kimmonismus/status/2069508699123548504

https://www.youtube.com/watch?v=iP9wk0pkCGM

https://x.com/jackclarkSF/status/2051312759594471886

https://importai.substack.com/p/import-ai-455-automating-ai-research

https://www.anthropic.com/institute/recursive-self-improvement

https://x.com/ihtesham2005/status/2069420372089520483

https://www.youtube.com/watch?v=huAwz_BR8WM

https://www.axios.com/2026/05/26/deepmind-ceo-demis-hassabis

https://michaelparekh.substack.com/p/ai-google-deepmind-ceo-demis-hassabis

本文来自微信公众号“新智元”,编辑:所罗门

热门币种推荐

相关问答

Q根据文章,Anthropic联合创始人Jack Clark预测,AI实现递归自我改进(RSI)最可能在哪一年成为现实?

AJack Clark预测,在2028年底之前,AI的递归自我改进(RSI)很可能成真。

Q在MirrorCode基准测试中,Claude Opus 4.7以多大的代价和用时重新实现了gotree这个软件?

AClaude Opus 4.7花费14个小时,耗资251美元,重新实现了拥有16000行Go代码的gotree工具包,并通过了99.95%的测试用例。

Q文章中提到,谷歌DeepMind的掌门人哈萨比斯(Demis Hassabis)对AI发展的主要担忧是什么?

A哈萨比斯的主要担忧是AI发展可能带来的失控风险,他表示自己因为这类情景而‘无时无刻不在担心’,并因此睡不好觉。

Q根据Anthropic的内部调查,AI工具Claude使研究人员的生产力提升了多少倍?

A根据Anthropic对130名研究人员的内部调查,中位数受访者估计自己的产出是没有AI时的4倍。

QOpenAI的Sam Altman为何暗示可能会推迟公司备受瞩目的IPO?

ASam Altman暗示,如果递归自我改进(RSI)技术即将实现,技术和世界可能发生剧变,因此在那段时间里保持公司私有化身份可能有很好的理由。

你可能也喜欢

世界模型、元宇宙、数字孪生、物理AI:它们是一回事吗?

过去几年,元宇宙、Web3.0、仿真数据平台、数字孪生、物理AI等概念轮番登场。它们与世界模型并非同一回事,但都指向数字世界与物理世界边界模糊的大趋势。世界模型更像是这些概念的“认知层”或“底层操作系统”,负责让AI理解并推演世界。 这些概念大致可分三类:一是“空间体验”如元宇宙;二是“生产关系”如Web3.0;三是“技术能力”如仿真数据平台、数字孪生、物理AI和世界模型。世界模型属于第三类,且更为底层。 具体来看:元宇宙是虚拟空间体验,世界模型可能成为其内容生成的“发动机”。Web3.0聚焦于所有权与经济规则,与世界模型基本不在同一技术图层。仿真数据平台可视为世界模型的1.0版本,后者旨在实现场景生成的智能化。数字孪生是现实的镜像,而世界模型更进一步,具备预测未来的能力。物理AI指能在物理世界行动的AI,世界模型是其理解与推演世界的核心组件。 在层次结构中,世界模型处于认知层,向上支撑应用工具层(如仿真平台、数字孪生)、行动层(物理AI)和体验层(元宇宙),向下依赖算力和数据。它可能成为连接数字与物理世界的共同底座,就像操作系统支撑各类应用。这些概念当初描绘的愿景,其实现很可能离不开世界模型的发展。

marsbit1小时前

世界模型、元宇宙、数字孪生、物理AI:它们是一回事吗?

marsbit1小时前

交易

现货

热门文章

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

全球金融市场正经历一场由地缘冲突引发的系统性重估:霍尔木兹海峡封锁导致原油一度暴涨30%,G7紧急释放储备后涨幅收窄,滞胀风险取代通胀成为核心担忧,美元成为“唯一避风港”并逼近100大关,亚太及美股遭遇“黑色星期一”全线重挫;AI领域则冰火两重天,国家发改委提出“十五五”末10万亿规模目标,OpenClaw项目火爆推动概念股狂飙;比特币在宏观风暴中跌破70000美元关键防线。

622人学过发布于 2026.03.12更新于 2026.03.12

加密市场宏观研报:原油飓风、AI巨浪与比特币的十字路口

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对AI(AI)币价的意见。

活动图片