英伟达年度「最危险」论文：AI自繁衍代码，无限刷级进化

marsbit发布于2026-06-28更新于2026-06-28

文章摘要

英伟达、剑桥大学等机构发布题为“红皇后哥德尔机器”的论文，提出一种让AI通过自我编写、测试、淘汰与保留代码来实现无限进化的方法。该机制允许AI不仅进化自身，还能主动进化其“考官”（评估器），形成相互竞争的动态循环，从而打破过去20年“哥德尔机”因需数学证明而停滞的理论困境。实验显示，该系统在代码生成、论文撰写和数学证明等任务中均取得提升。例如，代码生成通过率从69.9%提升至71.7%，且效率更高；论文接收率从21.8%升至40.5%；数学证明任务中搜索成本降低3倍。此外，系统还缓解了LLM裁判偏爱AI内容的问题，进化后的评审对AI与人类内容一视同仁。 Anthropic联合创始人Jack Clark预测，到2028年底有60%概率出现高度自主进化的AI。该研究被部分评论称为“年度最危险论文”，因其可能开启AI无休止自我迭代的递归自我改进（RSI），加速迈向人工超级智能（ASI）。

【新智元导读】年度最危险论文发了!英伟达打破20年封印,让AI亲手造出更狠的「考官」淘汰自己。无休止的自我进化一旦开启,2028年ASI降临真不是玩笑。

Anthropic彻底「RSI上头」了!

联合创始人Jack Clark抛出惊人预测,到2028年底,一个高度自主进化的AI就会诞生。

这个概率,是60%!

在人们还在为「2028 RSI能否实现」争论不休时,剑桥大学、英伟达等机构联手,丢出了一篇重磅论文——

「红皇后哥德尔机器」(Red Queen Gödel Machine)

它的运作,宛如一场残酷的AI生存游戏:

AI自己编写新的学习算法,并将其投入沙盒进行试炼。失败的直接抹杀,成功的保留下来。

接着,幸存者们开启下一轮的自我进化与繁衍。

论文地址:https://arxiv.org/pdf/2606.26294

但真正令人毛骨悚然的,是AI随后展现出的「顿悟」:它意识到,想要不断变强,就必须面对更加苛刻的试炼。

于是,AI开始主动「进化」自己的考官。

它亲手打造出更严苛的裁判,来评判自己写出的更高级的代码。

这套机制,将AI死死锁定在一个无休止的、疯狂自我迭代的RSI里。

看完这37页论文,许多人倒吸一口凉气,「这绝对是年度最危险的AI论文」!

2028年RSI自进化

把预言写成代码

2003年,德国科学家Jürgen Schmidhuber曾构想过一种机器, 名为「哥德尔机」(Gödel Machine)。

它的设定堪称完美:一台能证明自己的改进有益、然后改写自身代码的机器。

一旦造出来,它就能不断自我升级,越变越强,没有上限。

不过,「哥德尔机」有一个致命的「门槛」——

在执行任何一行自我修改的代码前,它必须先从数学上严格证明:这次改动一定是有益的。

但在现实中,这几乎是个不可能完成的任务,所需的算力堪称「黑洞」。

于是,在之后整整20年里,哥德尔机只能躺在论文里,当一个理论上的天花板,一个谁都够不着的思想实验。

近两年,学界绕开了证明这道坎。

达尔文哥德尔机(DGM) 、赫胥黎哥德尔机(HGM)干脆抛弃数学证明,改用进化——

让AI「繁殖」出大量带突变的代码变体,扔进沙盒里跑分,失败的淘汰,成功的保留,幸存者继续繁衍。

AI跨越了最后一步,开始字面意义上「进化」自己。

但这些方法都还有一个共同的盲点——它们的考官是死的。

不管AI怎么进化,给它打分的那个评判标准、那个benchmark、那个验证器,始终被钉死在循环之外,一动不动。

这恰恰违背了进化最核心的一条规律:

物种从不是在一个静止的环境里优化自己,而是和不断变化的环境一起改变。

红皇后哥德尔机(RQGM),要破的就是这道盲点。

「红皇后」真正杀招:让AI造出考官

「红皇后」这个名字,来自生物学家Van Valen 1973年提出的「红皇后假说」——

你必须拼命奔跑,才能停在原地,因为你的对手也在进化。

RQGM干的事,正是把这句话写成了算法:让考官(评估器)和选手(任务智能体)一起进化。

这是整篇论文,最让人头皮发麻的地方。

这套精巧的机制叫「受控效用进化」(controlled utility evolution):

整个搜索被切成一个个epoch;

在每个epoch内,评估器(考官)是冻结的,给所有考生打分,保证信号稳定;

只有在epoch的边界,才允许换考官,且新考官必须在一份留出的「基准真相」锚点数据上,统计意义上打赢老考官,才能上位;

一旦换人,系统立刻执行「选择性擦除」:只丢掉那些由被换掉的考官打过的分,其余证据全部保留。

换句话说,它既要狂奔进化,又要每一步都站得住脚。

真的奏效了,AI自己改代码

光说机制太抽象,不如直接看战绩。

第一战,写代码(Polyglot)。

RQGM给写代码的Agent配了一个"代码评审员"当陪练。

结果,在留出测试集上,通过率从此前SOTA的69.9%提到了71.7%。

更狠的是,它达到这个成绩,比对手少烧了1.35到1.72倍的token。因为那个评审员只需要查一次,比反复多轮跑测试便宜太多了。

第二战,写论文。

这是个没有标准答案的领域,论文好不好,没法机器自动判分。

RQGM让写手和它的评审一起进化,结果论文在一个固定评审小组里的接收率,从前SOTA的21.8%,直接飙到40.5%。

第三战,奥赛级数学证明。

它进化出的「评分官」(grader),比静态基线更准、搜索成本还低了3倍;

进化出的「证明选手」,拿到了最高的平均分。

但全篇最封神的一笔,是它把AI的一个老毛病给治好了。LLM当裁判,有个出了名的毛病:偏爱AI生成的内容。

论文里那个最强的基线审稿人,接受AI写的论文的概率,是接受人类论文的最高1.91倍。

RQGM怎么治?它在epoch边界上,把固定评审之前放过的AI论文捞出来,组成一个「对抗样本池」,然后专门奖励那些能把这些AI论文揪出来打回去的新评审。

进化几轮之后,最终的评审对AI和人类一视同仁,还保住了80%的真值准确率。

当AI学会评判自己

就在同一个夏天,Anthropic联创Jack Clark押下重注:60%的概率,2028年底前,AI将能亲手缔造出更强大的自己。

曾将「哥德尔机」死死困住20年的那道高墙,名为「证明」。

而「红皇后机」将其唤醒,只用了最残酷的一招:无休止的繁衍、淘汰、再繁衍。

当一个AI开始亲自为自己设计最严苛的考官,在疯狂的递归中将自己逼向极限,我们所面对的,将是一个开始自行定义「何为智慧」的全新物种。

当那一天到来,ASI绝不会敲门预告。

它只会默默造出那个唯一有资格评判它的裁判,然后,从容地走入考场。

预言只负责指明终点,代码才负责抵达。

而现在,这段令人窒息的距离,正被 AI 自己,以几何级数缩短。

参考资料:

https://x.com/HowToPrompt__/status/2070824205663273175?s=20

https://x.com/kimmonismus/status/2070968241548120168

本文来自微信公众号“新智元”,编辑:桃子

你可能也喜欢

一群苏州工程师意外财富自由

苏州联讯仪器作为光通信测试仪器龙头，上市仅两个月股价暴涨30倍，成为A股唯一价格超2000元的股票。公司早期通过员工持股平台绑定核心技术团队，上市后近百名员工持有的股份市值超360亿元，其中近40人成为亿万富豪。公司创始人胡海洋、杨建、黄建军也跻身百亿富豪行列。联讯仪器成立于2017年，专注于高端测试仪器研发，乘AI算力需求爆发的东风，业绩快速增长。其客户包括中际旭创、新易盛等全球光模块龙头。上市前，公司获得架桥资本、毅达资本及苏州国资等投资，其中苏州高新获得超百倍回报。当前，随着AI、光通信、芯片等技术领域发展，二级市场迎来牛市，中际旭创、智谱等公司市值攀升，大量技术人员通过股权激励分享资本红利，标志着技术造富时代的到来。中国庞大的工程师人才红利正逐渐转化为财富创造力。

marsbit1小时前

marsbit1小时前

苹果与「美光们」的权力再平衡：拆解iPhone背后的利润账单

《苹果与「美光们」的权力再平衡：拆解iPhone背后的利润账单》一文探讨了在AI浪潮下，智能手机产业链利润分配格局的变化。长期以来，苹果以约18%的市场份额攫取了行业约75%的利润，单台iPhone净利润率保持在25%以上，而美光等内存厂商的利润占比不足3%。文章指出，内存的角色已从iPhone X时代的“边角料”（成本占比约2%），演变为如今iPhone 17系列的“关键部件”（成本占比达12%-15%，约60-80美元）。这一转变源于AI服务器对DRAM的需求是传统服务器的8-10倍，导致存储巨头将产能转向利润更高的HBM等产品，挤压了消费电子内存供给，推高了价格。美光等内存厂商因此从过去的被动压价，转为掌握议价主动权。针对内存成本飙升，苹果CEO库克称之为“40多年未见”的情况，并随之提高了多款产品售价，引发股价大跌。特斯拉CEO马斯克也表达了类似观点。为应对供应链压力，有消息称苹果正寻求采购中国长鑫存储的芯片。总之，AI驱动的需求正重塑全球内存市场格局，挑战了苹果在产业链中的绝对主导地位，迫使科技巨头与关键元件供应商进行新一轮的权力平衡。

Odaily星球日报3小时前

在ETF资金流出406亿美元后，BTC巨鲸能否拯救比特币？

美国比特币和以太坊现货ETF连续七日出现净流出，昨日比特币流出4.45亿美元，以太坊流出1285万美元。月度比特币ETF净流出约40.6亿美元，使总资产降至728.2亿美元，机构需求呈现减弱迹象。不过，当比特币价格短暂跌破6万美元时，大额持有者（巨鲸）活动增加，网络出现大量高额交易，显示他们可能将价格回调视为积累机会，这有助于缓解短期抛售压力。与此同时，长期持有者的行为出现分化。长期持有者SOPR指标进一步跌入负值区间，表明部分资深投资者开始承受亏损，月度平均已从1.03降至0.8，意味着最近一个月投资损失约13%。这种长期持有者的投降可能逐渐耗尽盈利性抛压，为市场复苏奠定基础。总体而言，持续的ETF资金外流削弱了机构买盘支撑，但巨鲸的积累行为提供了一定缓冲。比特币的持续复苏最终仍需更广泛的现货市场需求走强。

ambcrypto3小时前

ambcrypto3小时前

对话42 Macro创始人：美联储的“温水煮青蛙”与K型经济

来源：Anthony Pompliano，整理：Felix, PANews 42 Macro创始人Darius Dale近日参与访谈，探讨了美联储政策、K型经济与投资策略。他认为新任美联储主席凯文·沃什实质是“披着鹰派外衣的鸽派”，未来可能先通过收紧政策或鹰派信号为后续宽松创造空间。Dale指出，当前通胀驱动因素（如货币供应、赤字支出、信贷增长）均显示通胀难以回到2%目标，美联储已“放弃”这一目标，其角色如同“温水煮青蛙”，在金融抑制中缓慢稀释货币购买力。他强调美国经济呈现显著的“K型”分化：顶部家庭因疫情期间积累约8万亿美元超额储蓄，消费强劲、财富增长；而底层家庭却面临信用卡、车贷等重度违约率升至金融危机水平，生活艰难。这种分化加剧了社会不平等与政治焦虑，根源在于货币增发带来的“坎蒂隆效应”——新钱优先流入富人与资产市场，推高资产价格，而工薪阶层承受物价上涨。谈及市场，Dale认为投资者必须参与资产配置以抵御财富稀释，但AI热潮下的“科技七巨头”可能面临过度投资与资本开支激增的风险，资金或流向更广泛的股票。他最后指出，不同族裔的底层民众诉求本质相同：尊严与养家能力，当前经济机制若持续加剧分化，可能引发严重社会后果。

marsbit3小时前

marsbit3小时前

Transformer的八个爹，如今都在哪？

《Transformer的八个爹，如今都在哪？》 2017年，谷歌八位研究人员发表了奠基性论文《Attention Is All You Need》，提出了Transformer架构。如今，这八位作者已全部离开谷歌，分散在AI领域的各个前沿。 **Ashish Vaswani** 与Niki Parmar先后共同创立了Adept AI和Essential AI。最新传闻英伟达正吸纳Essential AI核心团队，Vaswani可能加入。 **Noam Shazeer** 因谷歌未发布其聊天机器人而出走创立Character.AI，后谷歌斥资约27亿美元授权技术并请他回归。近日他再次离职，加入了OpenAI。 **Niki Parmar** 在离开Essential AI后，于2024年底加入了Anthropic，参与Claude模型开发。 **Jakob Uszkoreit** 是“仅用注意力”想法的最初提出者。他于2021年联合创立生物科技公司Inceptive，用AI设计RNA疗法。 **Llion Jones** 于2023年在东京联合创立Sakana AI，探索模型协同演化的新路径，公司已获巨额融资并与大企业合作。 **Aidan N. Gomez** 是当年最年轻的作者（实习生）。他联合创立了企业级AI公司Cohere，专注于为企业提供安全、可控的AI服务。 **Łukasz Kaiser** 是唯一一位始终留在大型实验室做纯研究的作者。他于2021年加入OpenAI，是GPT-4、推理模型o系列的核心贡献者。 **Illia Polosukhin** 于2017年离开谷歌，联合创立了区块链项目NEAR Protocol，并将其定位为未来AI智能体经济的“结算层”。 2024年，其中七人在英伟达GTC大会上重聚。尽管路径各异，但他们都未停止探索。正如他们所言，Transformer并非终点，下一个架构必须“明显地、毫无疑问地更好”才能取代它。

marsbit4小时前

交易

现货

英伟达年度「最危险」论文：AI自繁衍代码，无限刷级进化

文章摘要

2028年RSI自进化

把预言写成代码

「红皇后」真正杀招:让AI造出考官

真的奏效了,AI自己改代码

当AI学会评判自己

热门币种推荐

相关问答

你可能也喜欢

一群苏州工程师意外财富自由

苹果与「美光们」的权力再平衡：拆解iPhone背后的利润账单

在ETF资金流出406亿美元后，BTC巨鲸能否拯救比特币？

对话42 Macro创始人：美联储的“温水煮青蛙”与K型经济

Transformer的八个爹，如今都在哪？

交易

热门文章

加密市场宏观研报：原油飓风、AI巨浪与比特币的十字路口

自主AI经济的基石：Talus如何重塑链上智能代理

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

相关讨论

热门问答

热门分类

热门标签