NVIDIA团队让编程Agent接管真实机器人实验，成功率达99%

marsbit发布于2026-06-18更新于2026-06-18

文章摘要

NVIDIA GEAR实验室推出名为ENPIRE的项目，首次让编程Agent在真实机器人硬件上实现了全自动化的研究闭环。系统部署了8个Codex Agent组成机器人舰队，在仅给定“高效安全完成任务”的简单目标后，人类基本退出干预。Agent自主管理整个流程：自动重置环境、搜索文献、编写并改进代码、训练和部署策略、分析日志并持续迭代，最终在系扎带、插针整理等高精度灵巧操作任务中达到了99%的成功率。项目核心是由环境、策略改进、策略评估和进化四个模块构成的闭环框架，将真实世界机器人学习转化为由Agent管理的优化过程。研究中的一个关键发现是，对许多任务而言，重置环境比完成任务本身更容易，因此系统优先让Agent构建自动重置能力。实验还观察到“物理规模定律”，即增加并行机器人数量能显著加快任务解决速度。例如，插针任务在8台机器人并行下，达到完美表现的时间从1.5小时以上缩短至约40分钟。团队为此提出了平均机器人利用率（MRU）和平均Token利用率（MTU）两个新指标，以量化资源效率。目前，部分系统已能彻夜无人干预运行，未来目标是实现实验室完全自主运作。该项目计划开源，使普通开发者也有机会搭建类似系统。

自动化研究,这一次真正走出代码沙盒,进入了真实的物理世界。

最近,NVIDIA GEAR 实验室负责人 Jim Fan 介绍了一个名为 ENPIRE 的最新项目。这是他们首次在机器人硬件上实现了自动化研究。

他们把 8 个 Codex Agent 放到一个机器人舰队里,分配好 GPU 算力和充足的 token 预算,只给出一个简单目标:尽快解决任务、让机器人保持忙碌但确保安全、不要浪费算力。

接下来人类就基本退出干预。Agent 自主驱动整个闭环,包括自动重置场景、搜索文献、实现想法并搭建基础设施、训练和部署策略、自我验证、分析日志并改代码,不断迭代,直到在真实硬件上可靠完成高精度灵巧任务,比如系扎带、插针盒整理、安装 GPU 等。

他们还观察到一种「物理 scaling law」,增加并行机器人数量(例如从少量增加到 8 个),能显著加快任务解决速度。

目前,该实验室的部分系统已实现彻夜无人类干预的自我迭代,研究人员仅需在早晨查看报告即可。

Jim Fan 称,未来目标是让团队成员安心休假,甚至连 NVIDIA CEO 黄仁勋都察觉不到实验室仍在自主运行。

ENPIRE 项目计划完全开源,届时普通开发者也有望在家中搭建类似的自主机器人研究系统。

项目地址:https://research.nvidia.com/labs/gear/enpire/

ENPIRE 系统架构:四个模块构成闭环

ENPIRE 是一个专为编码 Agent 设计的框架系统,通过四个核心模块构建可重复的物理反馈循环:环境模块(EN)负责自动重置和验证,策略改进模块(PI)启动策略优化,Rollout 模块(R)支持单台或多台机器人并行评估策略,进化模块(E)则让编码 Agent 分析日志、查阅文献、改进训练基础设施和算法代码以解决失败模式。

这一闭环系统将真实世界机器人学习转化为一个由 Agent 管理的、可控的优化过程,从而最大限度减少人工投入,同时支持在不同训练配方和 Agent 变体之间开展公平的消融实验。

在 ENPIRE 的支持下,前沿编程 Agent 能够自主开发策略,并在 PushT、将插针整理进针盒、使用切刀剪断扎带等具有挑战性的真实世界灵巧操作任务中,实现 99% 的成功率。

关键发现:重置环境比完成任务本身更容易

其中一个关键观察是:对许多机器人任务而言,重置环境往往比完成任务本身更容易。

因此,ENPIRE 的做法是,先让 Agent 通过 Code-as-Policy 构建自动重置环境。很多情况下,所谓重置其实就是一个 pick-and-place 任务,可以由 Cap-X 解决。

随后,智能体会编写基于启发式规则的奖励函数。研究团队再将该环境放入沙箱,并启动 Agent 围绕得分开展自动化研究。

这也呼应了 Karpathy 对自动化研究的定义:这里所说的自动化研究,并不是简单调一个超参数,或改动某一小段代码。Agent 会从互联网上探索不同范式,并重写一切可能推动性能提升的部分,包括算法、训练目标,甚至数据加载器。

在插针任务中,一个 Agent 甚至自行编写了接触力安全控制器,其效果超过了单纯调节若干强化学习参数。

新指标MRU与MTU

ENPIRE 的扩展能力取决于 Agent 团队规模和算力资源,只不过在这里,真正稀缺的资源不是 GPU,而是机器人时间。

当研究团队为 Agent 提供 8 台机器人,而不是 1 台机器人时,插针任务达到接近完美表现所需的时间,从 1.5 小时以上缩短到了约 40 分钟。这些 Agent 通过 Git 进行协调:共享代码、放弃不理想的想法,并自主地挑选彼此的最佳运行结果。

这指向了一个更大的变化:机器人研究正在变成一种环境设计工作,即为 coding Agent 搭建可以在其中进行自动化研究的环境;算法工作则上移到了更高一层,转向构建一种 Agent 能够自行闭合的反馈循环。

而这个循环会不断复利式累积:Agent 今天掌握的一项技能,明天就会成为构建并重置更困难任务环境的基础模块。能力会自举出新的能力。

在这一范式下,真正的硬约束是真实世界交互预算。

因此,研究团队提出了两个指标:

平均机器人利用率(Mean Robot Utilization,MRU):机器人实际运行实验的时间占总真实耗时的比例。
平均 Token 利用率(Mean Token Utilization,MTU):衡量 Agent 将 token 转化为研究进展的效率。

在他们的实验中,MRU 始终低于 50%。也就是说,机器人有一半时间都处于空闲状态,在等待 Agent 思考。因此,更好的 harness 和更快的模型,会直接转化为实际收益。

PushT 是一个沿用已久的机器人操作基准。通常,要完成这个任务,需要大量人类示范数据,再加上数小时的行为克隆训练。

但他们看到,Codex、Claude Code 和 Kimi Code 都用一套基于规则的启发式方法,在不到 2 小时内「解决」了这个任务:不使用神经网络,不进行训练,也不依赖任何人类数据。

为了让更多人能在家尝试物理世界中的自动化研究,他们基于 @LeRobotHF 的 SO-101 套件 + NVIDIA Jetson Thor 开发了一整套全栈系统。这套系统可以完成 PushT 任务。

参考链接:

https://x.com/_wenlixiao/status/2066913334994358342

https://x.com/DrJimFan/status/2066921736369766762

本文来自微信公众号“机器之心”(ID:almosthuman2014),作者:杨文

你可能也喜欢

SpaceX、OpenAI、Anthropic连续上市,市场真的吃得下吗?

## 摘要本文探讨了SpaceX、OpenAI和Anthropic三家科技巨头在短期内接连寻求上市，市场能否消化其巨额融资需求的问题。 **核心数据与现状：** - **SpaceX**：已以每股135美元上市，募资750亿美元，估值达1.77万亿美元。招股获超额认购，首日市值突破2.1万亿美元，显示强劲需求。 - **OpenAI**：目标估值约1万亿美元，但财务状况面临挑战，据分析处于亏损状态，市场对其短期内完成IPO持谨慎态度。 - **Anthropic**：财务表现相对最佳，增长迅猛，并预计在上市前实现首次季度运营盈利，估值近万亿美元。三家IPO总计可能从市场抽资超过2000亿美元，相当于2025年全年美国IPO募资总额的四倍多。 **市场态度分歧：** - **多头**认为市场流动性充裕（货币市场基金约8万亿美元），且存在对纯AI标的的直接投资需求。 - **空头**警告这可能导致流动性虹吸，迫使机构抛售其他资产（如芯片股）来筹集现金，并指出IPO本质是早期投资者向公开市场转移风险。 - 还有一种“投降式看多”心态，即因职业风险而不得不参与，被视为市场泡沫后期的特征。 **上市时机与深层动因：** - 资本擅长为远期愿景（如火星殖民、通用人工智能）定价，且这些公司拥有真实的收入增长。 - 创始人控制力强（如马斯克），并通过关联交易网络扩大影响力。 - 此轮IPO提高了散户配售比例，意在让用户成为股东，但也可能让其承担尾部风险。 - 行业内资金循环（如英伟达投资、OpenAI采购）推高了各方估值，但新价值创造与否存疑。 **结论：市场能否消化？** 1. **单笔消化**：有能力，SpaceX的成功已证明。 2. **连续冲击**：是主要风险，可能导致需求分流或定价不及预期。因此三家公司有意错峰上市。 3. **基本面支撑**：这是最大悬念。SpaceX有实体业务现金流；若Anthropic实现盈利，将增强板块信心；而财务状况不明的OpenAI最为脆弱，其公开的财务数据可能引发估值重估。 **最终判断**：市场有容量承接这些IPO，但真正的考验在于OpenAI等公司公开财务底牌后，其万亿美元估值是否能被真实的盈利能力和客户投资回报率所支撑。当前市场弥漫着一种“清醒的赌博”心态。

marsbit28分钟前

marsbit28分钟前

SK海力士股价再新高：交付HBM4E样品，AI内存领跑地位再获验证

SK海力士向主要客户交付了下一代AI内存芯片HBM4E的样品，推动其股价盘中暴涨7.3%，创下历史新高。这款12层堆叠的旗舰产品性能与能效显著提升：每引脚最高数据处理速度达16Gbps，功耗效率较前代提升超过20%，并通过先进封装技术将散热阻力降低17%，单颗容量达到48GB。此次样品按期交付，标志着SK海力士在高带宽内存（HBM）领域的技术迭代再度提速，进一步巩固了其在AI基础设施供应链中的核心地位。公司表示，凭借在HBM3、HBM3E及HBM4上积累的量产与供应经验，将与合作伙伴紧密协作，推动HBM4E及时实现量产，以支持下一代AI数据中心和计算系统的开发，解决性能瓶颈。市场认为，这强化了SK海力士持续领跑AI内存赛道的预期。

marsbit51分钟前

marsbit51分钟前

要么全栈，要么出局：xAI 600 亿美元收购 Cursor 背后的算盘

xAI以600亿美元股票收购Cursor母公司Anysphere，核心意图并非市场份额，而是获取其700万开发者每日产生的高质量代码训练数据。文章指出，代码生成是当前大语言模型最成功的应用，并以Anthropic为例，其营收在28个月内增长约540倍，其中Claude Code产品贡献显著，迅速占据企业AI编程市场过半份额。作者（VC机构Strange Ventures合伙人）提出核心观点：想成为AI巨头，必须构建“全栈”能力——即打通算力、模型与应用层。全栈模式能改善模型训练的经济效益，并通过应用层获取专有数据构建竞争壁垒。预计未来模型公司将更积极地自建或并购应用层业务。此次收购印证了xAI完善其全栈布局（算力Colossus、模型Grok、应用X）的战略，Cursor的代码数据将直接增强Grok的竞争力。文章最后强调，在AI工具大幅降低产品开发门槛的当下，创业公司需要具备更大的野心方能成功。

marsbit1小时前

marsbit1小时前

Matrixdock 再登 SBMA《Crucible》：探讨代币化如何提升贵金属市场效率

近日，BIT旗下RWA代币化平台Matrixdock的研究文章再次刊登于新加坡黄金市场协会（SBMA）行业刊物《Crucible》。Matrixdock负责人Eva Meng发表文章，从市场效率、持有成本及基础设施演进等角度，探讨代币化如何提升贵金属资产的可用性与资本效率。文章指出，黄金ETF降低了投资门槛，但主要提供价格敞口。代币化则能进一步提升黄金的流动性，使其具备即时结算、数字抵押等更广泛的金融应用能力，推动黄金进入数字金融体系。针对实物资产的持有成本问题，Matrixdock介绍了Fungible Reserve Standard（FRS）框架，强调以透明方式反映资产真实经济属性的“经济纯粹性原则”，认为代币化关键在于准确呈现底层资产特征。实践中，Matrixdock推出了基于FRS的白银代币XAGm和机构级黄金代币XAUm，探索不同贵金属在链上的透明表达。行业关注点正从早期的资产验证转向资产效率与资本利用率。数据显示，代币化黄金市场规模已于2026年2月突破60亿美元，并持续增长，正成为贵金属市场数字化进程的重要组成部分。

marsbit1小时前

Matrixdock 再登 SBMA《Crucible》：探讨代币化如何提升贵金属市场效率

marsbit1小时前

新火研究院：BTC 六万区间迎来密集抄底，「高性价比区间」迎来换手潮

本周比特币超跌反弹，市场恐慌情绪减弱，多项指标显示行情筑底迹象显著。比特币现货ETF净流出收窄，Coinbase与USDT间负溢价修复。主流矿机关机成本集中在3万至5万美元区间，行业成本底或已初步夯实，这是加密市场历次见底的经典信号。机构资金呈现逆势布局趋势。例如新火集团场外交易周成交量环比增长超8倍，活跃用户数翻倍，均创历史新高，反映大额资金交易活跃度与入场需求激增。链上数据显示，部分上市公司背景及“远古巨鲸”机构资金在6万美元区间密集抄底。新火研究院自5月中旬以来持续提示“高性价比”布局窗口已开启，市场正完成从恐慌抛售向长期持仓的筹码切换。展望后市，流动性释放与宏观政策将成为核心推动力。SpaceX成功上市后解冻的巨额资金有望流向比特币等被低估的资产。宏观层面需关注18日FOMC会议上沃什的讲话对货币政策预期的定调，以及《CLARITY法案》若在7月底前落地，将显著提振资金入场的制度信心。结合底部特征与资金面、政策面多重利好，后续市场走势值得期待。

marsbit1小时前

marsbit1小时前

交易

现货

合约

NVIDIA团队让编程Agent接管真实机器人实验，成功率达99%

文章摘要

ENPIRE 系统架构:四个模块构成闭环

关键发现:重置环境比完成任务本身更容易

新指标MRU与MTU

参考链接:

相关问答

你可能也喜欢

SpaceX、OpenAI、Anthropic连续上市,市场真的吃得下吗?

SK海力士股价再新高：交付HBM4E样品，AI内存领跑地位再获验证

要么全栈，要么出局：xAI 600 亿美元收购 Cursor 背后的算盘

Matrixdock 再登 SBMA《Crucible》：探讨代币化如何提升贵金属市场效率

新火研究院：BTC 六万区间迎来密集抄底，「高性价比区间」迎来换手潮

交易

热门分类

热门标签