黄仁勋的「Agent工厂」里，装了什么新故事？

marsbit发布于2026-06-01更新于2026-06-01

文章摘要

在COMPUTEX 2026期间，英伟达CEO黄仁勋发表了主题演讲，核心聚焦于“Agent AI”时代的到来。此次发布的关键在于，英伟达正围绕智能体生态，构建从芯片、数据中心到软件平台的全栈技术体系。硬件层面，专为Agent工作负载设计的Vera Rubin平台已进入量产，其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。该平台引入共封装光学（CPO）网络技术以降低能耗，并强化了机密计算安全能力。同时，英伟达推出了新型处理器“Vera” CPU，这是首款为AI智能体设计的CPU，与Rubin GPU通过高速NVLink互联，优化了Agent任务中的数据传递。软件与模型方面，英伟达推出“AI工厂运营工具箱”DSX，整合了设计、仿真、建设到运营的全流程。发布了5500亿参数的混合专家模型Nemotron 3 Ultra，以及配套的NemoClaw、OpenShell等工具，旨在帮助企业构建能安全接入业务流程的“数字同事”。此外，面向物理AI的世界基础模型Cosmos 3正式发布，它能统一理解、生成和预测物理世界信息。在物理AI领域，英伟达联合宇树发布了基于Isaac GR00T平台的人形机器人参考设计H2 Plus，旨在降低开发门槛。还开源了一套物理AI技能工具集，让智能体能直接调用标准化操作。产品布局上，推出了“DGX Station for Windows”桌面AI超算工作站，让Agent能在企业本地Windows环境中安全运行。并与微软合作推出基于Arm架构的RTX Spark SoC，瞄准AI PC市场。最后，英伟达升级了AI原生存储架构，在BlueField-4 STX中强化了针对Agent数据访问的安全管控能力。总结来看，英伟达正通过Vera Rubin、DSX、Nemotron、Cosmos 3、H2 Plus等一系列产品，从算力供给、模型智能、安全管控、物理形态到部署运营，全方位构建服务于Agent的基础设施，宣告一个以智能体为核心的新计算时代已经开启。

原文作者:李海伦苏扬

原文编辑:徐青阳

原文来源:腾讯科技

2026年6月1日,在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上,英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC,不过三个月。

当时,英伟达发布了Vera Rubin的“芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机,六颗芯片构成一台机架级AI超算,并宣告训练大型MoE模型所需GPU数量降至四分之一,推理吞吐量每瓦提升10倍,单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同,三个月后COMPUTEX,黄仁勋把目光投向这些基础设施将服务的目标——Agent。

黄仁勋在演讲中透露:Vera Rubin正式进入量产,Vera CPU开始向全球交付,DGX Station第一次以Windows形态走进企业桌面,Cosmos 3重构物理AI的感知框架,DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计,把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态,重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说:“Agent AI和实用型人工智能时代已经到来。现在token(也称‘词元’)是利润单位,AI是GDP‘生成器’,软件工程师的数量正在增加。人们谈论AI减少了工作岗位,这完全是胡说八道,实际上有更多的软件工程师正在被雇用”。

同样的AI工厂,跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同,Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示,一个Agent任务往往不只是一次模型推理,而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节,背后可能涉及数千个步骤。未来数据中心需要处理的,也不再只是单个模型请求,更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机,专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里,用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务,其处理效率是上一代 Grace Blackwell平台的10倍。

除了计算平台本身,网络也成为Vera Rubin升级的重点之一。

过去数据中心里,GPU之间的数据传输主要依赖传统光模块和交换机架构,但当集群规模持续扩大后,功耗、散热和部署复杂度都会快速上升。为此,英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统。

这是英伟达首次将共封装光学(CPO)技术大规模引入AI数据中心网络。

简单来说,传统方案需要把光模块插在交换机外部,而CPO则直接把光学器件集成到交换机内部,从而减少能耗和信号损失。

此外,安全也是此次Vera Rubin平台重点强调的核心能力。

为此,英伟达将机密计算(Confidential Computing)能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制,企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露,Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统,其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划,Vera Rubin将于今年秋季开始正式出货。

“为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera,并已全面投产。

黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的,而Vera是为AI时代设计的CPU,为智能体打造。

作为Grace的继任者,Vera采用了英伟达自主设计的“Olympus” CPU核心架构,核心数量从72个提升至88个,并大幅提高内存和数据处理能力。据英伟达介绍,在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升,更重要的变化在于Vera与Rubin GPU之间的关系:Vera通过第二代NVLink-C2C与Rubin GPU连接,互联带宽达到1.8TB/s,Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示,Vera Rubin采用美光、SK海力士和三星的HBM(高带宽内存),供应链规模是上一代Blackwell的“两倍”。不过,部署一个大型Blackwell机架需要两个小时,而Vera Rubin的时间被压缩到5分钟级别。

让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX,可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示:NVIDIA不只是卖芯片,而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个。

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题:在电力预算固定的情况下,如何放下更多GPU、跑出更多Token。

按照英伟达的说法,MaxLPS结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果AI工厂是一座复杂工厂,DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中,Reference Design提供AI工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim负责仿真,让客户在建设前先验证设计是否可行;DSX Flex把AI工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面,CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。

与Windows和ARM抱团

现场演讲中,黄仁勋官宣“DGX Station for Windows”工作站登台亮相,被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上,它搭载GB300 Grace Blackwell Ultra Desktop Superchip,通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU,最高提供748GB统一内存和20 PFLOPS FP4性能,并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent,并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全,通过隔离沙箱和系统级策略控制,限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品,黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC,把N1X CPU和Blackwell GPU做进了一块芯片上,统一内存架构,专门给轻薄笔记本和小型台式机用。

其中,N1X是英伟达与微软共同打造的首款PC处理器,它基于Arm架构,由联发科定制设计,台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本,首批超过30款机型,主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”,黄仁勋把它视为PC形态的一次重要重构。

Agent的“两个大脑”

这次发布会上,英伟达公布了两条核心模型产品线的最新进展,分别对应Agent的两个场景:一个跑在企业系统里,一个跑在物理世界中。

英伟达发布了一款拥有5500亿参数的混合专家模型Nemotron 3 Ultra,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升5倍,使用成本最高降低30%,助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型,英伟达发布了一系列软件、开源模型和合作进展,目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中,构建能够协助员工工作的“数字同事”。

这套组合里,Nemotron提供基础模型能力,NemoClaw负责把模型组织成Agent,OpenShell负责运行时安全,Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务,并接入企业现有系统。

黄仁勋表示,全球软件公司正在把AI Agent带入真实工作系统,让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件,包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI,更多关注模型能回答什么;现在英伟达要解决的是,Agent如何安全地接入工具、数据和业务流程,并在真实工作中持续运行。

还有Cosmos 3,作为Cosmos系列的第三代正式发布,也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型,提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比,早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer,首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。英伟达称,它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

降低Physical AI门槛

英伟达与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板”的意思是:宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点:硬件集成、数据采集、仿真、训练、评估、部署,各环节各自为战,整个流程高度碎片化。

英伟达表示,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus尝试做的事,就是把这条路打通,让研究团队跳过底层集成,直接进入技能开发和真实场景验证。

在黄仁勋看来,人形机器人将为全球最大的产业带来物理AI,开启数万亿美元的经济机遇,而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外,英伟达还宣布,正式开源一套物理AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”,可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后,写成了智能体可以直接读懂、直接执行的操作指令,这些指令打包开源出来,就是这次发布的工具集。

智能体接到一个任务,比如生成一批检测缺陷的训练数据,它就知道该调用哪个模型、输出什么格式、怎么验证结果,整个过程自动跑完,不需要人一步步去操作每个环节。

升级AI存储:从“跑得快”到“管得住”

在3月份的圣何塞GTC上,英伟达发布了Vera BlueField-4 STX,当时黄仁勋重点讲的是“AI原生存储架构”,核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在,英伟达在STX基础上宣布新增一套安全能力,重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考,是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体,当Agent接入企业系统,在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露,这都是企业头疼的问题。

英伟达的解法是,在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件,以及在 BlueField-4 芯片里直接硬性执行策略,基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动,帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称:“智能体把企业数据变成了一个实时、活生生的系统,而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的,就是用天生安全的设计,在芯片中以AI的速度执行信任”。

与台积电“互为供应商”

这次大会中,非常有意思的一个点是英伟达和台积电的合作——目前,台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系,过去三十年只有一种形态:台积电帮英伟达造芯片。但现在,角色发生了微妙的变化,英伟达开始帮台积电“管工厂”。

黄仁勋表示:“英伟达和台积电已合作近三十年,不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部,通过仿真、优化和AI应对全球最复杂的设计和制造挑战,以提高下一代芯片的速度、效率和良率。”

两者的关系,从单向的甲乙方,变成了双向的相互依存。

结语

回看这场发布会,英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务,Vera Rubin为Agent提供算力,BlueField-4 STX为Agent守住数据安全,Cosmos 3让Agent理解物理世界,Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束,DGX Station for Windows让Agent进入企业员工的桌面,H2 Plus让Agent拥有身体,DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看,黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底,黄仁勋这次想讲的就是一件事:当Agent成为AI基础设施,每一层都能有英伟达。

你可能也喜欢

总统 Q1 持仓披露：特朗普的钱，加速投向 AI 基建？

2025年以来，市场高度关注特朗普的个人持仓动向。近期披露的Q1财务状况显示，其相关账户交易活跃，交易规模超2.2亿美元，交易方向呈现明显调整：大幅减持微软、亚马逊、Meta等上一代消费互联网平台公司及部分防御型ETF，将资金系统性转向人工智能基础设施领域。具体加仓方向覆盖AI基建全链条： 1. **半导体**：买入英伟达、博通、AMD、美光、英特尔等，涵盖GPU、CPU、存储及芯片设计工具（EDA）环节。 2. **AI硬件与服务器**：增持戴尔、英特尔，后者兼具美国半导体本土制造的政策标签。 3. **企业软件**：买入甲骨文、ServiceNow、Adobe等，布局AI嵌入企业工作流带来的价值。 4. **消费电子与宽基指数**：增持苹果作为AI终端入口，并配置标普500等ETF维持市场整体敞口。此次调仓折射出“聪明钱”的产业判断：投资主线正从上一轮互联网应用转向AI基础设施供给侧，包括芯片、服务器、本土制造及企业软件AI化。这既与市场寻找新增长点的逻辑吻合，也部分反映了美国当前推动半导体制造、供应链安全等产业政策的重点方向。值得注意的是，持仓变动不宜作为直接跟投信号，因其披露存在滞后且具体决策机制不明，但其揭示的结构性方向——资金从旧平台流向AI基建——值得投资者关注。

marsbit15分钟前

marsbit15分钟前

三幕式打法之死：AI让企业软件创业进入「速通时代」

本文探讨了AI时代下企业软件创业模式的变革。传统的“三幕式打法”正在失效，该模式要求公司先通过单一功能切入细分市场达到数千万美元ARR，再扩展为产品套件冲击上亿美元收入，最终成为新平台。然而，AI大幅降低了软件开发成本，产品落地周期急剧缩短，创业公司不再需要多年的渐进式发展。近期如Cursor、Clay等公司，在极短时间内就从零逼近或突破1亿美元ARR，证明了市场竞争节奏已被改写。文章核心观点是，在快速变化的市场中，依赖“安全切口”可能变得保守。新一代软件公司需要从一开始就具备重构整个工作流甚至替代既有平台的野心，而非逐步扩张。这意味着软件创业正从渐进主义转向全盘押注，创始人应追求“不合常理”的宏大愿景，直接瞄准更广阔的市场版图。

marsbit17分钟前

marsbit17分钟前

“金手指”点中IBM之后，股神特朗普的下一个目标浮出水面

本届白宫主人特朗普因其频繁的股票交易（第一季度完成3642笔）而被戏称为“股神”。更引发市场关注的是，他公开表扬的上市公司（如特斯拉、戴尔、英特尔、英伟达、IBM、Palantir等）与其个人持仓、政府产业政策及联邦资金流向出现显著重叠。这些公司多集中于AI、半导体、本土制造等“国家安全”与“对华竞争”叙事领域，且其CEO普遍与特朗普关系密切或做出在美投资承诺。分析指出，被“喊单”公司往往符合以下模式：涉及政府股权或补贴（如英特尔、MP Materials）、获得重大合同（如戴尔）、或受益于政策松绑（如英伟达）。特朗普的公开表态时常与其账户建仓时间点相近。基于现有规律，文章推测下一批可能被点名的公司包括：政府已入股的资源与量子计算企业（如MP Materials、Lithium Americas、IonQ、Rigetti）；以及关系深厚但尚未被正式背书的公司（如Oracle、Broadcom）。但需注意，此类“政治溢价”波动性极大，投资风险很高。

marsbit42分钟前

marsbit42分钟前

又一次比特币购买在即？迈克尔·塞勒的最新帖子引发猜测

迈克尔·塞勒（Michael Saylor）领导的MicroStrategy公司近期的一系列操作引发了市场对其可能再次大举购买比特币的猜测。公司于5月29日将价值约3000万美元的比特币转入Coinbase Prime，次日又全部转回，被解读为可能的税务策略。更关键的背景是，公司暂停了惯常的比特币增持，转而以约13.8亿美元现金清偿了全部15亿美元的可转换票据，显著降低了债务。同时，公司通过发行优先股和出售A类普通股筹集了新资金，并动用部分收益购入了价值超20亿美元的比特币。 5月31日，塞勒在社交媒体发布了公司标志性的“橙色圆点”图表并配文“运作得更好”，该图表历史上常预示新的比特币购买公告，此举立即点燃了市场对MicroStrategy即将再次出手购币的猜测。分析认为，近期公司重组资本结构、降低债务、筹集资金等一系列动作，可能是在为下一步战略举措做准备。

bitcoinist49分钟前

bitcoinist49分钟前

AI主导市场行情，Marvell夜盘涨超14%，黄金涨1%，铝价四年新高，比特币跌破7万

全球股市短暂下挫后反弹，AI相关股票买盘重燃提振市场风险偏好。MSCI全球指数小幅上涨，亚洲股市反弹，韩国Kospi指数收涨。纳斯达克100指数期货跌幅收窄，Marvell股价夜盘大涨超14%。大宗商品方面，黄金价格上涨约1%，布伦特原油徘徊在94美元附近。铝价连续四日走高，创2022年以来新高，铜价同步上涨。伊朗宣布暂停与美谈判，加剧中东地缘政治风险及市场对供应中断的担忧。 AI股票需求是今年全球股市走强核心引擎，标普500指数录得八连涨，费城半导体指数表现强劲。但部分投资者对估值拉伸保持警惕，已开始削减配置。铝价年内大涨约25%，中东战事影响区域供应，期货市场显示现货供应紧张。货币市场方面，日元兑美元汇率持稳，日本财务大臣称已准备干预汇市。市场关注本周美国经济数据，特别是周五的非农就业报告，以研判经济状况及美联储政策路径。整体而言，AI主题主导市场情绪，但地缘政治与高估值风险仍构成潜在压力。

华尔街日报1小时前

AI主导市场行情，Marvell夜盘涨超14%，黄金涨1%，铝价四年新高，比特币跌破7万

华尔街日报1小时前

交易

现货

合约

黄仁勋的「Agent工厂」里，装了什么新故事？

文章摘要

同样的AI工厂,跑出10倍Agent任务

“为Agent而生”的处理器

让AI工厂从“建设”走向“运营”

与Windows和ARM抱团

Agent的“两个大脑”

降低Physical AI门槛

升级AI存储:从“跑得快”到“管得住”

与台积电“互为供应商”

结语

相关问答

你可能也喜欢

总统 Q1 持仓披露：特朗普的钱，加速投向 AI 基建？

三幕式打法之死：AI让企业软件创业进入「速通时代」

“金手指”点中IBM之后，股神特朗普的下一个目标浮出水面

又一次比特币购买在即？迈克尔·塞勒的最新帖子引发猜测

AI主导市场行情，Marvell夜盘涨超14%，黄金涨1%，铝价四年新高，比特币跌破7万

交易

热门文章

如何购买S

Sonic：Andre Cronje主导升级，逆势上涨的Layer1新星

成长学院：学习“ Sonic“ ，瓜分价值 1000 USDT

相关讨论

热门问答

热门分类

热门标签