黄仁勋的「Agent工厂」里,装了什么新故事?

marsbit发布于2026-06-01更新于2026-06-01

文章摘要

在COMPUTEX 2026期间,英伟达CEO黄仁勋发表了主题演讲,核心聚焦于“Agent AI”时代的到来。此次发布的关键在于,英伟达正围绕智能体生态,构建从芯片、数据中心到软件平台的全栈技术体系。 硬件层面,专为Agent工作负载设计的Vera Rubin平台已进入量产,其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。该平台引入共封装光学(CPO)网络技术以降低能耗,并强化了机密计算安全能力。同时,英伟达推出了新型处理器“Vera” CPU,这是首款为AI智能体设计的CPU,与Rubin GPU通过高速NVLink互联,优化了Agent任务中的数据传递。 软件与模型方面,英伟达推出“AI工厂运营工具箱”DSX,整合了设计、仿真、建设到运营的全流程。发布了5500亿参数的混合专家模型Nemotron 3 Ultra,以及配套的NemoClaw、OpenShell等工具,旨在帮助企业构建能安全接入业务流程的“数字同事”。此外,面向物理AI的世界基础模型Cosmos 3正式发布,它能统一理解、生成和预测物理世界信息。 在物理AI领域,英伟达联合宇树发布了基于Isaac GR00T平台的人形机器人参考设计H2 Plus,旨在降低开发门槛。还开源了一套物理AI技能工具集,让智能体能直接调用标准化操作。 产品布局上,推出了“DGX Station for Windows”桌面AI超算工作站,让Agent能在企业本地Windows环境中安全运行。并与微软合作推出基于Arm架构的RTX Spark SoC,瞄准AI PC市场。 最后,英伟达升级了AI原生存储架构,在BlueField-4 STX中强化了针对Agent数据访问的安全管控能力。 总结来看,英伟达正通过Vera Rubin、DSX、Nemotron、Cosmos 3、H2 Plus等一系列产品,从算力供给、模型智能、安全管控、物理形态到部署运营,全方位构建服务于Agent的基础设施,宣告一个以智能体为核心的新计算时代已经开启。

原文作者:李海伦 苏扬

原文编辑:徐青阳

原文来源:腾讯科技

2026年6月1日,在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上,英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC,不过三个月。

当时,英伟达发布了Vera Rubin的“芯片全家桶”,包括:Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机,六颗芯片构成一台机架级AI超算,并宣告训练大型MoE模型所需GPU数量降至四分之一,推理吞吐量每瓦提升10倍,单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同,三个月后COMPUTEX,黄仁勋把目光投向这些基础设施将服务的目标——Agent。

黄仁勋在演讲中透露:Vera Rubin正式进入量产,Vera CPU开始向全球交付,DGX Station第一次以Windows形态走进企业桌面,Cosmos 3重构物理AI的感知框架,DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计,把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态,重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说:“Agent AI和实用型人工智能时代已经到来。现在token(也称‘词元’)是利润单位,AI是GDP‘生成器’,软件工程师的数量正在增加。人们谈论AI减少了工作岗位,这完全是胡说八道,实际上有更多的软件工程师正在被雇用”。

同样的AI工厂,跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同,Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示,一个Agent任务往往不只是一次模型推理,而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节,背后可能涉及数千个步骤。未来数据中心需要处理的,也不再只是单个模型请求,更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机,专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里,用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务,其处理效率是上一代 Grace Blackwell平台的10倍。

除了计算平台本身,网络也成为Vera Rubin升级的重点之一。

过去数据中心里,GPU之间的数据传输主要依赖传统光模块和交换机架构,但当集群规模持续扩大后,功耗、散热和部署复杂度都会快速上升。为此,英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统。

这是英伟达首次将共封装光学(CPO)技术大规模引入AI数据中心网络。

简单来说,传统方案需要把光模块插在交换机外部,而CPO则直接把光学器件集成到交换机内部,从而减少能耗和信号损失。

此外,安全也是此次Vera Rubin平台重点强调的核心能力。

为此,英伟达将机密计算(Confidential Computing)能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制,企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露,Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统,其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划,Vera Rubin将于今年秋季开始正式出货。

“为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera,并已全面投产。

黄仁勋指出,内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的,而Vera是为AI时代设计的CPU,为智能体打造。

作为Grace的继任者,Vera采用了英伟达自主设计的“Olympus” CPU核心架构,核心数量从72个提升至88个,并大幅提高内存和数据处理能力。据英伟达介绍,在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升,更重要的变化在于Vera与Rubin GPU之间的关系:Vera通过第二代NVLink-C2C与Rubin GPU连接,互联带宽达到1.8TB/s,Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示,Vera Rubin采用美光、SK海力士和三星的HBM(高带宽内存),供应链规模是上一代Blackwell的“两倍”。不过,部署一个大型Blackwell机架需要两个小时,而Vera Rubin的时间被压缩到5分钟级别。

让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX,可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心,客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统,很多环节依赖不同供应商协同。DSX要做的,是把这些原本分散的环节放到同一个框架里,让客户从设计、仿真、建设到运营,都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示:NVIDIA不只是卖芯片,而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个。

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题:在电力预算固定的情况下,如何放下更多GPU、跑出更多Token。

按照英伟达的说法,MaxLPS结合液冷和机架内功耗优化,可以让运营商在不明显影响性能的情况下,多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件,负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说,如果AI工厂是一座复杂工厂,DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中,Reference Design提供AI工厂参考设计,告诉客户机房、机架、网络、电力和冷却系统应该如何搭建;DSX Sim负责仿真,让客户在建设前先验证设计是否可行;DSX Flex把AI工厂和电网连接起来,让数据中心可以根据电价、负荷和需求响应信号调整任务;DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面,CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。

与Windows和ARM抱团

现场演讲中,黄仁勋官宣“DGX Station for Windows”工作站登台亮相,被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上,它搭载GB300 Grace Blackwell Ultra Desktop Superchip,通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU,最高提供748GB统一内存和20 PFLOPS FP4性能,并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent,并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全,通过隔离沙箱和系统级策略控制,限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品,黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC,把N1X CPU和Blackwell GPU做进了一块芯片上,统一内存架构,专门给轻薄笔记本和小型台式机用。

其中,N1X是英伟达与微软共同打造的首款PC处理器,它基于Arm架构,由联发科定制设计,台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本,首批超过30款机型,主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”,黄仁勋把它视为PC形态的一次重要重构。

Agent的“两个大脑”

这次发布会上,英伟达公布了两条核心模型产品线的最新进展,分别对应Agent的两个场景:一个跑在企业系统里,一个跑在物理世界中。

英伟达发布了一款拥有5500亿参数的混合专家模型Nemotron 3 Ultra,可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型,该模型推理速度最高提升5倍,使用成本最高降低30%,助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型,英伟达发布了一系列软件、开源模型和合作进展,目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中,构建能够协助员工工作的“数字同事”。

这套组合里,Nemotron提供基础模型能力,NemoClaw负责把模型组织成Agent,OpenShell负责运行时安全,Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务,并接入企业现有系统。

黄仁勋表示,全球软件公司正在把AI Agent带入真实工作系统,让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件,包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI,更多关注模型能回答什么;现在英伟达要解决的是,Agent如何安全地接入工具、数据和业务流程,并在真实工作中持续运行。

还有Cosmos 3,作为Cosmos系列的第三代正式发布,也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型,提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比,早期版本主要面向机器人和自动驾驶开发者,做的是视频生成和物理世界模拟,本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer,首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作,在物理准确性上达到领先水平,是全球首个完全开放的全能模型。英伟达称,它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测,得益于多模态推理语言、视觉和世界模型的突破,物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力,用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

降低Physical AI门槛

英伟达与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板”的意思是:宇树负责机器人本体,英伟达负责软件和计算平台,两边把硬件和软件预先整合好,开发团队拿到就能直接开始做技能开发,不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点:硬件集成、数据采集、仿真、训练、评估、部署,各环节各自为战,整个流程高度碎片化。

英伟达表示,研究团队拿到一个机器人本体,往往要花大量时间在底层拼凑上,真正的技能开发反而被一再推后。H2 Plus尝试做的事,就是把这条路打通,让研究团队跳过底层集成,直接进入技能开发和真实场景验证。

在黄仁勋看来,人形机器人将为全球最大的产业带来物理AI,开启数万亿美元的经济机遇,而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外,英伟达还宣布,正式开源一套物理AI Skills(技能)工具集,覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”,可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后,写成了智能体可以直接读懂、直接执行的操作指令,这些指令打包开源出来,就是这次发布的工具集。

智能体接到一个任务,比如生成一批检测缺陷的训练数据,它就知道该调用哪个模型、输出什么格式、怎么验证结果,整个过程自动跑完,不需要人一步步去操作每个环节。

升级AI存储:从“跑得快”到“管得住”

在3月份的圣何塞GTC上,英伟达发布了Vera BlueField-4 STX,当时黄仁勋重点讲的是“AI原生存储架构”,核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在,英伟达在STX基础上宣布新增一套安全能力,重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考,是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体,当Agent接入企业系统,在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露,这都是企业头疼的问题。

英伟达的解法是,在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件,以及在 BlueField-4 芯片里直接硬性执行策略,基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动,帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称:“智能体把企业数据变成了一个实时、活生生的系统,而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的,就是用天生安全的设计,在芯片中以AI的速度执行信任”。

与台积电“互为供应商”

这次大会中,非常有意思的一个点是英伟达和台积电的合作——目前,台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系,过去三十年只有一种形态:台积电帮英伟达造芯片。但现在,角色发生了微妙的变化,英伟达开始帮台积电“管工厂”。

黄仁勋表示:“英伟达和台积电已合作近三十年,不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部,通过仿真、优化和AI应对全球最复杂的设计和制造挑战,以提高下一代芯片的速度、效率和良率。”

两者的关系,从单向的甲乙方,变成了双向的相互依存。

结语

回看这场发布会,英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务,Vera Rubin为Agent提供算力,BlueField-4 STX为Agent守住数据安全,Cosmos 3让Agent理解物理世界,Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束,DGX Station for Windows让Agent进入企业员工的桌面,H2 Plus让Agent拥有身体,DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看,黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底,黄仁勋这次想讲的就是一件事:当Agent成为AI基础设施,每一层都能有英伟达。

相关问答

Q在2026年COMPUTEX的演讲中,黄仁勋重点推介了什么主题?

A黄仁勋重点推介了围绕“Agent”(智能体)的生态,重新组织了从芯片、数据中心、模型、软件到机器人平台的完整技术体系,宣告了Agent AI和实用型人工智能时代的到来。

Q英伟达推出的Vera Rubin平台相比上一代在运行Agent任务方面有何提升?

AVera Rubin平台是专为处理智能体工作负载而构建的计算单元级AI超级计算机。在同样规模的超大型数据中心里,其处理Agent任务的效率是上一代Grace Blackwell平台的10倍。

Q为Agent时代设计的Vera CPU,相比同期x86服务器CPU有何优势?

AVera CPU在Agent相关工作负载测试中,任务执行速度达到同期x86服务器CPU的1.8倍。它通过第二代NVLink-C2C与Rubin GPU高速互联,带宽达到1.8TB/s,降低了Agent运行中数据传递的开销。

Q英伟达与宇树联合发布的H2 Plus人形机器人主要解决了什么痛点?

AH2 Plus人形机器人样板机主要解决了人形机器人开发流程碎片化的痛点。它将硬件本体与英伟达的软件、计算平台预先整合好,让研究开发者无需耗时于底层集成,可以直接进入技能开发和真实场景验证。

Q文章中提到英伟达与台积电的合作关系发生了怎样的新变化?

A过去近三十年的合作主要是台积电为英伟达制造芯片。而现在,英伟达开始为台积电提供AI和加速计算技术,应用于其先进晶圆厂的仿真、优化等环节,以提升生产效率、良率等。双方的关系从单向的甲乙方,变成了双向的相互依存。

你可能也喜欢

总统 Q1 持仓披露:特朗普的钱,加速投向 AI 基建?

2025年以来,市场高度关注特朗普的个人持仓动向。近期披露的Q1财务状况显示,其相关账户交易活跃,交易规模超2.2亿美元,交易方向呈现明显调整:大幅减持微软、亚马逊、Meta等上一代消费互联网平台公司及部分防御型ETF,将资金系统性转向人工智能基础设施领域。 具体加仓方向覆盖AI基建全链条: 1. **半导体**:买入英伟达、博通、AMD、美光、英特尔等,涵盖GPU、CPU、存储及芯片设计工具(EDA)环节。 2. **AI硬件与服务器**:增持戴尔、英特尔,后者兼具美国半导体本土制造的政策标签。 3. **企业软件**:买入甲骨文、ServiceNow、Adobe等,布局AI嵌入企业工作流带来的价值。 4. **消费电子与宽基指数**:增持苹果作为AI终端入口,并配置标普500等ETF维持市场整体敞口。 此次调仓折射出“聪明钱”的产业判断:投资主线正从上一轮互联网应用转向AI基础设施供给侧,包括芯片、服务器、本土制造及企业软件AI化。这既与市场寻找新增长点的逻辑吻合,也部分反映了美国当前推动半导体制造、供应链安全等产业政策的重点方向。值得注意的是,持仓变动不宜作为直接跟投信号,因其披露存在滞后且具体决策机制不明,但其揭示的结构性方向——资金从旧平台流向AI基建——值得投资者关注。

marsbit15分钟前

总统 Q1 持仓披露:特朗普的钱,加速投向 AI 基建?

marsbit15分钟前

交易

现货
合约

热门文章

如何购买S

欢迎来到HTX.com!我们已经让购买Sonic(S)变得简单而便捷。跟随我们的逐步指南,放心开始您的加密货币之旅。第一步:创建您的HTX账户使用您的电子邮件、手机号码注册一个免费账户在HTX上。体验无忧的注册过程并解锁所有平台功能。立即注册第二步:前往买币页面,选择您的支付方式信用卡/借记卡购买:使用您的Visa或Mastercard即时购买Sonic(S)。余额购买:使用您HTX账户余额中的资金进行无缝交易。第三方购买:探索诸如Google Pay或Apple Pay等流行支付方法以增加便利性。C2C购买:在HTX平台上直接与其他用户交易。HTX场外交易台(OTC)购买:为大量交易者提供个性化服务和竞争性汇率。第三步:存储您的Sonic(S)购买完您的Sonic(S)后,将其存储在您的HTX账户钱包中。您也可以通过区块链转账将其发送到其他地方或者用于交易其他加密货币。第四步:交易Sonic(S)在HTX的现货市场轻松交易Sonic(S)。访问您的账户,选择您的交易对,执行您的交易,并实时监控。HTX为初学者和经验丰富的交易者提供了友好的用户体验。

2.4k人学过发布于 2025.01.15更新于 2026.06.02

如何购买S

相关讨论

欢迎来到HTX社区。在这里,您可以了解最新的平台发展动态并获得专业的市场意见。以下是用户对S(S)币价的意见。

活动图片