黄仁勋 2026 GTC Taipei 演讲:AI 代理人时代来临,计算就是收入

marsbit發佈於 2026-06-03更新於 2026-06-03

文章摘要

在2026年GTC台北大会上,英伟达CEO黄仁勋宣布AI已进入“代理人”时代,AI从生成内容转变为能实际工作的利润与GDP创造者。其核心观点包括: 1. **AI代理人时代到来**:AI的计算模式发生根本改变,以“大语言模型+代理人框架”为核心的全新系统能理解、推理、规划并使用工具完成实际任务,每家公司都将成为运行代理人的公司。 2. **计算即收入**:在此模式下,AI生成的Token(计算单元)直接转化为收入和利润。AI工厂的经济核心是最大化每瓦电力产生的Token(收入),因此基础设施的吞吐量和能效至关重要。 3. **发布Vera Rubin系统**:英伟达推出史上最雄心勃勃的工程——Vera Rubin。它并非单一芯片,而是为运行代理人而设计的端到端完整系统,标志着英伟达从GPU公司、系统公司进一步转型为AI基础设施公司。 4. **推出Vera CPU**:首款专为AI代理人设计的CPU。代理人要求极低延迟和极高响应速度,Vera CPU强调顶级的单线程性能、每时钟指令数(IPC)和系统带宽,以满足代理人“没有耐心”的计算需求。 5. **与微软重新定义PC**:英伟达与微软合作推出新一代Windows PC产品线(桌面、笔记本、工作站),将代理式计算模式延伸至个人设备。新的PC操作系统将是传统系统与大语言模型的结合,应用程序将被“代理人运行时”取代。 6. **布局物理AI**:宣布了用于物理AI和机器人基础模型的Cosmos 3、用于自动驾驶的开放模型Alpamayo 2,以及完整的人形机器人技术栈与参考平台Isaac GR00T。这些系统遵循与云端代理人相同的“模型-框架-工具-运行时”模式。 **总结**:黄仁勋指出,过去六个月计算机行业因“有用AI”的实现而被彻底改变。未来十年,这种代理式计算模式将统一应用于云端、企业、PC、机器人及各类边缘设备。英伟达通过提供从芯片、系统到完整基础设施的全栈解决方案,旨在帮助客户建设高利润的AI工厂。对台湾供应链而言,AI工厂的交付效率、功耗控制及全栈协同能力将成为关键增长动力。

整理 & 编译:深潮TechFlow

嘉宾:黄仁勋,英伟达 CEO

播客源:邦妮區塊鏈 Bonnie Blockchain

原标题:黄仁勋 2026 GTC Taipei 演讲7大核心要点,辉达最新布局懒人包!【邦妮区块链】

播出日期:2026年6月2日

要点总结

在 2026 年 GTC Taipei 演讲中,黄仁勋将英伟达的下一阶段战略集中到一个核心判断:AI 已从生成内容进入能够工作的代理人时代,Token 不再只是技术指标,而是收入、利润和 GDP 的生产单元。围绕这一变化,英伟达推出 Vera Rubin、Vera CPU、企业级代理人工具包、与 Microsoft 合作的新一代 PC,以及面向物理 AI 的 Cosmos 3、Alpamayo 2 和 Isaac GR00T。黄仁勋强调,未来十年的计算模式将由模型、代理人框架、工具技能和运行时共同构成,并会从云、企业、本地 PC 扩散到机器人、工厂、卫星和边缘设备。对台湾供应链而言,这意味着 AI 工厂、功耗效率、基础设施交付速度和全栈协同能力,将成为下一轮产业增长的关键。

精彩观点摘要

AI 代理人时代的到来

  • “有用的 AI 已经到来,AI 现在是利润生成器,也是 GDP 生成器。它背后不只是大语言模型,而是一种全新的计算模式:代理人。”
  • “代理人由大语言模型和代理人框架组成,框架像操作系统一样连接记忆、工具、推理、规划和行动。”
  • “代理人系统的突破,来自大语言模型已经能够思考、推理、规划和使用工具,也来自代理人框架能够管理记忆、协调流程并调度工具。”
  • “每家公司都会成为代理人公司,每家公司内部都会运行代理人,也都会需要自己的代理人操作系统。”

Token、AI 工厂与基础设施经济学

  • “Token 现在是有利润的收入单位。AI 公司想生产更多 Token,就会建设更多 AI 工厂,这正是台湾计算需求暴涨的原因。”
  • “计算就是收入,计算就是利润。没有收入和利润,就是损失。”
  • “如果一座 AI 工厂只有 1 吉瓦电力,电力上限就是 1 吉瓦;在这个前提下,每瓦吞吐量就是收入,因为每一个 Token 都有价值。”
  • “只因为芯片更便宜就选择错误架构,并不会转化成真正收益,你需要确保的是每瓦收入。买得越多,赚得越多。”

Vera Rubin 与英伟达的基础设施转型

  • “Vera Rubin 不是一颗芯片,也不只是 GPU,而是一个从端到端构建的完整系统。”
  • “英伟达过去是 GPU 公司,后来成为系统公司,现在正在进一步变成基础设施公司,帮助客户建设 AI 工厂。”
  • “Vera Rubin 是英伟达历史上最有野心的工程,全公司 4 万名工程师都参与其中,台湾供应链也共同参与了这个系统的创造。”
  • “Grace Blackwell 是为处理 AI,尤其是推理而生;Vera Rubin 则是为运行代理人而生。”

Vera CPU 与代理人的计算需求

  • “过去所有 CPU 都是为人类打造的,这颗 CPU 是为代理人打造的。”
  • “代理人没有耐心。它们生活的世界不是以秒为单位,而是以纳秒为单位。代理人使用工具时,希望响应越快越好;访问数据库时,希望结果立刻返回。”
  • “Vera CPU 是为代理人打造的 CPU,它强调单线程性能、每时钟指令数、每核心带宽和系统总带宽。”
  • “这个市场一定会比上一个市场更大,因为代理人的数量会远远超过人类,而且代理人非常没有耐心。这就是 NVIDIA Vera CPU。”

下一代个人电脑

  • “未来的代理人计算模式会运行在 AI 云、企业内部,也会运行在你的 PC 上。”
  • “新的操作系统将是传统操作系统加上大语言模型;大语言模型在很多意义上就是现代版 DirectX,是计算机的智能扩展。”
  • “应用程序会被代理人运行时取代,现代应用将成为一个代理人。”
  • “英伟达与 Microsoft 正在重新发明 PC,并推出覆盖桌面、笔记本和工作站的新一代 Windows 机器。”

物理 AI、自动驾驶与机器人

  • “语言模型训练的是人类视角的数据,但机器人需要从机器人自身视角理解世界,物理 AI 最大的问题是数据。”
  • “Cosmos 3 是物理 AI 的前沿基础模型,可以理解、推理、生成、闭环仿真,甚至成为策略本身。”
  • “有了 AI 之后,计算本身也会变成数据;可以用 Cosmos 3 训练更多 AI 模型,并把它增强为自己的专有模型。”
  • “无论是云端代理人、PC 代理人、自动驾驶系统还是人形机器人,背后的计算模式都是一样的:模型、框架、工具技能和运行时。”

黄仁勋钦点台湾小吃成 AI 供应链

黄仁勋:

台湾生态系统发展到今天的规模,真的令人难以置信。大多数人谈到生态系统时,首先想到的是我们的软件栈,想到英伟达计算系统之上的开发者生态。但英伟达的生态并不止于此,它一路向上延伸到台湾供应链,也就是一切开始的地方;再一路向下延伸到数据中心,最终到达终端用户。

今天,我们几乎会谈到这个生态系统的每一个环节。这里有太多人值得感谢。我热爱这里的生态系统,这里有非常多企业,也有许多我最喜欢的生态伙伴。台湾拥有极其丰富的生态系统,这是全球最好的供应链生态系统。

AI 代理人时代来临

黄仁勋:

两年前我来到这里时,开始和大家谈 AI 如何从生成式 AI 走向下一波浪潮,下一波 AI 是代理式 AI。今天我们可以说,代理式 AI 已经到来,有用的 AI 已经到来。

从产业角度看,这意味着 Token 的需求正在变得极其旺盛。因为如果 AI 能真正做事,人们就会想生产更多这样的能力。Token 现在已经是有利润的单位,是能够产生收入的单位。既然它能赚钱,AI 公司就会想构建更多 Token、生成更多 Token、建设更多 AI 工厂,这也是台湾计算需求暴涨的原因。

这正是大家如此忙碌、业务表现如此好的原因。事实上,它看起来也反映在你们一些公司的股价上。计算模式已经改变,一切都变了。

第一个重点是:有用的 AI 已经到来,AI 现在是利润生成器,也是 GDP 生成器。在它背后,是一种全新的计算模式。它不只是大语言模型,而是代理人。今天我们几乎所有内容,都会建立在这个基础之上。

让我花一点时间说明我在说什么。这里面是一个代理人,一个代理人应用。过去,这里会是应用程序,是代码,是操作系统,也就是应用程序里的代码运行在操作系统之上。今天,它是代理人,由一个或多个大语言模型组成,并被放在一个代理人框架里。这个框架会帮助它协调工作,让它真正完成有生产力的任务。

当输入进入系统时,代理人必须理解、观察、推理、行动,并使用工具。工具可以是电子表格、网页浏览器、数据处理引擎,也可以是数据库引擎。每一次信息流转,无论是处理上下文、理解正在发生什么、推理下一步该做什么,还是形成可以执行的计划,都需要由某种软件来协调。

所以,代理人的本质就是这样一个系统。它处理短期记忆,也就是工作记忆,也处理长期记忆,就像人类一样。记忆管理系统因此变得极其重要。整个系统就叫做代理人。大语言模型负责思考,代理人框架把所有东西连接起来,就像操作系统一样。

这就是新的计算模式,也是代理人能够完成惊人任务的原因。这是一个重大突破:大语言模型已经能很好地思考、推理、规划、使用工具;与此同时,我们也拥有了能管理记忆、协调流程、调用工具的代理人框架。因此,我们现在可以做很多过去做不到的事。

AI 工厂的 Token 是什么?

黄仁勋:

Token、DSX、GPU、CPU、Vera……我们已经打造了下一代系统 Vera Rubin。Vera Rubin 不是一颗芯片,也不只是 GPU。它从 GPU 开始,但远不止于 GPU。整个端到端系统,才是 Vera Rubin。

它包含 GPU、Vera Rubin NVLink 72,并由我稍后会介绍的 Vera CPU 协调。它也包括革命性的 Vera 存储系统、CX9、我们的软件栈 DOCA,以及内置的安全处理器。系统中的所有数据,无论是静态存储、传输过程中,还是正在被使用时,都会被加密。整个系统都是安全的,因为 AI 模型极其珍贵。这也是为什么整套系统都遵循机密计算。

这些系统里的任何一个,单独拿出来都足以成为一次完整革命。Vera Rubin 是英伟达历史上最有野心的工程。全公司 4 万名工程师都参与了 Vera Rubin 的工作,更不用说在座各位也参与了整个系统的创造。Vera Rubin 真的是一个奇迹,它不只是一颗芯片,而是许多组件共同构成的系统。

甚至还不止于此。很久以前,英伟达是一家 GPU 公司;这些年,我们逐渐演进成一家系统公司。你们现在看到的,是我们从零开始设计过的最复杂系统。可到最后,我们的客户和伙伴并不是想买计算机,他们想建设 AI 工厂。

这就是英伟达再次开始转型的原因。大家可以看到,我们的很多技术已经扩展到完整基础设施尺度。我们的伙伴也处在基础设施尺度上:发电厂、冷却系统、电网供应商,以及许多工业企业,现在都成为我们生态的一部分。归根结底,我们要构建完整技术栈,就像当初构建 GPU、Grace Blackwell、NVLink 72 一样;现在,我们要构建全栈系统,让客户能够建设出卓越的 AI 基础设施。

做好这件事,帮助客户建设和部署 AI 工厂,变得极其重要。原因很简单:计算就是收入,计算就是利润。没有收入和利润,就是损失。

大家需要理解一件事:当一套 AI 基础设施上线时,它可以很快上线,也可能拖很久;吞吐量可以很高,也可以很低;弹性和可靠性可以好,也可以差;有效使用寿命可以很长,也可以很短。因为这代表 500 亿、600 亿,甚至 1000 亿美元级别的投入,所以这条曲线极其重要。

这也是为什么英伟达是很好的合作伙伴。我们具备完整集成能力,不只是做了一页演示文稿,而是真正创造了整个基础设施,把一切连接起来,并且自己大规模建设,确保系统能够良好运行。因此,我们的首个 Token 时间、首个推理时间、训练启动时间都更快。

第二,我们的每瓦吞吐量、每瓦 Token 数是世界级的。原因在于我们集成所有东西,从零开始设计所有东西,模拟整个系统,并采用极致协同设计。就像刚刚展示的 Vera Rubin 机柜,一切设计都是为了实现惊人的吞吐量。

如果你的数据中心、你的工厂拥有 1 吉瓦电力,那它就不会再有更多,这就是你能获得的全部发电能力。在 1 吉瓦电力下,每瓦吞吐量就是收入,因为每一个 Token 都能产生利润,每一个 Token 都是收入。

这就是未来。计算就是收入,每瓦性能就是你的收入。只因为芯片更便宜就选择错误架构,并不会转化成真正收益,你需要确保的是每瓦收入。买得越多,赚得越多。

我现在站在大家面前,可以告诉大家:Vera Rubin 已经全面投产。我们为 Vera Rubin 建立的供应链规模,是 Grace Blackwell 的两倍。过去组装一个 Grace Blackwell 机柜需要两个小时,现在只需要五分钟。所以不仅产能更高,生产吞吐也快得多,而我们需要这一切来满足需求。

这个生态系统非同寻常。为了支持 Grace Blackwell,并为 Vera Rubin 的爬坡做准备,已经有数百万平方英尺的产能上线。我想感谢大家。Vera Rubin 已经全面投产。谢谢各位。

Vera Rubin 系统介绍

黄仁勋:

Vera Rubin 不只是为了 AI 而建。Vera Rubin 不只是为了运行 AI 而建,它是为了运行代理人而建。这是一个代理式系统。请想象其中的复杂度。也正因为如此,代理人是最后一个计算机科学突破。它花了这么多年,才终于实现潜力并变得有用。能够运行它的计算机,也理应是世界上最先进的。

这就是 Vera Rubin。我们来看一下。请把 Vera Rubin 带上来。

这是 Vera Rubin,Vera Rubin NVLink 72。这是下一代系统的一部分,在下一次 GTC,我会和大家讲更多;今天我们还有很多内容要谈。这是 Vera CPU 机柜,256 颗 CPU,全部液冷。我稍后会介绍 Vera。这是 Vera BlueField 存储处理系统,也是安全系统。当然,还有我们的 Mellanox 网络,这是全球首个 CPO。这就是 Vera Rubin,令人惊叹的技术组合在一起。

当年我们打造 Hopper,是为了预训练。预训练是当时最重要的应用,也是我们面对的最重要负载。后来打造 Grace Blackwell 时,大家说:“Jensen,英伟达很擅长预训练,推理很简单。”大家还记得吗?当时很多人说:“推理很简单,我们也能做。”

但大家知道,推理等于金钱。模型非常复杂,要在极高响应速度、快速交互和高吞吐之间同时做到优秀,非常困难。这就是我们创造 NVLink 72 的原因。

今天,英伟达的 Token 成本是全球最低的。不是低 10%,而是低了数倍,甚至数量级差距。这一切都因为我们做了极致协同设计,因为我们理解推理的计算模型和计算模式,并创造了 NVLink 72。

到了 Vera Rubin,事情已经超越推理。现在是代理式系统中的推理。这就是 Vera Rubin。没有线缆,没有软管,没有风扇。上一次我把它展示给大家时,线缆到处都是。

VERA CPU:AI 代理人的 CPU

黄仁勋:

Vera CPU,是为 AI 时代打造的 CPU。到目前为止,所有 CPU 都是为人打造的。我们曾经是用户,也是租户。人类使用 CPU 的方式,是生活在以秒计量的世界里。我们在云中租用 CPU,CPU 核心越多,能够出租的资源就越多。旧 CPU 的使用场景和经济学,与代理人完全不同。

代理人没有耐心。它们生活的世界不是以秒为单位,而是以纳秒为单位。代理人使用工具时,希望响应越快越好;访问数据库时,希望结果立刻返回。代理人每等待一刻,就会被阻止进入下一步、再下一步、再下一步。因此,我们必须让 CPU 尽可能低延迟、尽可能具备交互性。

这就是我们为 AI 时代创造 Vera CPU 的原因。在我们的系统里,它有三种用途。第一种当然是在 Vera Rubin 中用于思考。在 Vera Rubin 机柜里,已经有两颗 CPU。大家知道,我们正在制造并销售数以百万计的 Vera Rubin,也已经卖出了数以百万计的 Grace Blackwell。英伟达已经是全球最大的 CPU 制造商之一。

Vera Rubin 机柜里的两颗 CPU,其中一颗用于协调和管理 GPU、管理 KV 缓存,并处理机柜中运行的各种软件。我们还有 Grace BlueField,用于安全和隔离。Vera 计算部分则用于代理人框架,负责 AI 模型的协调、工具使用和数据库访问。

这里的数据服务器是 Vera BlueField,它是世界上最快的存储服务器和存储系统。它之所以至关重要,是因为代理人会以极高速度访问记忆。存储服务器和 CPU,现在已经处在数据中心最昂贵部分的关键路径上。

之所以这里最昂贵,是有充分理由的。AI 工厂的经济学核心是 Token,而 Token 在这里被创造出来。所以,你当然希望制造并生成尽可能多的 Token。经济价值都集中在这里,而 CPU 和存储系统绝不能成为阻碍。

因此,Vera CPU 给 CPU 架构带来了很大压力,这也是我们从零开始打造全新架构的原因。这是一种世界从未见过的 CPU,我们称之为 Vera。这是为代理人打造的 CPU。过去所有 CPU 都是为人类打造的,这颗 CPU 是为代理人打造的。

第一,Vera 的每时钟指令数必须极强,因为我们需要缩短延迟,缩短处理时间。我们要的是单线程性能,而不是单纯吞吐。单线程性能必须是世界级,必须是最好的。所以 Vera 的 IPC 极高,是全球最高水平:每个时钟周期抓取、解码并执行 10 条指令。

第二,CPU 进出数据所需的带宽必须达到世界级。这里既包括每核心带宽,也包括总体带宽。我前面说过,代理式系统本质上是解耦和分布式的。当计算解耦并分布式部署时,网络就成为问题。因此,我们必须尽可能快速地在 CPU 核心之间、CPU 与存储之间、CPU 与 GPU 之间移动数据。

系统周围以及 CPU 核心内部的带宽都必须达到世界级,因为 CPU 核心之间正在以极高带宽互相通信。它们不是一个核心一个核心地出租,而是全部一起协作。Vera 的横截面带宽非常惊人。它是第一个支持 PCI Express Gen 6 的系统,也率先配备 LPDDR5,带宽达到每秒 1.2 到 2 TB,是最高性能 CPU 的 2 到 3 倍。

这是为代理人打造的 CPU。这个市场一定会比上一个市场更大,因为代理人的数量会远远超过人类,而且代理人非常没有耐心。这就是 NVIDIA Vera CPU。

未来十年最重要的计算模式

黄仁勋:

这真的是最重要的一页。这里的核心结论是:这就是未来十年的应用模式,也是未来十年的计算模式。代理人、代理人框架,以及由框架协调的大语言模型,每家公司都会运行它。每家公司都会成为代理人公司,每家公司内部都会有代理人运行,每家公司都会发现,代理人需要自己的操作系统。

每家公司都在问我们:如何安全地运行代理人?如何为自己的工作负载构建代理人?所以,我们有 NVIDIA 企业 AI 代理人工具包。大家其实已经看着我公开地一步步构建它。

英伟达做的几乎所有事情,大家都知道,如果回看我 5 年前或 10 年前的 GTC 演讲,你会看到我多年来一直在谈今天这些事情,因为我们一直在为这一刻做准备。

企业要构建代理人即服务,或者构建用于运营的代理人,需要四样东西。第一,需要模型。当然,大语言模型越聪明越好、越便宜越好、越快越好。第二,需要一个框架来协调整个系统。第三,这些模型想要使用工具,而这些工具带有技能。我刚刚展示过 CUDA-X 库,它们未来会成为代理人的强大工具。第四,需要一个运行时,也就是把一切连接在一起的操作系统。

这就是 NVIDIA 代理人工具包。它包括可以修改的模型,也就是 NVIDIA 世界级开源模型。我还想展示更多。你可以运行来自任何地方的代理人,可以运行 Claude Code 这样的强大代理人,也可以运行 Codex 这样的强大代理人。你可以把它们放进一个名为 Open Shell 的框架中,在企业内部实现高度安全的运行。

这个 Shell 会保护代理人,让它始终受安全策略约束。隐私受到保护,权限和特权被明确分配,身份也受到保护。因此,Open Shell 正在全球范围内被采用。NVIDIA Open Shell 是开源的,你会看到很多公司采用它,包括 Red Hat、Canonical 和 Microsoft。它会被到处采用。

这是一个重要运行时,而且这个运行时完全针对无处不在的 NVIDIA AI 平台优化。你可以在任何云、本地环境,甚至设备端运行 Open Shell。现在,你有代理人可以使用的工具和库,有可以修改或直接使用的模型,也有代理人框架。这些代理人框架现在可以在本地或其他任何地方运行。

我最喜欢的代理人用例之一,是芯片设计师。这是英伟达最重要的工作之一。因此,我们当然要和 Cadence 合作,构建一个芯片设计超级代理人。它由 Codex 或 Claude Code 协调,以 RTL、架构图、原理图或规格说明作为输入,帮助你修复需要修复的内容。我们共同打造了一些超级代理人,并用 Nemotron 针对 NVIDIA 运行时进行了优化。

英伟达致力于为世界构建开放模型,让你们、让我们所有人都能创造自己的代理人。今天,我们宣布 Nemotron 3 Ultra,这是我们的下一代开放模型,而且非常聪明。Nemotron 模型不仅给你模型,也给你我们用于训练模型的全部数据。

因为我们拥有一个强大的合作伙伴联盟,大家可以看到这里列出的所有伙伴。我们共同合作、彼此贡献数据。通过这些伟大合作关系,从模型到训练脚本,再到数据,全部都会完整开放给你们。这是开放模型的最佳形态,也是世界上最好的开放模型系统政策。目标很简单:你可以拿走所有内容,在上面继续增加,让它变得更好,并让它成为你自己的模型。

Nemotron 3 Ultra 速度快了 5 倍,成本也降低了 30%,并且完全开放。我们对此非常坚定。这是 Nemotron 3,我们现在也正在开发 Nemotron 4。正是这套由模型、框架、工具技能和运行时构成的完整工具包,让全球每一家企业都能像 Cadence 用超级代理人那样,创造属于自己的代理人。

NVIDIA 新一代个人电脑

黄仁勋:

Microsoft 和 NVIDIA 将重新发明 PC。这将成为新的 PC。明晚,应该是我们这里的明晚,我会和 Satya 一起,谈更多我们过去三年共同推进的工作。Microsoft 与 NVIDIA 花了这么长时间,彻底重新思考 PC 的运行方式,就是为了准备好迎接这一刻。

正如我前面提到的,代理人这种计算模式会运行在 AI 云中,会运行在企业内部,也会运行在你的 PC 上。当 PC 拥有一个自主代理人时,会发生什么?它会帮助你,理解你。你可以和它说话,它可以看见你。你可以让它读文件,帮你做研究。它还能做更多事情,我稍后会展示。

新的操作系统,当然是旧操作系统加上大语言模型。在很多意义上,大语言模型就是现代版 DirectX。它有输入和输出,理解提示词,理解计算机视觉,可以生成视频,也可以生成声音。它是 PC、也是计算机的现代智能扩展。

在此之上,正如我前面说过,应用程序将被代理人运行时取代,而现代应用就是代理人。

各位,NVIDIA RTX Spark 笔记本电脑。谢谢。我口袋里的东西太多了。好了,这是世界上最惊人的芯片。这是我们与 MediaTek 合作打造的 N1X。我刚才好像看到了 Rick。这是 N1X,一颗漂亮的芯片。坦率说,这是一颗需要 33 年才能打造出来的芯片。

原因在于,100% 的 NVIDIA 软件栈都能在这里运行。你想做数字生物学,没问题;想做地震处理,没问题;想做天体物理,没问题。所有与 CUDA 相关的东西,所有物理、所有生物学、所有基因组学、所有 AI,都没有问题。所有计算机图形,也没有问题。

英伟达创造过的每一个应用,以及 Windows 曾经运行过的每一个应用,Microsoft 和 NVIDIA 都细致优化过,让这台计算机真正能够运行世界曾经创造过的一切。除此之外,它现在还能运行代理人。这是一台令人难以置信的计算机,我为它感到非常自豪。

这台计算机可以拥有本地 Nemotron 3 Ultra 模型,或者 Nemotron 3 超级模型;也可以连接云端的 Claude Code、Codex,或其他模型;也可以连接网络上的模型。它会工作,并完成惊人的事情。RTX Spark 是对笔记本电脑的重新发明,但事实上,Microsoft 和 NVIDIA 正在重新发明整个 PC。

今天,我们宣布一个全新产品线:三款革命性的 Windows 机器,覆盖桌面、笔记本和工作站。它们 100% 兼容 Windows,100% 支持 CUDA,100% 搭载 NVIDIA AI Tensor Core。你在全球各种 NVIDIA 平台上看到能运行的一切,都能在这里运行。

我们为此准备了路线图。这是一个全新的产品家族。每一代架构,我们都会有桌面、笔记本、工作站;下一代仍然会有桌面、笔记本、工作站。我非常高兴,也非常荣幸的是,全球 100% 的 PC 行业都加入我们,一起重新发明 PC。这是一个新产品线,也是一个新的开始。

Cosmos 3:物理 AI 的基础模型

黄仁勋:

在语言模型的场景中,我们在互联网上训练所用的英文和各种语言,都是从人类视角出发的。它们由我们书写,也由我们阅读。然而,如果要为 AI 机器人创造数据,就必须从机器人的感知和视角出发。世界上绝大多数视频数据是第三人称视角,而不是第一人称视角。

因此,对于代理式系统、机器人系统和物理 AI 来说,数据是最难的问题。大家已经看到我们沿着这条阶梯向上推进。我们从遥操作开始,本质上就是人类示范。这和强化学习中的人类反馈突破并没有不同。之后,我们使用仿真,这就是 Omniverse 发挥作用的地方。这也类似于强化学习中的可验证奖励。

我们用这些系统来启动 AI 模型,启动物理 AI 模型。最终,我们能够从第三人称视角学习,并把它重新投射到第一人称视角。通过这种启动过程,我们最终拥有了一个世界基础模型,它能够从任何你想要的视角理解物理世界。第三人称、第一人称、由外向内、由内向外,都可以。这确实是一个重大突破。

今天,我们宣布 Cosmos 3。Cosmos 3 是物理 AI 的前沿。我们在语言模型上处在前沿,许多人也在研究语言模型。但在物理 AI 上,我们绝对是全球最强。我为团队能做到这一点感到无比自豪。

这是你们所有工作的基础模型。无论你想创造机器人、工厂机器人,还是在工厂里工作的机器人,只要涉及物理世界,你现在都有一个伙伴:Cosmos 3。它可以理解和推理,可以生成,可以在闭环中仿真,甚至可以成为策略本身。它在全球各类榜单上都处在领先位置。我为 Cosmos 感到非常自豪。今天,我们宣布 Cosmos 3。

过去是数据加计算得到 AI。现在我们有了 AI,计算也会成为数据。所以,使用 Cosmos 3,训练一大批 AI 模型。Cosmos 是一个非常出色的开放模型系统,它和 Nemotron 完全一样。我们开放模型,开放数据,甚至开放训练方法,让你可以为自己增强它,并把 Cosmos 变成你的专有模型。

Alpamayo 2:自驾车推理

黄仁勋:

今天,我们宣布 Alpamayo 2,这是一个面向自动驾驶汽车的开放模型。我们正与全球汽车公司合作。如果看这些已经加入 NVIDIA Hyperion、正在打造 NVIDIA Hyperion 汽车的品牌,它们代表了全球大约 80% 的汽车。也就是说,这些制造商覆盖了全球 80% 左右的汽车。

未来会有大量 NVIDIA Hyperion 系统,它们能够运行 Alpamayo,也能够运行任何其他自动驾驶技术栈。我们也连接到出行服务。全球大约 97% 的出行服务正在与我们连接。因此,当我们把 Alpamayo 部署在 Hyperion 运行时和 Halos 操作系统上时,我们就能连接全球这些服务。

Isaac GR00T:人形机器人

黄仁勋:

NVIDIA Isaac GR00T 是我们的人形机器人技术栈,包含模型、数据生成、仿真、运行时以及操作系统。它代表了 GR00T 平台,也就是 Isaac GR00T 平台。

大家可以看到,我们每一个系统都遵循完全相同的模式:无论是云端代理式系统、PC 上的代理式系统、自动驾驶汽车的机器人系统,还是人形机器人的机器人系统,都是同一种模式。

当然,在每一个案例里,我们都会完整构建一切。我们做垂直整合,做彻底集成,采用协同设计和极致协同设计,然后再把它开放出来,让每个人按自己需要使用其中任何部分。你想使用什么,我们甚至会帮助你修改。

但现在还缺少一件事:机器人系统需要一个参考平台。这些机器人系统太复杂了,有大量马达和传感器,也非常脆弱。然而,我们需要一种方式交付这些参考平台。就像我们为 PC、DGX、云和自动驾驶汽车所做的那样,现在我们也要为机器人这么做。

今天,我们宣布 NVIDIA Isaac GR00T,这是一个完全整合的人形机器人参考平台。它每只手有 25 个自由度,机器人本体有 31 个自由度,高 6 英尺,重 150 磅。就像我一样,只是第一个数字比我小,第二个数字比我大,其他方面差不多。

这个平台运行新的 Thor,以及我们的完整软件栈、数据生成栈、数据仿真栈和运行时。所有东西都整合进一个机器人平台,供所有人使用。我们是为高等教育和大学研究人员打造它的,因为对他们来说,自己构建这样的平台实在太难了。

复盘总结

黄仁勋:

过去六个月,计算机行业已经被彻底改变。变化发生的原因是代理人终于被实现了,并且与最新前沿模型汇合,让 AI 现在能够真正做有用的工作。

这种计算模式会一遍又一遍重复:一个代理人由模型和框架组成,使用带有技能的工具,并运行在某个运行时之上。运行时取决于它是在云端、本地企业环境、PC,还是机器人里。但计算模式完全一样。

你会根据自己的偏好使用不同框架,也会根据自己的偏好使用不同模型。你会为了自己的专有用途改进它们。你会创造超级代理人,把它们租给别人,帮助别人完成工作。这个代理式平台、这种代理式模式,正是 NVIDIA 企业 AI 工具包要支持的东西。对你们来说,这是参与 AI 的很好方式;对我们来说,这也是巨大的增长机会。

Vera Rubin 已经全面投产。Grace Blackwell 是为了处理 AI,尤其是推理而打造的;Vera Rubin 是为了运行代理人而打造的。它已经全面投产。它远远不只是一颗 GPU,而是一整个解耦、分布式的代理人处理系统。

英伟达已经真正成为一家基础设施公司。不只是 GPU 公司,不只是系统公司,而是基础设施公司。我们的目标是帮助你们创造最大收入、最大利润,并尽可能快地做到这一点。

在代理人世界里,这种新的计算方式意味着 CPU 也要为代理人而建,而不是为人而建。为代理人打造的 CPU 有自己的特殊需求。我们的 NVIDIA Vera 是一次革命。我很高兴看到它的爬坡和订单情况,它会成为英伟达历史上最快、最成功的产品发布。

NVIDIA 和 Microsoft 已经创造了全新的 PC 产品线。这是一个新的开始。当然,我刚才描述的同一种代理式处理模式、代理式计算模式,也会运行在各种设备上。我提到了 PC,但未来它会出现在机器人、卫星、基站、工厂、云端、本地、边缘设备中。这种代理式 AI 系统和代理式计算模式,会在各种计算机中不断复制。我们对个人电脑的理解,很可能会发生变化。

相關問答

Q在黄仁勋的演讲中,他如何定义AI代理人时代的核心特征?

AAI代理人时代的核心特征是AI已经从生成内容进入能够实际完成工作的‘代理人’阶段。代理人不只是大语言模型,而是一种全新的计算模式,由大语言模型和代理人框架组成。这个框架像操作系统一样,负责连接记忆、工具、推理、规划和行动,使AI能够理解、推理、规划并自主使用工具来完成任务。

Q黄仁勋为什么强调‘Token’的重要性,并将其与‘收入’和‘利润’联系起来?

A在AI代理人时代,AI能够完成有用的工作,这意味着其产出的每一个Token(处理单元)都能直接创造价值。因此,Token成为了有利润的收入单位、GDP的生产单元。对AI公司而言,生产更多Token就意味着产生更多收入,这驱动了它们建设更多‘AI工厂’(即大规模计算基础设施)的需求,从而解释了台湾等地计算需求的暴涨。

Q英伟达新推出的Vera CPU与传统的CPU在设计理念上有何根本不同?

A传统的CPU是为人类用户设计的,人类生活在‘秒’级响应的世界。而Vera CPU是专为AI代理人设计的。代理人对延迟极度敏感,生活在‘纳秒’级世界,需要极低的延迟和极高的单线程性能来快速响应、使用工具和访问数据。Vera CPU强调极高的每时钟指令数(IPC)、世界级的每核心带宽和系统总带宽,以满足代理人‘没有耐心’的高吞吐、低延迟计算需求。

Q黄仁勋在演讲中预测了哪种计算模式将成为未来十年的主流?这种模式由哪些关键部分构成?

A黄仁勋预测,基于‘代理人’的计算模式将成为未来十年的主流。这种模式由四个关键部分构成:1. 模型(大语言模型,负责思考);2. 代理人框架(像操作系统一样协调记忆、流程和工具调用);3. 工具技能(代理人可以调用的各种软件工具,如数据库、浏览器等);4. 运行时(连接一切的操作环境)。这种模式将统一应用于云端、企业、PC、机器人等各种设备。

Q针对‘物理AI’(如机器人、自动驾驶)面临的独特挑战,英伟达推出了什么解决方案?其核心优势是什么?

A物理AI面临的最大挑战是缺乏从机器人第一人称视角出发的训练数据。英伟达推出的解决方案是Cosmos 3,这是一个物理AI的基础模型。其核心优势在于,它能够从任何视角(包括第一人称和第三人称)理解和推理物理世界,具备生成、仿真甚至成为行动策略的能力。更重要的是,Cosmos 3是一个开放模型系统,英伟达开放模型、数据及训练方法,允许企业在此基础上构建自己的专有模型。

你可能也喜歡

当 Google 也要“印股票”造 AI,高估值 Neocloud 的叙事被谁打破了?

近日,Google宣布自2005年以来首次股权融资,计划募集800亿美元。此举并非单纯扩大AI基建产能,而是旨在挑战Nvidia GPU在AI算力市场的主导地位。通过三个连贯动作——发布新一代TPU芯片并向第三方销售、与黑石成立合资公司提供算力服务、启动大规模股权融资——Google正以TPU为核心,同时推进自建数据中心、出售芯片和进军云算力服务,试图重塑算力市场格局。 分析指出,此次融资中仅约500亿美元将直接用于AI基建,其余部分用于覆盖股权激励等行政支出。Google此举反映出其AI资本需求已巨大到必须动用股权工具。相比之下,微软因自研芯片进展缓慢,深度依赖以Nvidia GPU为核心的Neocloud服务商(如CoreWeave、Nebius、IREN),而Google凭借自研TPU,选择了一条自建加对外扩张的差异化路径。 Neocloud“三剑客”短期虽手握大量已锁定GPU合同,现金流无忧,但长期估值叙事已受冲击。其高估值依赖的“AI算力供不应求、Nvidia GPU唯一、大厂自建跟不上”三大前提正被动摇。其中,CoreWeave与Nvidia深度绑定,转型空间最小;Nebius技术栈相对灵活;而由矿商转型的IREN因估值较低、合同扎实,反而显得更稳健。 市场结构正在转变:前沿AI公司开始采用多芯片栈,大厂技术路线分化,资金成本差距将影响长期竞争力。Google以低成本资金入场,若其TPU生态扩张顺利,可能重塑市场格局。后续需关注Google与黑石合资项目的产能落地、TPU能否赢得更多大客户(如Meta、xAI),以及微软会否转向TPU。这些动向将决定Neocloud厂商的未来。

marsbit16 分鐘前

当 Google 也要“印股票”造 AI,高估值 Neocloud 的叙事被谁打破了?

marsbit16 分鐘前

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

85 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

813 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.7k 人學過發佈於 2025.01.15更新於 2026.06.02

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片