AI PC来了，本地硬刚120B大模型！英伟达用RTX Spark重新定义“个人AI电脑”底座

marsbit发布于2026-06-01更新于2026-06-01

文章摘要

英伟达在GTC 2026大会上发布RTX Spark超芯片，将AI PC的算力标准大幅提升至1 petaflop（1000 TOPS），远超当前主流AI PC的NPU算力。该芯片采用Blackwell架构GPU与Arm架构Grace CPU的SoC设计，并配备最高128GB的统一内存，使CPU和GPU可直接共享数据，消除了传统架构中的数据搬运瓶颈。凭借强大算力与统一内存，RTX Spark支持在本地设备上运行120B参数的大语言模型，并处理百万级token的上下文窗口，同时也能胜任12K视频编辑、大型3D渲染等高负载任务。微软为其升级了Windows安全机制，并引入英伟达的OpenShell沙盒运行时，以保障AI代理操作的安全性。软件生态方面，Adobe宣布将底层重构Photoshop和Premiere以适配新架构，宣称性能可提升2倍。多家主流OEM厂商如华硕、戴尔、联想等将于今年秋季推出搭载该芯片的轻薄笔记本和台式机。 RTX Spark的出现，标志着PC架构正从以x86 CPU为核心转向以GPU为中心的SoC平台，但其实际性能表现、功耗散热、定价及软件生态适配等仍有待市场验证。

过去两年,PC厂商在宣传“AI PC”时反复提及一个参数:NPU算力。但不管是英特尔Lunar Lake的45 TOPS,还是AMD Strix Point的50 TOPS,这些数字始终停留在一个相对温和的量级上。能做背景虚化、能做语音降噪、能跑一些小规模的端侧模型,但也仅此而已。

5月31日,英伟达在GTC 2026大会上拿出的RTX Spark超芯片,把这个数字拉到了1 petaflop,也就是1000 TOPS。不是提升30%或50%,是直接跨过一个数量级。

同场发布的还有另外几条消息:微软配合RTX Spark升级了Windows原生安全机制,并把英伟达的开源沙盒运行时OpenShell引入Windows平台;Adobe宣布从底层重构Photoshop和Premiere,专门适配RTX Spark的统一内存架构;首批六家OEM厂商确认今年秋季推出搭载这颗芯片的轻薄笔记本和紧凑型台式机。

英伟达在这届GTC上做的事情,不是发布一块新芯片。它在试图给“个人AI电脑”这个品类定下一个新的硬件标准。

当GPU成为PC的主角

先看这颗芯片本身。根据英伟达在GTC上公布的数据,RTX Spark集成了一颗Blackwell架构的GPU,6144个CUDA核心,搭配联发科联合设计的20核Arm架构Grace CPU,采用台积电3nm工艺。关键的变化在于内存架构:最高128GB的统一内存,CPU和GPU共享同一个内存池,数据不需要在两者之间来回搬运。

这和过去PC的架构逻辑相反。

传统PC的基本结构是“x86 CPU作为主处理器,独立GPU作为可选配件”。即便是近年兴起的AI PC概念,英特尔和AMD的做法也是在CPU里内置一块NPU,作为AI加速的附加模块,算力普遍在四五十TOPS。GPU仍然是“外挂”。

RTX Spark重新分配了话语权。这颗SoC把GPU变成主角,CPU退居配角。英伟达给出的AI算力是1 petaflop FP4,相当于1000 TOPS,是上一代AI PC内置NPU算力的20倍以上。这不是同一条赛道上的提速,是另一条赛道的起跑。

OEM厂商的跟进速度印证了这个判断。根据英伟达官方公告和DIGITIMES的后续报道,华硕、戴尔、惠普、联想、微软Surface和微星将在今年秋季推出搭载RTX Spark的轻薄笔记本和紧凑型台式机,宏碁与技嘉的型号随后跟进。主流Windows PC品牌几乎全部入局。

RTX Spark并不是从零诞生的产品。2025年初,同样的Blackwell加Grace核心芯片曾以Project DIGITS和DGX Spark的形态亮相,但当时定位是面向开发者的Linux桌面超算,体积接近一台小型台式机。一年后,这套架构被压进了轻薄本的散热空间里,操作系统从Linux换成了Windows,目标用户从AI开发者扩展到了普通消费者和企业用户。这才是GTC 2026消费级发布中最值得注意的变化:英伟达不是在发布一个开发者玩具,而是在推开消费级市场的大门。

120B模型跑在本地,够用了吗

算力和内存的数字最终要回答一个问题:能做什么?

英伟达在发布会上给出的答案是,RTX Spark支持本地运行120B参数的大模型,上下文窗口可以达到百万token。120B是什么概念?作为参照,当前消费级硬件跑本地模型的主流实践是,24GB显存的RTX 4090通过量化压缩可以跑30B到40B参数级别的模型。部分小的模型,在消费级显卡上可以快速跑起来的是9B模型。从9B到120B,这个跳跃幅度让端侧AI的“够用”标准被重新划定了。

128GB统一内存是这一切的前提。在传统PC架构上,CPU有自己的系统内存,GPU有自己的显存,两者之间有物理边界。一个超过显存容量的大模型要么根本跑不了,要么需要复杂的模型拆分和内存交换,速度急剧下降。统一内存架构消除了这个瓶颈,模型数据直接放进128GB的共享池子里,CPU和GPU都能访问。苹果在Apple Silicon上率先证明了这条技术路线的消费级可行性,现在英伟达把它带到了Windows阵营。

除了大模型推理,英伟达列出的用例还包括12K视频编辑、90GB以上的3D场景渲染、1440p分辨率下超过100fps的光线追踪游戏。这些场景的共同特点是单次处理的数据量极大,传统PC要么需要数倍于处理时间的等待,要么根本跑不起来。

“支持运行”和“流畅可用”之间还有一段距离。英伟达没有公布120B模型在RTX Spark上的实际推理速度,也没有给出百万token上下文场景下的首token延迟数据。决定长上下文推理速度的关键指标是内存带宽。作为参照,同样使用GB10核心的DGX Spark在实测中内存带宽约为301GB/s。这个带宽水平跑120B模型是可以的,但处理百万token级别的上下文窗口时,用户可能需要等待数秒才能看到第一个输出token。RTX Spark的笔记本版本可能因为功耗限制,实际带宽还会有所调整。

给AI代理加一道安全笼

算力之外的另一个核心发布,是英伟达与微软在系统层面的合作。这部分可能是GTC 2026消费级发布中最容易被忽视、但对产业影响最深的内容。

一台能跑120B模型的电脑,如果交给一个可以自主操作桌面、点击按钮、读写文件的AI代理来使用,安全风险就不再是“会不会丢数据”这个级别了,而是“代理会不会做你不希望它做的事”。这个问题不解决,企业不可能把这种设备部署给员工。

微软和英伟达给出的方案是两道防线。第一道,微软升级了Windows的原生安全机制,从操作系统层面为AI代理行为提供监控和约束。第二道,英伟达把OpenShell运行时正式引入Windows平台。根据英伟达的官方文档,OpenShell是一个开源的沙盒运行时,提供内核级隔离。它给AI代理圈定了一个可控的操作范围,代理可以在这个范围内自主执行任务,但权限被严格限定,不能越界访问系统核心文件、网络连接或用户敏感数据。

这个组合对企业采购的意义是明确的。在此之前,“本地AI代理”这个概念停留在技术演示阶段。硬件跑得动,安全框架是空的。没有企业IT部门敢把这种状态下的设备纳入采购清单。英伟达和微软在硬件和应用之间插入一层标准化的隔离层,把“能用”变成了“可管理”。

OpenShell本身的性能开销是一个待观察的变量。沙盒隔离通常会带来一定程度的性能损失,具体会影响多少推理速度或系统响应,英伟达目前没有公开数据。企业IT管理端的部署复杂度、与现有安全策略的兼容性,这些实际落地中的问题需要等到OEM设备上市后才能验证。

Adobe为什么愿意“从底层重构”

软件厂商的配合程度,通常是判断一个新硬件平台能否站稳脚跟的风向标。

Adobe在GTC期间宣布的动作是这轮发布中软件端最大的信号。根据英伟达官方博客和Adobe高管的确认,Adobe启动了Photoshop和Premiere的底层重构,专门适配RTX Spark的统一内存架构,宣称AI与图形处理性能提升可达2倍。

“底层重构”不是加个插件、做个适配层。在传统PC上,CPU、GPU各有自己的内存空间,处理一个超大PSD文件或8K视频时间线时,数据要在两套内存之间反复搬运,这是性能浪费的重灾区。RTX Spark的统一内存让CPU和GPU可以直接共享同一块128GB空间,这个结构变化对专业创作者的工作流有实际价值。Adobe为此动底层代码,说明它认可这个架构方向不是一次性的营销噱头。

不过,这个“2倍加速”的对比基准是什么,英伟达和Adobe都没有公布。是跟同代的x86处理器加独立显卡比,还是跟上一代AI PC的NPU方案比?结果截然不同。在基准测试条件公开之前,这个数字的含金量只能打一个问号。

同时宣布支持的还有Blackmagic Design、ComfyUI、llama.cpp、OTOY以及多家游戏厂商。ComfyUI和llama.cpp的跟进值得注意,因为它们是当前本地AI工作流中最活跃的开源工具。开发者社区的早期支持往往比大厂的承诺更真实地反映一个平台的生态潜力。

英伟达正在用CUDA生态和统一内存架构,在Windows阵营构建类似苹果软硬一体的体验。区别在于,苹果的围墙是自己砌的,英伟达需要说服微软和ISV们一起砌。Adobe愿意从底层动手,至少说明这堵墙的第一块砖垒上去了。

纸面参数之外

回到一个最实际的问题:这些设备到底能不能买到,买到手是什么体验?

根据英伟达公布的信息,首批RTX Spark设备将在今年秋季上市,涵盖华硕、戴尔、惠普、联想、微软Surface和微星的轻薄笔记本与紧凑型台式机。宏碁和技嘉的型号此后跟进。所有OEM的具体定价和确切上市日期都没有公布。

比定价更关键的是几个物理层面的未知数。把1 petaflop算力的芯片塞进轻薄笔记本,功耗和散热怎么平衡?RTX Spark在非AI场景下的日常办公性能和续航表现如何?128GB统一内存在笔记本形态下的实际带宽会不会因为功耗限制而明显缩水?

这些问题是工业化落地的真正考验。一颗芯片在工程样机上的峰值算力和它在消费者手中每天8小时的实际表现,往往是两回事。英伟达在发布会上强调了RTX Spark的能效比,但没有给出具体的TDP数值或续航数据。

从PC产业格局的角度看,RTX Spark的出现标志着一种新的分工模式正在成形。过去三十年,PC的核心芯片话语权掌握在x86处理器厂商手里,GPU厂商虽然越来越重要,但始终是“插在主板上的配件”。英伟达这次拿出的是一颗完整的SoC,从CPU到GPU到内存控制器全部集成,Arm架构的CPU部分由联发科设计。PC产业链的权力结构,正在从“x86 CPU加上可选的GPU”转向“以GPU为中心的SoC平台”。

这个转向不会在一天之内完成。OEM的定价策略、实际产品的能效表现、ISV软件的适配进度、企业客户的采购验证周期,每一个环节都决定RTX Spark是成为PC产业的新坐标,还是另一个高开低走的技术演示。答案至少要等到今年秋天。

你可能也喜欢

迈克尔·塞勒："我们从未说过永远不会出售比特币"

微策略公司主席迈克尔·塞勒表示，公司从未承诺永不卖出其持有的比特币，但预计在长期内仍将保持比特币的净买家身份。此番言论是针对有报道称微策略新获准出售最多价值50亿美元比特币的回应。塞勒澄清，该出售许可并非新消息，而是公司早在6月29日就已公布的资本管理体系的一部分。他指出，相关许可是为了特定目的而设，但并未强制公司必须出售比特币。他强调，公司没有宣布任何新的许可，且预期未来将继续净买入比特币。塞勒还说明，公司的比特币货币化计划并不要求出售比特币资产，并重申公司从未正式采纳“永不卖出比特币”的政策。

cryptonews.ru28分钟前

cryptonews.ru28分钟前

《夏季拉锯战》仍在继续：突破67000美元将是比特币上涨的起点

比特币价格在8月1日跌至62,217美元，延续了自6月5日开始的盘整格局。目前比特币被困在58,000至67,000美元的区间内，市场参与者对下一步走向存在分歧。技术分析显示关键价位在60,000美元和67,000美元。交易员Crypto Candy认为，只要价格低于66,000美元，就可能跌向60,000美元或更低。投资者Jelle则将当前市场比作“夏季拉锯战”，坚持定期买入的平均成本策略。上行突破的关键在于能否站稳67,000美元以上。交易员Daan Crypto Trades认为，若无法突破此位，市场可能继续盘整。交易员Roman则预测，若伴随足够交易量有效突破67,000美元，价格可能快速上涨至70,000-80,000美元区间。宏观分析师Gert van Lagen从更长周期观察，认为比特币正在测试一个持续七年之久的“杯柄形态”的颈线位，市场恐惧情绪在盘整中逐渐消退。他强调，长期持有者仍未出现投降迹象，NUPL指标显示他们远未进入抛售区域。总而言之，市场共识是比特币正处于积累阶段，60,000美元和67,000美元是关键水平，对任一水平的突破都将决定资产的下一个方向。当前围绕67,000美元的博弈，也反映出短期持有者盈亏平衡点附近的心理压力。近期价格在利好新闻后迅速回落，表明市场叙事尚未转化为持续的资本流入，能否构建更稳固的上涨基础仍有待观察。

cryptonews.ru42分钟前

cryptonews.ru42分钟前

下周必关注｜CLARITY法案有望迎来参议院表决；SpaceX、Circle公布财报（8.3-8.9）

本周（8月3日至8月9日）有多项重要事件值得关注。其中，美国参议院或将对CLARITY法案进行全院表决，该法案旨在为加密行业建立联邦监管框架，谈判需在8月7日前争取足够票数支持。SpaceX和Circle将分别于8月4日和5日公布第二季度财报。SpaceX在发布财报后，其股票将于8月6日迎来首次大规模解锁，比例最高可达总股本的12%。美国7月非农就业报告也将于8月7日公布，市场预期将有所改善。其他事件方面，特朗普家族关联矿企American Bitcoin将于8月3日发布财报；DeFi追踪器Zapper和钱包Ctrl Wallet将于同日停止运营；LayerZero将弃用v1中继器；韩国交易所Upbit将下架AQT和AERGO代币。比特币矿企Hut 8也将于8月4日公布业绩。此外，马斯克宣布Grok 4.6预计于8月7日左右发布，BIP-110强制信号发送将于8月8日前后开始。

marsbit1小时前

下周必关注｜CLARITY法案有望迎来参议院表决；SpaceX、Circle公布财报（8.3-8.9）

marsbit1小时前

股票跌得比加密货币还狠，钱去了哪？

7月底，韩国Kospi指数罕见连续两天触发熔断，全球半导体股集体暴跌。SK海力士业绩虽创纪录但不及预期，股价重挫，其两倍做多杠杆ETF市值更蒸发超万亿港元。与此同时，比特币却从低点反弹约15%，呈现“股票跌出币圈样，比特币装死躺赢”的反常局面。此次暴跌并非全市场恐慌，而是对前期最拥挤交易（如AI半导体）的精准去杠杆。催化剂包括不及预期的财报、中国存储芯片扩产带来的竞争压力，以及日元套息交易平仓带来的流动性压力。分析认为，产业逻辑未死，死的是过高的杠杆。那么，从股市流出的资金是否流入了比特币？答案是否定的。比特币的相对抗跌，是因为它在5月至6月已提前经历大幅调整，美国现货比特币ETF曾出现历史性资金外流。真正的避险资金流向了黄金。数据显示，比特币与黄金的相关性已降至极低水平，“数字黄金”叙事在此次危机中暂时失效。机构将两者视为不同资产：黄金用于避险，比特币用于博弈高波动回报。资金未来的流向取决于三个条件：全球流动性压力缓解、美联储在不引发衰退的前提下降息，以及美国CLARITY加密法案的最终落地。当前，比特币与纳斯达克指数的走势正在脱钩，其价格更依赖全球流动性而非单一科技股盈利。这种低相关性可能使其在未来成为机构资产配置中分散风险的选择。尽管当前并非避风港，但比特币已提前出清，为未来资本重新配置占据了有利位置。

marsbit1小时前

marsbit1小时前

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

桥水基金创始人瑞·达利欧在访谈中指出，当前AI热潮已显现经典泡沫特征，高估值与过度借贷可能在未来经济变故下引发资产抛售与衰退。他强调，这背后是更宏大的“大周期”在起作用，即贫富差距、政府债务高企及地缘政治变动共同驱动的约80年循环，目前全球秩序正处力量交替的衰退阶段。为应对不确定性，达利欧建议个人投资者进行多元化资产配置，包括股票、黄金、债券等，而非仅持有现金。他透露自己投资组合中约有1%为比特币，认为其具备硬通货特性，但个人更偏好实物黄金。对于AI的影响，他认为这将在更高层面替代人类思维，加剧贫富差距，而善于运用人类情感、直觉并与AI协作的人将更具优势。谈及英美热议的“财富税”，达利欧认为操作困难，可能引发资本外流或刺破泡沫。关于世界秩序，他预判未来可能走向区域化发展，而非单一主导。最后，他指出美国卷入伊朗冲突暴露了其军事与经济影响力的脆弱性，类似历史上大英帝国的衰落征兆。

marsbit5小时前

marsbit5小时前

交易

现货

AI PC来了，本地硬刚120B大模型！英伟达用RTX Spark重新定义“个人AI电脑”底座

文章摘要

当GPU成为PC的主角

120B模型跑在本地,够用了吗

给AI代理加一道安全笼

Adobe为什么愿意“从底层重构”

纸面参数之外

热门币种推荐

相关问答

你可能也喜欢

迈克尔·塞勒："我们从未说过永远不会出售比特币"

《夏季拉锯战》仍在继续：突破67000美元将是比特币上涨的起点

下周必关注｜CLARITY法案有望迎来参议院表决；SpaceX、Circle公布财报（8.3-8.9）

股票跌得比加密货币还狠，钱去了哪？

对话达利欧：当下正处AI泡沫中，投资组合的1%是比特币

交易

热门文章

火币成长学院：AI与Crypto深度研报：算法与账本的共生时代

从H2A到A2A：AI Agent经济体与Crypto新机遇

美股TradFi：传统金融在AI IPO浪潮下的稳健锚点

相关讨论

热门问答

热门分类

热门标签