AMD发布小型AI主机,直指英伟达DGX Spark

marsbit發佈於 2026-06-16更新於 2026-06-16

文章摘要

2026年6月,AMD发布了一款与苹果Mac mini大小相仿的AI开发主机Ryzen AI Halo,搭载128GB统一内存,定价2949至3999美元,直接对标英伟达此前推出的类似设备DGX Spark(起价3999美元)。两者虽内存规格相近,但技术路线迥异:AMD采用集成CPU、GPU和NPU的x86处理器,预装Windows或Ubuntu,强调通用性与开放性;英伟达则使用ARM CPU加Blackwell GPU的定制方案,配备高速网卡,运行专用DGX OS,强化集群扩展与CUDA生态集成。实测显示,在单批次推理中两者性能接近,但在复杂任务处理及分布式场景下,英伟达凭借软硬件深度优化仍保持优势。 近期,AMD通过收购获取系统设计能力、与OpenAI和Meta签订大额GPU供货协议,并持续迭代ROCm软件栈,展现出以开放生态和成本优势切入市场的策略。而英伟达则巩固其从桌面到数据中心的全栈闭环,通过软硬件绑定锁定开发者。Ryzen AI Halo的推出,是AMD将这一战略延伸至桌面端,为追求性价比、希望避免供应商锁定的开发者提供一个替代选择,而非试图在性能上全面超越。当前竞争格局表明,AMD正寻求在英伟达主导的市场中,以“可用替代选项”的角色争夺份额。

2026年6月,AMD在旧金山AI DevDay上确认了一款新设备的发货计划。这台机器和苹果Mac mini差不多大,搭载128GB统一内存,官方定位是本地AI开发平台。就在几个月前,英伟达的DGX Spark已经出现在开发者的桌面上,同样是巴掌大的金属盒子,同样是128GB统一内存,同样宣称能在本地运行2000亿参数的大模型。

AMD Ryzen AI Halo 开发者平台,搭载 Ryzen AI Max+ 395 处理器

Tom's Hardware基于HP Z2 Mini G1a的实测报道给出了AMD阵营的参考定价:$2,949到$3,999。英伟达官网显示DGX Spark起价$3,999,部分OEM版本在2026年2月有过涨至$4,679的讨论。价格上AMD压了一头,但这只是表面账。

同样的128GB,两条不同的路线

AMD Ryzen AI Halo的核心是一颗Ryzen AI Max+ 395处理器,16个Zen 5核心,40个RDNA 3.5架构的GPU计算单元,旁边还挂着一颗50 TOPS算力的XDNA 2 NPU。NVIDIA官方硬件文档对DGX Spark的描述是另一套逻辑:GB10 Grace Blackwell Superchip,20核ARM CPU搭配Blackwell架构GPU,没有NPU,但塞进了一张ConnectX-7 200Gbps网卡。AMD设备提供2.5GbE网口和WiFi 7;英伟达这边是10GbE加WiFi 7,外加那张价值不菲的高速网卡。

内存规格表面接近。两边都是128GB LPDDR5x。AMD的产品页面标注内存带宽为256 GB/s,NVIDIA官方给出的数字是273 GB/s。差距不到7%,在大多数推理任务中几乎感知不到。

操作系统选择暴露了两家更根本的分歧。AMD Ryzen AI Halo预装Windows 11 Pro,可选Ubuntu 24.04。开机进入的是标准PC桌面,有Thunderbolt接口,有完整的通用外设支持。DGX Spark跑的是DGX OS,基于Ubuntu定制,开机后第一件事是配置CUDA环境和NVIDIA容器工具链。

The Register在2025年12月做了一次详细的实测对比。结论是:单批次大语言模型推理时,两台机器的token生成速度非常接近。但在prompt处理阶段,DGX Spark快出2到3倍。这个差距来自Blackwell架构对低精度计算的支持,以及NVIDIA在推理管线上的数年代码路径优化。ServeTheHome的评测则指出了另一个维度:DGX Spark的ConnectX-7网卡单独零售价超过$900,它在多机集群场景中的潜在价值远超出单机推理的范畴。

据Tom's Hardware等媒体实测,Ryzen AI Halo的尺寸为85mm高、168mm宽、200mm深,重2.3公斤,更接近传统迷你工作站的体格。NVIDIA官方文档显示DGX Spark是150mm见方、50.5mm厚,重1.2公斤。一个像堆叠的硬盘盒,一个像路由器。

ROCm的进度条,不再只是“能用就行”

AMD官方发布说明显示,ROCm 7.2于2026年1月上线,随后的7.2.4版本专门优化了AI推理工作负载的稳定性和性能。Phoronix在发布当天做了详细报道。

对Linux环境下的开发者,ROCm现在的安装流程已经比两年前简化了很多。2026年3月,技术博客作者Kunal Ganglani在一篇详细的ROCm使用指南中写道,他在RX 7900 XTX上完成从系统配置到运行PyTorch模型的全过程只花了约30分钟,“而在2024年,干同样的事需要折腾半天”。他的博客确认ROCm目前已支持PyTorch、TensorFlow、JAX、DGL四个主流深度学习框架,vLLM、Ollama、llama.cpp等推理引擎均有ROCm后端可用。

但这些进展挡不住CUDA的惯性。英伟达的软件栈积累了17年,Stack Overflow上的CUDA相关问答数量是ROCm的几十倍。FlashAttention、xFormers等前沿库的新版本通常先出CUDA版,ROCm移植版要等数周到数月。任何超出PyTorch标准API范围的自定义CUDA内核,在AMD平台上都需要手动适配。AMD官方兼容性矩阵列出了已验证通过的框架和GPU组合,但“通过验证”和“出问题时有足够多的社区讨论帖能搜到”是两码事。

Reddit的r/LocalLLaMA板块上,关于该选哪台设备的讨论帖从2025年底就没断过。最常被引用的一条总结来自Ganglani那篇博客的结尾:“如果你需要一切在第一天就完美运行,买NVIDIA。如果你愿意花一个下午解决问题来省$800,ROCm已经准备好了。”

AMD似乎很清楚这一点。过去一年,这家公司的动作不是在正面复制英伟达的护城河,而是在护城河外另起炉灶。

2024年8月,AMD宣布以$49亿收购ZT Systems。华尔街日报在2025年3月确认交易完成。ZT Systems的业务是帮超大规模数据中心客户设计和组装整机架级别的AI服务器系统,客户包括微软、Meta这类每年采购数万张GPU的巨头。AMD拿到的是从单颗GPU到整机架的系统设计能力。

但AMD很快做了一个看似矛盾的决定。2025年5月,据Sanmina官方公告,AMD将ZT Systems的数据中心制造业务剥离给了这家电子制造服务商,自己只保留设计团队。逻辑很清楚:AMD不想变成自己OEM客户的竞争对手。如果AMD自己生产AI服务器,那些卖AMD显卡的服务器厂商会立刻警觉。保留设计能力、外包制造,这手操作平衡了能力进补和生态关系。

更关键的两件事发生在随后半年。

2025年10月,AMD官方新闻稿宣布与OpenAI达成战略合作,部署6GW的AMD Instinct GPU。首批1GW定于2026年下半年出货。这份协议里藏了一个条款:OpenAI可选择购买AMD最多10%的股份。Reuters和CNBC在当天的报道中都强调了这个细节。为OpenAI供货的将是下一代Instinct GPU,AMD未公开具体型号。

2026年2月,AMD再次发布官方新闻稿,宣布与Meta的扩展合作,同样部署6GW GPU。这次的芯片是Meta定制的MI450变体,计划2026年下半年开始出货。CNBC当天的报道点出了一个细节:就在这笔合作公开前几天,Meta也宣布了与英伟达的扩展AI芯片采购协议。

Meta同时签下两家的长期订单,这件事本身比任何技术对比都更有说服力。对于每年在AI基础设施上投入数百亿美元的企业,把鸡蛋放在一个篮子里是不可接受的风险。AMD不需要性能全面超越英伟达,只需要在英伟达之外提供一个可用的选项,就能在“双供应商”的逻辑下切到订单。两个6GW合约的规模暗示,至少OpenAI和Meta已经把AMD列入了这张单子。

英伟达同期的应对,是一套组合拳

同一个时段,英伟达在企业级市场打的是组合拳。DGX Spark定位为开发者桌面设备,但它的ConnectX-7网卡决定了它不是孤立的工作站。ServeTheHome的评测详细分析了这张网卡在原型验证和分布式训练调试中的价值,结论是虽然比数据中心级的NVLink慢很多,但对于小规模集群场景已经够用。这个设计把DGX Spark锚定在了英伟达更大的企业产品线中:开发者用Spark做原型,然后把代码迁移到DGX Station或云端DGX实例,最后部署到搭载H200或B200的服务器集群。一条从桌面到数据中心、软硬件一致的工具链被焊死在CUDA上。

英伟达同期还推出了AI Enterprise软件订阅套件,把TensorRT、RAPIDS、Triton推理服务器等工具打包,按节点收费。NVIDIA官方产品页列出了AI Enterprise包含的完整工具清单。这不是卖硬件,是在开发者习惯CUDA之后,把企业级部署和运维也变成持续付费的生意。

对比一下两边的路径,分歧已经足够清晰。

英伟达做的是一个从芯片到系统到软件到云服务的全栈闭环。开发者进入这个闭环的第一天就可以用上优化好的工具,代价是被绑定在一个供应商的生态里。AMD走的是一条开放替代路线:用行业标准的x86架构,支持Windows和Linux双系统,把ROCm做成兼容主流框架的开源栈,用更低的价格争取那些对成本敏感或已经决定分散供应商风险的客户。

Ryzen AI Halo这个产品本身是这条路线最简洁的硬件表达。它没有定制网卡,没有专用OS,没有低精度训练加速单元。它是一台通用PC,恰好塞进了一块能跑200B参数模型的统一内存和一套还算过得去的GPU。你可以用它跑大模型推理,也可以关掉终端去开Photoshop。Tom's Hardware在报道中引用的HP Z2 Mini G1a $2,949的价格,远低于DGX Spark $3,999的起步价,如果换成其他OEM版本,价差可能拉到$1,000以上。

但这种灵活性的背面是妥协。The Register的实测数据已经说明,一旦离开单批次推理进入需要大量并行计算的场景,Blackwell架构的低精度优势和数年优化的软件栈会迅速拉开差距。如果你需要一个能跑Stable Diffusion出图的桌面盒子,NVIDIA的CUDA生态里有一整套即装即用的工具。AMD的RDNA 3.5架构不支持FP4和FP8低精度格式,在图像生成这类工作负载上性能吃亏,这是RDNA架构设计决定的,不是驱动更新能解决的。

盒子的归宿,不在盒子里

把时间线收回来,AMD近一年的动作构成一条相当清晰的路线。

硬件层面,Instinct MI300和MI325X量产,MI350和MI450按路线图推进,Ryzen AI Max+ 395从笔记本芯片变成桌面APU塞进开发平台。系统层面,通过收购ZT Systems拿到机架级设计能力,然后剥离制造保留研发。客户层面,用两份6GW级别的长期合约绑定全球最大的两个AI算力消费者,顺便把OpenAI拉进股东名单。软件层面,ROCm以大概每季度一个版本的速度迭代,追上主流框架支持,但前沿库的移植和社区积累还需要时间。

每一步都不是孤立的。收购ZT Systems是为了有能力设计OpenAI和Meta需要的那种超大规模AI集群,而不是只卖GPU给服务器厂商。ROCm的快速迭代是为了让签下6GW合约的客户在部署时有可用的软件栈,而不是裸机交付。Ryzen AI Halo的推出是为了把同一个ROCm生态延伸到桌面端,让开发者可以用一台$3,000的机器做本地调试,再把模型部署到云端MI450集群上。

但这不代表AMD已经追上了英伟达。两份6GW合约是未来的部署承诺,以吉瓦计算的能源容量反映的是基础设施规划规模,不是已经出货的芯片数量。MI450的具体规格至今没有公开,芯片的实际性能、良率、大规模部署后的稳定性都是未知数。ROCm在主流框架上做到了“能用”,但“出问题时社区能帮到你”这个状态还需要更长时间积累。而CUDA的17年积累不是靠几个季度快速迭代就能消化的。

英伟达的护城河也不只是在软件上。DGX Spark那张ConnectX-7网卡暗示的是另一种竞争维度:当AMD在用性价比和开放性争取开发者时,英伟达在用集群扩展能力锁定那些需要做分布式训练和大型推理管线的团队。买一台DGX Spark是$3,999,买两台加上网线就可以跑分布式原型。这个场景下,ROCm在单机推理上打平的优势就被消解了。

两家公司在AI上的分歧,最终落在这个巴掌大的盒子上时,变成了一个具体的选择题。你打开AMD的盒子,得到一个熟悉的PC环境,用几乎一样的指令装好PyTorch,加载模型,开始推理,过程顺畅,直到你需要用某个只有CUDA后端的库。你打开英伟达的盒子,得到了一个从硬件到驱动到容器工具链都优化好的专用环境,启动后一切都在预期内,只是账单上多了一千多美元,而且今后换供应商的迁移成本已经被提前锁定了。

AMD没有正面挑战英伟达的全栈帝国。它选择了一条更务实的路:在英伟达的定价和供应链交付能力跟不上所有客户需求时,做一个够用的替代选项。两个6GW合约是这个策略到目前为止最有力的证据。Ryzen AI Halo是这个策略在桌面端的延伸,不是跟风做小型AI盒子,而是沿着“用开放生态和成本优势争取不想被锁定的开发者”这条线往前走了一步。

相關問答

Q根据文章内容,AMD Ryzen AI Halo 与 NVIDIA DGX Spark 这两款小型AI主机的官方定价分别是多少?

A根据文章,AMD Ryzen AI Halo 的参考定价为 $2,949 到 $3,999(基于HP Z2 Mini G1a的实测报道)。NVIDIA DGX Spark 的官网起价为 $3,999,部分OEM版本在2026年2月有过涨至 $4,679 的讨论。

Q文章指出AMD Ryzen AI Halo 和 NVIDIA DGX Spark 在操作系统选择上暴露了哪些根本分歧?

A文章指出,AMD Ryzen AI Halo 预装 Windows 11 Pro,可选 Ubuntu 24.04,开机进入标准PC桌面。而 NVIDIA DGX Spark 运行的是基于Ubuntu定制的 DGX OS,开机后首要任务是配置CUDA环境和NVIDIA容器工具链。这体现了AMD追求通用PC环境与英伟达打造专用优化闭环的不同路线。

QAMD在近一年中为构建其AI生态采取了哪些关键的战略行动?

AAMD近一年的关键战略行动包括:1. 2024年8月宣布收购系统设计公司ZT Systems(2025年3月完成),随后剥离其制造业务以平衡与OEM客户的关系。2. 2025年10月与OpenAI达成战略合作,部署6GW的Instinct GPU,协议中包含OpenAI可购买AMD最多10%股份的条款。3. 2026年2月宣布与Meta达成扩展合作,同样部署6GW的GPU(MI450定制变体)。这些行动旨在获取系统设计能力、绑定关键大客户,并分散供应链风险。

Q根据The Register和ServeTheHome的评测,DGX Spark的ConnectX-7网卡带来了哪些AMD设备不具备的优势?

ADGX Spark的ConnectX-7网卡(单独零售价超过$900)带来了两大优势:1. 在多机集群场景中具有重要价值,方便进行原型验证和分布式训练调试。2. 这使得DGX Spark能够被锚定在英伟达更大的企业产品线中,形成从桌面(Spark)到数据中心(DGX Station/云端实例/服务器集群)的、软硬件一致的工具链,而AMD设备不具备这种集群扩展和生态锁定能力。

Q文章如何总结AMD与英伟达在AI领域竞争的核心策略分歧?

A文章总结的核心策略分歧是:英伟达致力于构建一个从芯片、系统、软件到云服务的全栈闭环生态,用优化好的工具绑定开发者,但供应商锁定度高。AMD则走一条开放替代路线,基于行业标准的x86架构,支持主流操作系统,推动开源ROCm软件栈,并利用价格优势和“双供应商”策略,争取对成本敏感或希望分散供应链风险的客户,而不追求在性能或生态完整性上全面超越英伟达。

你可能也喜歡

USDe 绕开 GENIUS Act 收益禁令:合成美元如何成为加密最成功的灰色地带?

本文探讨了Ethena发行的合成美元稳定币USDe如何巧妙避开美国《GENIUS Act》中关于禁止支付型稳定币向持有人支付收益的规定。 USDe的核心机制并非持有法币或国债储备,而是通过收取加密抵押品并同时开设对冲的永续期货空头仓位,来维持美元价值稳定并赚取收益。持有人通过质押USDe获得sUSDe即可分享这部分收益。由于其本质是对冲衍生品交易策略而非传统储备模型,USDe不符合《GENIUS Act》对“支付型稳定币”的法定定义,从而置身于该法案的监管范围之外。 USDe曾一度成为市值第三大的美元计价加密资产,其收益来源于衍生品市场的资金费率与基差利差。这种设计使其在法律上区别于由发行人支付利息的传统稳定币。Ethena同时运营着完全合规、不支付收益的稳定币USDtb,突显了监管现状下的双重路径。 监管态度呈现分歧:德国BaFin将其视为未注册证券并禁止销售,而美国大型资产管理公司Janus Henderson则已与Ethena合作,将USDe用于现金管理。文章指出,USDe的成功反映了市场对收益型美元产品的真实需求,但其与USDC等储备型稳定币存在本质不同——前者依赖衍生品策略,后者依赖法币储备,风险特征迥异。 文章最终提出核心问题:监管机构是否会为“合成美元”这一类新兴工具专门划定监管边界,还是任由收益型产品持续流向现有法规的灰色地带。

Foresight News10 分鐘前

USDe 绕开 GENIUS Act 收益禁令:合成美元如何成为加密最成功的灰色地带?

Foresight News10 分鐘前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

Lido的机构质押业务新增基础设施支持,专业节点运营商Luganodes已集成Lido V3,并基于该协议新的stVaults原语推出了以太坊质押金库。 该集成面向那些希望在保持与更广泛的stETH生态系统连接的同时,对验证节点风险敞口、风险设置、费用结构和运营要求拥有更多控制权的机构用户。 **摘要要点:** * Luganodes 已集成 Lido V3。 * 该方案使用了 Lido 新的 stVaults 原语。 * 该产品主要面向机构以太坊质押用户。 * 目标是在保留 stETH 流动性优势的同时,提供更灵活的验证节点控制。 **背景与意义:** Lido V3 正朝着模块化质押方向发展。其新的 stVaults 原语旨在为不同用户提供更定制化的质押配置,而非强制所有人使用同一个通用资金池。这对于有特定节点运营商、费用安排、合规框架等需求的资产管理公司、ETP发行商和大型机构而言至关重要。 以太坊质押正成为机构投资组合的一部分,但机构通常需要了解验证节点表现、罚没风险、运营风险等更多细节。模块化的金库设计有助于解决这些问题,同时保持与stETH流动性的连接,从而在定制化质押和流动性访问之间取得平衡。 此次集成表明,以太坊质押生态正逐渐成熟,从早期吸引普通持有者参与,转向构建能够支持更大型、更受监管、操作更复杂的用户的产品。这对于以太坊作为DeFi、资产代币化和机构加密基础设施主要结算层的长期发展具有重要意义,意味着其质押市场正变得更加细分、可配置,并与机构资本更紧密地结合。

bitcoinist22 分鐘前

Lido V3 通过与 Luganodes 的 stVaults 扩展机构以太坊质押

bitcoinist22 分鐘前

渣打银行开出40倍“赌盘”,喊单UNI涨至100美元

渣打银行全球数字资产研究主管Geoff Kendrick近日发布报告,首次覆盖去中心化交易所Uniswap及其治理代币UNI,并给出了一个激进的长期预测:到2030年底,UNI价格有望从当前的约2.6美元飙升至100美元,涨幅近40倍。 报告的核心逻辑基于几条宏观主线:首先,全球链上代币化资产(RWA)规模预计将从目前的约3400亿美元激增至2028年的4万亿美元。其次,流入DeFi生态的代币化资产比例将从目前的约3.5%提升至2030年的30%,推动整体DeFi总锁仓价值(TVL)增长约37倍,达到2.7万亿美元。Uniswap作为核心流动性基础设施,将成为这波资金洪流的最大受益者。 此外,UNI的价值支撑已发生根本转变。自去年底激活“费用开关”并启动代币销毁机制后,UNI从纯粹的治理代币转变为具有通缩属性的生产性资产,能够直接捕获协议费用。报告将Uniswap比作YouTube式的开放平台,其网络效应和低边际成本模式相比Coinbase(Netflix模式)更具长尾优势。贝莱德、富达等传统机构已开始将Uniswap作为合规资产上链的交易接口,进一步巩固了其“链上纽交所”的潜在地位。 然而,报告也指出了UNI面临的挑战:一方面,Solana生态DEX及各类聚合器正在争夺用户流量;另一方面,RWA代币化的全球立法与合规进程若不及预期,将延迟宏大叙事的兑现。目前UNI价格较历史高点下跌超92%,市场对DeFi叙事仍显冷淡。 渣打银行的此次覆盖,标志着传统金融正以新的估值框架审视DeFi资产,关注点从投机转向网络效应与现金流。但通往2030年100美元目标的道路,注定充满不确定性。

marsbit29 分鐘前

渣打银行开出40倍“赌盘”,喊单UNI涨至100美元

marsbit29 分鐘前

交易

現貨
合約
活动图片