В июне 2026 года на конференции AI DevDay в Сан-Франциско AMD подтвердила планы по отгрузке нового устройства. Эта машина размером примерно с Apple Mac mini, оснащена 128 ГБ унифицированной памяти и официально позиционируется как платформа для локальной разработки ИИ. Всего несколькими месяцами ранее NVIDIA DGX Spark уже появилась на столах разработчиков — такой же металлический корпус размером с ладонь, те же 128 ГБ унифицированной памяти, с аналогичными заявлениями о возможности локального запуска больших моделей с 200 миллиардами параметров.
Платформа для разработчиков AMD Ryzen AI Halo на базе процессора Ryzen AI Max+ 395
Tom's Hardware на основе тестирования HP Z2 Mini G1a привела ориентировочную цену для лагеря AMD: от $2,949 до $3,999. На сайте NVIDIA указана стартовая цена DGX Spark — $3,999, а некоторые OEM-версии в феврале 2026 года обсуждались по цене до $4,679. В цене AMD выигрывает, но это лишь поверхностная разница.
Одинаковые 128 ГБ, два разных пути
В основе AMD Ryzen AI Halo лежит процессор Ryzen AI Max+ 395: 16 ядер Zen 5, 40 вычислительных блоков GPU архитектуры RDNA 3.5, а также NPU XDNA 2 с производительностью 50 TOPS. Официальная документация NVIDIA описывает DGX Spark иначе: суперчип GB10 Grace Blackwell, 20-ядерный ARM CPU в паре с GPU архитектуры Blackwell, без NPU, но с установленной сетевой картой ConnectX-7 200 Гбит/с. Устройство AMD оснащено сетевым портом 2.5 GbE и Wi-Fi 7; у NVIDIA — 10 GbE и Wi-Fi 7 плюс дорогая высокоскоростная сетевая карта.
Спецификации памяти на первый взгляд схожи. Оба устройства используют 128 ГБ LPDDR5x. На странице продукта AMD указана пропускная способность памяти 256 ГБ/с, NVIDIA дает цифру 273 ГБ/с. Разница менее 7%, что в большинстве задач вывода почти незаметно.
Выбор операционной системы раскрывает более фундаментальное различие подходов двух компаний. AMD Ryzen AI Halo поставляется с предустановленной Windows 11 Pro, доступна опция Ubuntu 24.04. При включении вы попадаете на стандартный рабочий стол ПК, есть порты Thunderbolt, полная поддержка периферии. DGX Spark работает под управлением DGX OS — кастомной версии на базе Ubuntu, где первым делом после загрузки настраивается окружение CUDA и инструменты контейнеризации NVIDIA.
The Register в декабре 2025 года провел подробное сравнительное тестирование. Вывод: при выводе больших языковых моделей одиночным пакетом скорость генерации токенов на обеих машинах была очень близка. Но на этапе обработки промпта DGX Spark оказывалась быстрее в 2–3 раза. Это преимущество обеспечивается поддержкой низкоточных вычислений в архитектуре Blackwell и многолетними оптимизациями NVIDIA в конвейере вывода. В обзоре ServeTheHome указано на другое измерение: сетевая карта ConnectX-7 для DGX Spark отдельно стоит более $900, и ее потенциальная ценность в сценариях кластеризации выходит далеко за рамки однопользовательского вывода.
По данным тестов Tom's Hardware и других изданий, размеры Ryzen AI Halo составляют 85 мм в высоту, 168 мм в ширину и 200 мм в глубину, вес — 2,3 кг, что больше напоминает габариты традиционной мини-рабочей станции. Официальная документация NVIDIA указывает размеры DGX Spark: 150 мм в квадрате, толщина 50,5 мм, вес 1,2 кг. Одно похоже на стопку жестких дисков, другое — на роутер.
Прогресс ROCm: больше не просто «лишь бы работало»
Согласно официальному релизу AMD, ROCm 7.2 вышел в январе 2026 года, а последующая версия 7.2.4 специально оптимизировала стабильность и производительность для рабочих нагрузок вывода ИИ. Phoronix подробно осветил релиз в тот же день.
Для разработчиков в среде Linux процесс установки ROCm сейчас значительно упростился по сравнению с двумя годами назад. В марте 2026 года технический блогер Кунал Ганглани в своем подробном руководстве по использованию ROCm написал, что на RX 7900 XTX ему потребовалось около 30 минут, чтобы пройти путь от настройки системы до запуска модели PyTorch, «тогда как в 2024 году на то же самое ушло бы полдня». Его блог подтверждает, что ROCm теперь поддерживает четыре основных фреймворка глубокого обучения: PyTorch, TensorFlow, JAX, DGL, а также доступны версии для бэкенда ROCm в движках вывода, таких как vLLM, Ollama, llama.cpp.
Но этот прогресс не может преодолеть инерцию CUDA. Программный стек NVIDIA накапливался 17 лет; количество вопросов и ответов по CUDA на Stack Overflow в десятки раз больше, чем по ROCm. Новые версии передовых библиотек, таких как FlashAttention или xFormers, обычно выходят сначала для CUDA, а портированные версии для ROCm приходится ждать от нескольких недель до месяцев. Любое пользовательское ядро CUDA, выходящее за рамки стандартного API PyTorch, на платформе AMD требует ручной адаптации. Официальная матрица совместимости AMD перечисляет прошедшие проверку комбинации фреймворков и GPU, но «прошло проверку» и «в случае проблем можно найти достаточно обсуждений в сообществе» — это разные вещи.
На Reddit в разделе r/LocalLLaMA обсуждения о выборе устройства не прекращаются с конца 2025 года. Чаще всего цитируется итог из блога Ганглани: «Если вам нужно, чтобы все работало идеально с первого дня, покупайте NVIDIA. Если вы готовы потратить полдня на решение проблем, чтобы сэкономить $800, ROCm уже готов».
AMD, кажется, четко это осознает. Прошлый год компания действовала не по принципу прямого копирования «рва» NVIDIA, а по принципу строительства альтернативы рядом с ним.
В августе 2024 года AMD объявила о приобретении ZT Systems за $49 млрд. The Wall Street Journal в марте 2025 года подтвердил завершение сделки. Бизнес ZT Systems заключается в проектировании и сборке стоечных систем серверов ИИ для клиентов гипермасштабных дата-центров, включая таких гигантов, как Microsoft и Meta, ежегодно закупающих десятки тысяч GPU. AMD получила компетенции в проектировании систем — от отдельного GPU до целых стоек.
Но вскоре AMD приняла, казалось бы, противоречивое решение. Согласно официальному объявлению Sanmina в мае 2025 года, AMD передала производственные мощности ZT Systems для дата-центров этой компании-производителю электроники, оставив за собой только команду разработчиков. Логика ясна: AMD не хотела становиться конкурентом собственным OEM-клиентам. Если бы AMD сама производила серверы ИИ, производители серверов, продающие видеокарты AMD, сразу бы насторожились. Сохранив компетенции в разработке и отдав производство на аутсорсинг, компания сбалансировала усиление возможностей и экосистемные отношения.
Еще два ключевых события произошли в последующие полгода.
В октябре 2025 года пресс-релиз AMD объявил о стратегическом партнерстве с OpenAI по развертыванию 6 ГВт GPU AMD Instinct. Первая партия мощностью 1 ГВт должна была быть отгружена во второй половине 2026 года. В соглашении был скрыт пункт: OpenAI получила опцион на покупку до 10% акций AMD. Reuters и CNBC в своих репортажах того дня подчеркивали эту деталь. Для OpenAI будут поставляться GPU Instinct следующего поколения, конкретная модель не раскрывается.
В феврале 2026 года AMD снова выпустила пресс-релиз, объявив о расширении сотрудничества с Meta, также на 6 ГВт GPU. На этот раз речь шла о кастомизированном варианте MI450 для Meta, отгрузка должна начаться во второй половине 2026 года. В репортаже CNBC того дня была отмечена деталь: всего за несколько дней до объявления о сотрудничестве Meta также объявила о расширенном соглашении о закупке чипов ИИ с NVIDIA.
Тот факт, что Meta одновременно подписала долгосрочные контракты с обеими компаниями, говорит сам за себя больше, чем любое техническое сравнение. Для предприятий, ежегодно инвестирующих десятки миллиардов долларов в инфраструктуру ИИ, держать все яйца в одной корзине — неприемлемый риск. AMD не нужно превосходить NVIDIA по всем параметрам, достаточно предоставить работающую альтернативу, чтобы получить заказы по логике «двух поставщиков». Масштаб двух контрактов на 6 ГВт намекает, что по крайней мере OpenAI и Meta уже включили AMD в свои планы.
Ответ NVIDIA в тот же период — комбинированный удар
В тот же период NVIDIA на корпоративном рынке действовала комбинацией. DGX Spark позиционируется как настольное устройство для разработчиков, но его сетевая карта ConnectX-7 указывает, что это не изолированная рабочая станция. В обзоре ServeTheHome подробно анализируется ценность этой карты для прототипирования и отладки распределенного обучения, и вывод таков: хотя она значительно медленнее, чем NVLink уровня дата-центра, для сценариев с небольшими кластерами ее достаточно. Этот дизайн привязывает DGX Spark к более крупной продуктовой линейке NVIDIA: разработчики создают прототипы на Spark, затем переносят код на DGX Station или облачные инстансы DGX, и наконец развертывают на серверных кластерах с H200 или B200. Цепочка инструментов от рабочего стола до дата-центра, с единым программно-аппаратным стеком, привязана к CUDA.
В тот же период NVIDIA также представила подписочный пакет программного обеспечения AI Enterprise, включающий TensorRT, RAPIDS, Triton Inference Server и другие инструменты, с оплатой за узел. На официальной странице продукта NVIDIA перечислен полный список инструментов, входящих в AI Enterprise. Это не продажа железа, а превращение корпоративного развертывания и эксплуатации в постоянный бизнес после того, как разработчики привыкли к CUDA.
Сравнив два пути, различия становятся вполне очевидными.
NVIDIA создает замкнутый стек — от чипа до системы, от ПО до облачных сервисов. Разработчики с первого дня попадают в эту экосистему с оптимизированными инструментами, но платой за это является привязка к одному вендору. AMD следует путем открытой альтернативы: использует отраслевой стандарт x86, поддерживает двойную систему Windows/Linux, развивает ROCm как открытый стек, совместимый с основными фреймворками, и предлагает более низкую цену, чтобы привлечь клиентов, чувствительных к стоимости или решивших диверсифицировать риски поставщиков.
Сам продукт Ryzen AI Halo — это наиболее лаконичное аппаратное выражение этого пути. В нем нет кастомной сетевой карты, специализированной ОС, блоков ускорения низкоточного обучения. Это универсальный ПК, в который просто втиснули унифицированную память, способную запускать модели на 200 млрд параметров, и достаточно производительный GPU. На нем можно запускать вывод больших моделей, а можно закрыть терминал и открыть Photoshop. Цена в $2,949 для HP Z2 Mini G1a, упомянутая в Tom's Hardware, значительно ниже стартовой цены DGX Spark в $3,999; с другими OEM-версиями разница может превышать $1,000.
Но обратная сторона такой гибкости — компромиссы. Данные тестов The Register уже показывают: как только вы выходите за рамки однопользовательского вывода и переходите к сценариям, требующим массовых параллельных вычислений, преимущества архитектуры Blackwell в низкоточной арифметике и многолетние оптимизации ПО быстро создают разрыв. Если вам нужен настольный бокс для генерации изображений Stable Diffusion, в экосистеме CUDA NVIDIA есть целый набор инструментов «установил и работай». Архитектура RDNA 3.5 от AMD не поддерживает форматы низкой точности FP4 и FP8, что ставит ее в невыгодное положение в рабочих нагрузках, подобных генерации изображений; это ограничение самой архитектуры RDNA, которое нельзя исправить обновлением драйверов.
Судьба коробки — не в самой коробке
Вернувшись к временной шкале, действия AMD за последний год выстраиваются в достаточно четкую линию.
На аппаратном уровне: запущены в производство Instinct MI300 и MI325X, MI350 и MI450 развиваются по дорожной карте, Ryzen AI Max+ 395 из чипа для ноутбуков превратился в APU для десктопов и попал в платформу для разработчиков. На системном уровне: приобретение ZT Systems дало компетенции в проектировании стоечных систем, затем производство было выделено, а разработка сохранена. На уровне клиентов: два долгосрочных контракта на уровне 6 ГВт привязали двух крупнейших в мире потребителей вычислительных мощностей для ИИ, заодно привлекая OpenAI в число акционеров. На программном уровне: ROCm итеративно обновляется примерно раз в квартал, догоняя поддержку основных фреймворков, но портирование передовых библиотек и накопление сообщества все еще требуют времени.
Ни один шаг не является изолированным. Приобретение ZT Systems нужно, чтобы иметь возможность проектировать те гипермасштабные кластеры ИИ, которые требуются OpenAI и Meta, а не просто продавать GPU производителям серверов. Быстрая итерация ROCm нужна, чтобы у клиентов, подписавших контракты на 6 ГВт, при развертывании был доступный программный стек, а не поставка «голого железа». Выпуск Ryzen AI Halo нужен, чтобы расширить ту же экосистему ROCm до настольного сегмента, позволив разработчикам отлаживать модели локально на машине за $3,000, а затем развертывать их в облачных кластерах на MI450.
Но это не означает, что AMD уже догнала NVIDIA. Два контракта на 6 ГВт — это планы будущих развертываний; измеряемая в гигаваттах энергоемкость отражает масштаб инфраструктурного планирования, а не количество уже отгруженных чипов. Конкретные спецификации MI450 до сих пор не раскрыты, реальная производительность чипа, выход годных, стабильность при массовом развертывании — все это неизвестные величины. ROCm достиг состояния «работает» на основных фреймворках, но состояние «в случае проблем сообщество поможет» потребует еще больше времени. А 17-летний задел CUDA невозможно преодолеть за несколько кварталов быстрых итераций.
«Ров» NVIDIA также не ограничивается только программным обеспечением. Сетевая карта ConnectX-7 в DGX Spark указывает на другое измерение конкуренции: пока AMD борется за разработчиков ценой и открытостью, NVIDIA с помощью возможностей кластерного масштабирования захватывает команды, которым нужны распределенное обучение и крупные конвейеры вывода. Купить один DGX Spark — $3,999; купить два, соединить кабелем — и можно запускать распределенный прототип. В этом сценарии преимущество ROCm в однопользовательском выводе нивелируется.
Когда разногласия двух компаний в области ИИ материализуются в этой коробке размером с ладонь, это превращается в конкретный выбор. Вы открываете коробку AMD и получаете знакомую среду ПК, почти теми же командами устанавливаете PyTorch, загружаете модель, начинаете вывод — все гладко, пока вам не понадобится библиотека с бэкендом только для CUDA. Вы открываете коробку NVIDIA и получаете специализированное окружение, оптимизированное от железа до драйверов и инструментов контейнеризации, где после запуска все работает так, как и ожидалось, только в счете на тысячу долларов больше, а стоимость миграции на другого поставщика в будущем уже предопределена.
AMD не бросает прямой вызов империи полного стека NVIDIA. Она выбрала более прагматичный путь: стать достаточно рабочей альтернативой в моменты, когда цены NVIDIA и возможности поставок не успевают за спросом всех клиентов. Два контракта на 6 ГВт — самое убедительное на сегодня доказательство этой стратегии. Ryzen AI Halo — это ее продолжение на настольном фронте, не подражание идее миниатюрного ИИ-бокса, а шаг вперед по линии «привлечь открытой экосистемой и ценовым преимуществом разработчиков, которые не хотят быть привязанными к одному вендору».






