Juni 2026, AMD mengonfirmasi rencana pengiriman perangkat baru pada AI DevDay di San Francisco. Mesin ini seukuran Apple Mac mini, dilengkapi dengan memori terpadu 128GB, dan diposisikan secara resmi sebagai platform pengembangan AI lokal. Beberapa bulan sebelumnya, NVIDIA DGX Spark sudah muncul di meja para pengembang, juga kotak logam seukuran telapak tangan, juga dengan memori terpadu 128GB, dan juga mengklaim mampu menjalankan model besar 200 miliar parameter secara lokal.
Platform Pengembang AMD Ryzen AI Halo, dilengkapi prosesor Ryzen AI Max+ 395
Laporan Tom's Hardware berdasarkan pengujian aktual HP Z2 Mini G1a memberikan perkiraan harga referensi dari kubu AMD: $2,949 hingga $3,999. Situs web NVIDIA menunjukkan harga awal DGX Spark adalah $3,999, dengan beberapa versi OEM sempat dibahas naik menjadi $4,679 pada Februari 2026. Dalam hal harga, AMD sedikit unggul, tetapi ini hanya angka permukaan.
128GB yang Sama, Dua Rute yang Berbeda
Inti dari AMD Ryzen AI Halo adalah sebuah prosesor Ryzen AI Max+ 395, dengan 16 inti Zen 5, 40 unit komputasi GPU arsitektur RDNA 3.5, dan disertai sebuah NPU XDNA 2 dengan performa 50 TOPS. Dokumen perangkat keras resmi NVIDIA menggambarkan DGX Spark dengan logika yang berbeda: Superchip Grace Blackwell GB10, CPU ARM 20 inti dipasangkan dengan GPU arsitektur Blackwell, tanpa NPU, tetapi menyelipkan sebuah kartu jaringan ConnectX-7 200Gbps. Perangkat AMD menyediakan port jaringan 2.5GbE dan WiFi 7; NVIDIA menyediakan 10GbE ditambah WiFi 7, serta kartu jaringan berkecepatan tinggi yang mahal itu.
Spesifikasi memori tampak serupa di permukaan. Keduanya menggunakan LPDDR5x 128GB. Halaman produk AMD mencantumkan bandwidth memori sebesar 256 GB/s, sedangkan angka resmi dari NVIDIA adalah 273 GB/s. Perbedaannya kurang dari 7%, hampir tidak terasa dalam sebagian besar tugas inferensi.
Pilihan sistem operasi mengungkap perbedaan yang lebih mendasar di antara kedua perusahaan. AMD Ryzen AI Halo diinstal sebelumnya dengan Windows 11 Pro, opsional Ubuntu 24.04. Saat dinyalakan, pengguna masuk ke desktop PC standar, dengan antarmuka Thunderbolt, dan dukungan penuh untuk periferal umum. DGX Spark menjalankan DGX OS, yang dikustomisasi berdasarkan Ubuntu, dan hal pertama yang dilakukan setelah booting adalah mengonfigurasi lingkungan CUDA dan toolchain kontainer NVIDIA.
The Register melakukan perbandingan pengujian mendetail pada Desember 2025. Kesimpulannya adalah: Kecepatan pembuatan token kedua mesin sangat mirip dalam inferensi model bahasa besar *single-batch*. Namun, pada tahap pemrosesan *prompt*, DGX Spark lebih cepat 2 hingga 3 kali lipat. Perbedaan ini berasal dari dukungan arsitektur Blackwell terhadap komputasi presisi rendah, serta pengoptimalan jalur kode NVIDIA selama bertahun-tahun dalam *pipeline* inferensi. Ulasan ServeTheHome menunjukkan dimensi lain: Kartu jaringan ConnectX-7 DGX Spark dijual terpisah dengan harga lebih dari $900, dan nilai potensialnya dalam skenario *cluster* multi-mesin jauh melampaui ranah inferensi *single-machine*.
Berdasarkan pengujian media seperti Tom's Hardware, dimensi Ryzen AI Halo adalah tinggi 85mm, lebar 168mm, kedalaman 200mm, berat 2.3 kg, lebih mendekati ukuran *mini workstation* tradisional. Dokumen resmi NVIDIA menunjukkan DGX Spark berukuran 150mm persegi, tebal 50.5mm, berat 1.2 kg. Satu mirip kotak hard disk yang ditumpuk, satu lagi mirip router.
Progres ROCm, Bukan Sekadar "Cukup Bisa Dipakai"
Pernyataan rilis resmi AMD menunjukkan ROCm 7.2 dirilis pada Januari 2026, dan versi 7.2.4 berikutnya secara khusus mengoptimalkan stabilitas dan kinerja untuk beban kerja inferensi AI. Phoronix membuat laporan mendetail pada hari peluncurannya.
Bagi pengembang di lingkungan Linux, proses instalasi ROCm sekarang jauh lebih sederhana dibandingkan dua tahun lalu. Pada Maret 2026, penulis blog teknologi Kunal Ganglani menulis dalam panduan penggunaan ROCm mendetail bahwa dia menyelesaikan seluruh proses dari konfigurasi sistem hingga menjalankan model PyTorch pada RX 7900 XTX dalam waktu sekitar 30 menit, "sedangkan pada tahun 2024, melakukan hal yang sama memerlukan waktu setengah hari." Blognya mengonfirmasi ROCm saat ini mendukung empat *framework* pembelajaran mendalam utama: PyTorch, TensorFlow, JAX, DGL, dan *inference engine* seperti vLLM, Ollama, llama.cpp juga memiliki *backend* ROCm yang tersedia.
Namun, kemajuan ini tidak dapat menghentikan inersia CUDA. *Software stack* NVIDIA telah terakumulasi selama 17 tahun, jumlah tanya jawab terkait CUDA di Stack Overflow puluhan kali lipat lebih banyak daripada ROCm. Versi terbaru dari pustaka mutakhir seperti FlashAttention, xFormers biasanya dirilis dalam versi CUDA terlebih dahulu, versi porting ROCm harus menunggu beberapa minggu hingga bulan. Setiap *custom CUDA kernel* yang melampaui lingkup API standar PyTorch, perlu diadaptasi secara manual di platform AMD. Matriks kompatibilitas resmi AMD mencantumkan kombinasi *framework* dan GPU yang telah diverifikasi, tetapi "telah diverifikasi" dan "memiliki cukup banyak posting diskusi komunitas yang dapat dicari saat bermasalah" adalah dua hal yang berbeda.
Di subreddit r/LocalLLaMA, utas diskusi tentang perangkat mana yang harus dipilih tidak pernah berhenti sejak akhir 2025. Ringkasan yang paling sering dikutip berasal dari akhir blog Ganglani: "Jika Anda membutuhkan semuanya berjalan sempurna pada hari pertama, beli NVIDIA. Jika Anda bersedia menghabiskan waktu satu sore untuk memecahkan masalah demi menghemat $800, ROCm sudah siap."
AMD tampaknya sangat menyadari hal ini. Selama setahun terakhir, gerakan perusahaan ini bukanlah meniru secara langsung *moat* NVIDIA, melainkan membangun jalan lain di luar *moat* tersebut.
Agustus 2024, AMD mengumumkan akuisisi ZT Systems senilai $49 miliar. Wall Street Journal pada Maret 2025 mengonfirmasi transaksi telah selesai. Bisnis ZT Systems adalah membantu klien *hyperscale data center* mendesain dan merakit sistem server AI tingkat *rack*, dengan klien termasuk raksasa seperti Microsoft, Meta yang membeli puluhan ribu GPU setiap tahunnya. AMD mendapatkan kemampuan desain sistem dari satu GPU hingga ke seluruh *rack*.
Tapi AMD segera membuat keputusan yang tampak kontradiktif. Mei 2025, berdasarkan pengumuman resmi Sanmina, AMD memisahkan bisnis manufaktur *data center* ZT Systems kepada penyedia layanan manufaktur elektronik ini, dan hanya mempertahankan tim desain. Logikanya jelas: AMD tidak ingin menjadi pesaing bagi klien OEM-nya sendiri. Jika AMD memproduksi server AI sendiri, vendor server yang menjual kartu grafis AMD akan segera waspada. Mempertahankan kemampuan desain, mengalihdayakan manufaktur, langkah ini menyeimbangkan penguatan kemampuan dan hubungan ekosistem.
Dua hal yang lebih krusial terjadi dalam enam bulan berikutnya.
Oktober 2025, siaran pers resmi AMD mengumumkan kerja sama strategis dengan OpenAI, untuk menggelar 6GW GPU AMD Instinct. Batch pertama 1GW dijadwalkan dikirim pada paruh kedua 2026. Dalam perjanjian ini tersembunyi sebuah klausul: OpenAI dapat memilih untuk membeli hingga 10% saham AMD. Reuters dan CNBC dalam laporannya pada hari yang sama menekankan detail ini. GPU Instinct generasi berikutnya yang akan dipasok ke OpenAI, AMD tidak mengungkapkan model spesifiknya.
Februari 2026, AMD kembali merilis siaran pers resmi, mengumumkan perluasan kerja sama dengan Meta, juga untuk menggelar 6GW GPU. Chip kali ini adalah varian khusus MI450 yang dikustomisasi Meta, rencananya mulai dikirim pada paruh kedua 2026. Laporan CNBC pada hari itu menyorot sebuah detail: Beberapa hari sebelum kerja sama ini diumumkan, Meta juga mengumumkan perjanjian perluasan pembelian chip AI dengan NVIDIA.
Fakta bahwa Meta menandatangani pesanan jangka panjang dari kedua perusahaan secara bersamaan, lebih meyakinkan daripada perbandingan teknis apa pun. Bagi perusahaan yang menginvestasikan ratusan miliar dolar setiap tahunnya di infrastruktur AI, menaruh semua telur dalam satu keranjang adalah risiko yang tidak dapat diterima. AMD tidak perlu mengungguli NVIDIA secara menyeluruh dalam performa, hanya perlu menyediakan opsi yang dapat digunakan di luar NVIDIA, untuk mendapatkan pesanan di bawah logika "dual supplier". Skala dua kontrak 6GW itu mengisyaratkan, setidaknya OpenAI dan Meta telah memasukkan AMD ke dalam daftar pembelian mereka.
Respons Bersamaan NVIDIA, Adalah Kombinasi Tindakan
Pada periode yang sama, NVIDIA di pasar *enterprise* memainkan kombinasi tindakan. DGX Spark diposisikan sebagai perangkat desktop untuk pengembang, tetapi kartu jaringan ConnectX-7-nya menentukan bahwa ini bukanlah *workstation* yang terisolasi. Ulasan ServeTheHome menganalisis secara mendetail nilai kartu jaringan ini dalam *prototyping* dan *debugging distributed training*, menyimpulkan bahwa meskipun lebih lambat dari NVLink tingkat *data center*, tetapi untuk skenario *cluster* skala kecil sudah cukup. Desain ini mengikat DGX Spark pada lini produk *enterprise* NVIDIA yang lebih besar: Pengembang menggunakan Spark untuk *prototype*, kemudian memindahkan kode ke DGX Station atau instans DGX di *cloud*, dan akhirnya menggelarnya ke *cluster* server yang dilengkapi H200 atau B200. Sebuah *toolchain* yang konsisten dari desktop hingga *data center*, terikat erat pada CUDA.
NVIDIA juga secara bersamaan meluncurkan paket langganan perangkat lunak AI Enterprise, menggabungkan alat-alat seperti TensorRT, RAPIDS, Triton Inference Server, dan dikenakan biaya per *node*. Halaman produk resmi NVIDIA mencantumkan daftar lengkap alat yang termasuk dalam AI Enterprise. Ini bukan menjual perangkat keras, tetapi menjadikan penyebaran dan pengoperasian tingkat *enterprise* sebagai bisnis berkelanjutan yang berbayar, setelah pengembang terbiasa dengan CUDA.
Membandingkan jalur kedua belah pihak, perbedaan sudah cukup jelas.
NVIDIA membangun *full-stack closed loop* dari chip, sistem, perangkat lunak, hingga layanan *cloud*. Pengembang yang masuk ke *loop* ini pada hari pertama sudah dapat menggunakan alat-alat yang teroptimasi, dengan imbalan terkunci dalam ekosistem satu vendor. AMD menempuh jalur alternatif terbuka: menggunakan arsitektur x86 standar industri, mendukung sistem ganda Windows dan Linux, membuat ROCm menjadi *stack* sumber terbuka yang kompatibel dengan *framework* utama, menawarkan harga lebih rendah untuk menarik pelanggan yang sensitif terhadap biaya atau telah memutuskan untuk menyebar risiko pemasok.
Produk Ryzen AI Halo itu sendiri adalah ekspresi perangkat keras paling ringkas dari jalur ini. Ia tidak memiliki kartu jaringan khusus, OS khusus, atau unit akselerasi pelatihan presisi rendah. Ia adalah PC serbaguna, yang kebetulan dijejali dengan memori terpadu yang dapat menjalankan model 200B parameter dan seperangkat GPU yang cukup memadai. Anda dapat menggunakannya untuk menjalankan inferensi model besar, atau menutup *terminal* dan membuka Photoshop. Harga HP Z2 Mini G1a sebesar $2,949 yang dikutip Tom's Hardware dalam laporannya, jauh lebih rendah dari harga awal DGX Spark $3,999, dan jika diganti dengan versi OEM lain, selisih harganya mungkin lebih dari $1,000.
Tapi fleksibilitas ini memiliki sisi lain: kompromi. Data pengujian aktual The Register telah menunjukkan, begitu keluar dari skenario inferensi *single-batch* dan masuk ke skenario yang memerlukan banyak komputasi paralel, keunggulan arsitektur Blackwell dalam presisi rendah dan *software stack* yang telah dioptimalkan selama bertahun-tahun akan dengan cepat memperlebar jarak. Jika Anda membutuhkan kotak desktop yang dapat menjalankan Stable Diffusion untuk menghasilkan gambar, ekosistem CUDA NVIDIA memiliki seperangkat alat lengkap yang siap pakai. Arsitektur RDNA 3.5 AMD tidak mendukung format presisi rendah FP4 dan FP8, sehingga kinerjanya kurang optimal dalam beban kerja seperti pembuatan gambar, ini ditentukan oleh desain arsitektur RDNA, bukan pembaruan *driver* yang dapat menyelesaikannya.
Tujuan Kotak Ini, Bukan di Dalam Kotak
Melihat kembali garis waktu, gerakan AMD dalam setahun terakhir membentuk sebuah jalur yang cukup jelas.
Tingkat perangkat keras, Instinct MI300 dan MI325X diproduksi massal, MI350 dan MI450 dilanjutkan sesuai peta jalan, Ryzen AI Max+ 395 berubah dari chip laptop menjadi APU desktop yang dimasukkan ke dalam platform pengembang. Tingkat sistem, melalui akuisisi ZT Systems mendapatkan kemampuan desain tingkat *rack*, kemudian memisahkan manufaktur dan mempertahankan R&D. Tingkat pelanggan, dengan dua kontrak jangka panjang tingkat 6GW mengikat dua konsumen daya komputasi AI terbesar di dunia, sekaligus menarik OpenAI ke dalam daftar pemegang saham. Tingkat perangkat lunak, ROCm beriterasi dengan kecepatan kira-kira satu versi per kuartal, mengejar dukungan *framework* utama, tetapi porting pustaka mutakhir dan akumulasi komunitas masih memerlukan waktu.
Setiap langkah tidak terisolasi. Mengakuisisi ZT Systems adalah untuk memiliki kemampuan mendesain *cluster* AI *hyperscale* seperti yang dibutuhkan OpenAI dan Meta, bukan hanya menjual GPU ke vendor server. Iterasi cepat ROCm adalah agar pelanggan yang menandatangani kontrak 6GW memiliki *software stack* yang dapat digunakan saat penyebaran, bukan pengiriman *bare-metal*. Peluncuran Ryzen AI Halo adalah untuk memperluas ekosistem ROCm yang sama ke ujung desktop, memungkinkan pengembang menggunakan mesin $3,000 untuk *debugging* lokal, kemudian menerapkan model ke *cluster* MI450 di *cloud*.
Tetapi ini tidak berarti AMD telah mengejar NVIDIA. Dua kontrak 6GW adalah janji penyebaran di masa depan, kapasitas energi yang dihitung dalam gigawatt mencerminkan skala perencanaan infrastruktur, bukan jumlah chip yang telah dikirim. Spesifikasi MI450 hingga saat ini belum diungkap, performa aktual chip, *yield*, stabilitas setelah penyebaran skala besar masih merupakan hal yang belum diketahui. ROCm telah mencapai status "dapat digunakan" pada *framework* utama, tetapi status "komunitas dapat membantu Anda saat bermasalah" masih memerlukan akumulasi waktu yang lebih lama. Sedangkan akumulasi 17 tahun CUDA tidak dapat diatasi hanya dengan beberapa iterasi cepat dalam beberapa kuartal.
*Moat* NVIDIA juga tidak hanya ada di perangkat lunak. Kartu jaringan ConnectX-7 di DGX Spark mengisyaratkan dimensi persaingan lain: Saat AMD menggunakan harga dan keterbukaan untuk menarik pengembang, NVIDIA menggunakan kemampuan perluasan *cluster* untuk mengunci tim yang memerlukan pelatihan terdistribusi dan *pipeline* inferensi berskala besar. Membeli satu DGX Spark adalah $3,999, membeli dua ditambah kabel jaringan dapat menjalankan *prototype* terdistribusi. Dalam skenario ini, keunggulan ROCm yang setara dalam inferensi *single-machine* menjadi tereliminasi.
Perbedaan kedua perusahaan dalam AI, ketika akhirnya jatuh pada kotak seukuran telapak tangan ini, berubah menjadi pilihan yang konkret. Anda membuka kotak AMD, mendapatkan lingkungan PC yang familiar, menginstal PyTorch dengan instruksi yang hampir sama, memuat model, memulai inferensi, prosesnya lancar, sampai Anda perlu menggunakan pustaka yang hanya memiliki *backend* CUDA. Anda membuka kotak NVIDIA, mendapatkan lingkungan khusus yang telah dioptimalkan dari perangkat keras, *driver*, hingga *toolchain* kontainer, semuanya berjalan sesuai harapan setelah dinyalakan, hanya saja tagihannya lebih mahal seribu dolar, dan biaya migrasi untuk berganti vendor di masa depan telah dikunci sebelumnya.
AMD tidak menantang *full-stack empire* NVIDIA secara langsung. Ia memilih jalan yang lebih pragmatis: Menjadi opsi alternatif yang cukup memadai saat harga dan kemampuan pengiriman rantai pasokan NVIDIA tidak dapat memenuhi semua kebutuhan pelanggan. Dua kontrak 6GW adalah bukti paling kuat dari strategi ini sejauh ini. Ryzen AI Halo adalah perpanjangan dari strategi ini di ujung desktop, bukan mengikuti tren membuat kotak AI kecil, melainkan melangkah lebih jauh sepanjang garis "menggunakan ekosistem terbuka dan keunggulan biaya untuk menarik pengembang yang tidak ingin terkunci."






