Dua tahun terakhir, vendor PC berulang kali menyebutkan satu parameter dalam promosi "AI PC": daya komputasi NPU. Tetapi baik itu 45 TOPS dari Intel Lunar Lake, atau 50 TOPS dari AMD Strix Point, angka-angka ini tetap berada pada tingkat yang relatif moderat. Bisa melakukan blur latar belakang, pengurangan noise suara, menjalankan model sisi ujung skala kecil, tapi hanya itu saja.
Pada tanggal 31 Mei, NVIDIA membawa angka itu ke 1 petaflop, atau 1000 TOPS, dengan chip super RTX Spark yang mereka perkenalkan di konferensi GTC 2026. Bukan peningkatan 30% atau 50%, tapi langsung melompati satu orde besaran.
Ada beberapa pengumuman lain dalam acara yang sama: Microsoft meningkatkan mekanisme keamanan asli Windows untuk menyesuaikan dengan RTX Spark, dan memperkenalkan runtime sandbox sumber terbuka NVIDIA, OpenShell, ke platform Windows; Adobe mengumumkan pembangunan ulang Photoshop dan Premiere dari dasar, dirancang khusus untuk arsitektur memori terpadu RTX Spark; enam OEM pertama mengonfirmasi akan meluncurkan laptop tipis dan desktop kompak yang dilengkapi chip ini pada musim gugur tahun ini.
Apa yang dilakukan NVIDIA di GTC kali ini bukan sekadar merilis chip baru. Mereka mencoba menetapkan standar perangkat keras baru untuk kategori "PC AI pribadi".
Ketika GPU Menjadi Bintang Utama PC
Mari lihat chip itu sendiri. Menurut data yang dipublikasikan NVIDIA di GTC, RTX Spark mengintegrasikan GPU dengan arsitektur Blackwell, 6144 inti CUDA, dipasangkan dengan CPU Grace 20-inti berbasis Arm yang dirancang bersama MediaTek, diproduksi dengan proses 3nm TSMC. Perubahan kuncinya terletak pada arsitektur memori: memori terpadu hingga 128GB, CPU dan GPU berbagi kolam memori yang sama, data tidak perlu bolak-balik dipindahkan di antara keduanya.
Ini bertolak belakang dengan logika arsitektur PC masa lalu.
Struktur dasar PC tradisional adalah "CPU x86 sebagai prosesor utama, GPU diskrit sebagai komponen opsional". Bahkan dalam konsep AI PC yang berkembang belakangan, pendekatan Intel dan AMD adalah menyematkan NPU di dalam CPU, sebagai modul tambahan untuk akselerasi AI, dengan daya komputasi umumnya di kisaran 40-50 TOPS. GPU tetap "tambahan".
RTX Spark mendistribusikan kembali kekuatan. SoC ini menjadikan GPU sebagai bintang utama, CPU mundur ke peran pendukung. Daya komputasi AI yang diberikan NVIDIA adalah 1 petaflop FP4, setara dengan 1000 TOPS, lebih dari 20 kali lipat daya komputasi NPU bawaan AI PC generasi sebelumnya. Ini bukan sekadar percepatan di jalur yang sama, ini adalah garis start untuk jalur lain.
Kecepatan respons OEM menguatkan penilaian ini. Menurut pengumuman resmi NVIDIA dan laporan lanjutan DIGITIMES, Asus, Dell, HP, Lenovo, Microsoft Surface, dan MSI akan meluncurkan laptop tipis dan desktop kompak dengan RTX Spark pada musim gugur tahun ini, diikuti oleh model dari Acer dan Gigabyte. Hampir semua merek PC Windows mainstream ikut serta.
RTX Spark bukan produk yang lahir dari nol. Awal 2025, chip dengan inti Blackwell dan Grace yang sama pernah diperkenalkan dengan bentuk Project DIGITS dan DGX Spark, namun saat itu diposisikan sebagai superkomputer desktop Linux untuk pengembang, dengan ukuran mendekati desktop kecil. Setahun kemudian, arsitektur ini dimasukkan ke dalam ruang pendingin laptop tipis, sistem operasi beralih dari Linux ke Windows, target pengguna meluas dari pengembang AI ke konsumen umum dan pengguna korporat. Inilah perubahan yang paling patut dicatat dalam rilis konsumen GTC 2026: NVIDIA tidak merilis mainan untuk pengembang, tetapi mendorong pintu pasar konsumen terbuka.
Model 120B Berjalan Lokal, Sudah Cukup?
Angka daya komputasi dan memori akhirnya harus menjawab satu pertanyaan: Bisa melakukan apa?
Jawaban yang diberikan NVIDIA dalam presentasi adalah, RTX Spark mendukung model besar 120B parameter yang berjalan secara lokal, dengan jendela konteks bisa mencapai jutaan token. Apa artinya 120B? Sebagai perbandingan, praktik utama menjalankan model lokal di perangkat keras konsumen saat ini adalah, RTX 4090 dengan 24GB memori grafis, melalui kompresi kuantisasi, dapat menjalankan model tingkat 30B hingga 40B parameter. Beberapa model kecil yang bisa berjalan cepat di kartu grafis konsumen adalah model 9B. Lompatan dari 9B ke 120B ini menggeser ulang standar "cukup" untuk AI sisi ujung.
Memori terpadu 128GB adalah prasyarat untuk semua ini. Pada arsitektur PC tradisional, CPU memiliki memori sistemnya sendiri, GPU memiliki memori grafisnya sendiri, ada batas fisik di antara keduanya. Model besar yang melebihi kapasitas memori grafis tidak bisa dijalankan sama sekali, atau memerlukan pemisahan model dan pertukaran memori yang rumit, dengan kecepatan turun drastis. Arsitektur memori terpadu menghilangkan hambatan ini, data model langsung dimasukkan ke dalam kolam bersama 128GB, dapat diakses oleh CPU dan GPU. Apple membuktikan kelayakan konsumen dari jalur teknologi ini lebih dulu di Apple Silicon, sekarang NVIDIA membawanya ke kubu Windows.
Selain inferensi model besar, kasus penggunaan yang disebutkan NVIDIA mencakup penyuntingan video 12K, rendering adegan 3D di atas 90GB, game dengan ray tracing di atas 100fps pada resolusi 1440p. Ciri umum dari skenario-skenario ini adalah volume data yang diproses sekaligus sangat besar, PC tradisional memerlukan waktu tunggu berlipat dari waktu pemrosesan, atau sama sekali tidak bisa dijalankan.
Ada jarak antara "mendukung menjalankan" dan "dapat digunakan dengan lancar". NVIDIA tidak mempublikasikan kecepatan inferensi aktual model 120B di RTX Spark, juga tidak memberikan data latensi token pertama untuk skenario dengan jendela konteks jutaan token. Indikator kunci yang menentukan kecepatan inferensi konteks panjang adalah bandwidth memori. Sebagai perbandingan, DGX Spark yang menggunakan inti GB10 yang sama, dalam pengujian memiliki bandwidth memori sekitar 301GB/s. Tingkat bandwidth ini cukup untuk menjalankan model 120B, tetapi saat menangani jendela konteks tingkat jutaan token, pengguna mungkin perlu menunggu beberapa detik untuk melihat token keluaran pertama. Versi laptop RTX Spark mungkin akan menyesuaikan bandwidth aktual karena batasan daya.
Menambahkan "Kandang" Keamanan untuk Agen AI
Pengumuman inti lain di luar daya komputasi adalah kerja sama NVIDIA dan Microsoft di tingkat sistem. Bagian ini mungkin yang paling mudah diabaikan dalam rilis konsumen GTC 2026, tetapi memiliki dampak terdalam bagi industri.
Sebuah komputer yang bisa menjalankan model 120B, jika diserahkan kepada agen AI yang dapat mengoperasikan desktop secara mandiri, mengklik tombol, membaca dan menulis file, risiko keamanannya bukan lagi pada tingkat "apakah data akan hilang", tetapi "apakah agen akan melakukan hal yang tidak Anda inginkan". Tanpa menyelesaikan masalah ini, perusahaan tidak mungkin menempatkan perangkat semacam ini kepada karyawan.
Solusi yang diberikan Microsoft dan NVIDIA adalah dua garis pertahanan. Pertama, Microsoft meningkatkan mekanisme keamanan asli Windows, menyediakan pemantauan dan batasan untuk perilaku agen AI dari tingkat sistem operasi. Kedua, NVIDIA secara resmi memperkenalkan runtime OpenShell ke platform Windows. Menurut dokumen resmi NVIDIA, OpenShell adalah runtime sandbox sumber terbuka yang menyediakan isolasi tingkat kernel. Ini memberi agen AI ruang operasi yang terkendali, agen dapat menjalankan tugas secara mandiri dalam batas ini, tetapi izinnya dibatasi ketat, tidak dapat mengakses file inti sistem, koneksi jaringan, atau data sensitif pengguna di luar batas.
Kombinasi ini memiliki arti yang jelas untuk pembelian korporat. Sebelumnya, konsep "agen AI lokal" masih berada pada tahap demonstrasi teknologi. Perangkat keras mampu menjalankan, tetapi kerangka keamanannya kosong. Tidak ada departemen IT perusahaan yang berani memasukkan perangkat dalam keadaan ini ke dalam daftar pembelian. NVIDIA dan Microsoft menyisipkan lapisan isolasi standar antara perangkat keras dan aplikasi, mengubah "bisa digunakan" menjadi "dapat dikelola".
Overhead kinerja OpenShell sendiri adalah variabel yang perlu diamati. Isolasi sandbox biasanya membawa kerugian kinerja tertentu, seberapa banyak hal itu mempengaruhi kecepatan inferensi atau respons sistem, NVIDIA saat ini tidak mempublikasikan data. Kompleksitas penerapan di sisi manajemen IT perusahaan, kompatibilitas dengan kebijakan keamanan yang ada, masalah-masalah praktis dalam implementasi ini perlu dibuktikan setelah perangkat OEM diluncurkan.
Mengapa Adobe Mau "Membangun Ulang dari Dasar"
Tingkat dukungan vendor perangkat lunak biasanya merupakan indikator angin apakah sebuah platform perangkat keras baru dapat bertahan.
Langkah yang diumumkan Adobe selama GTC adalah sinyal terbesar dari sisi perangkat lunak dalam rilis kali ini. Menurut blog resmi NVIDIA dan konfirmasi eksekutif Adobe, Adobe memulai pembangunan ulang dasar Photoshop dan Premiere, dirancang khusus untuk arsitektur memori terpadu RTX Spark, mengklaim peningkatan kinerja AI dan pemrosesan grafis hingga 2 kali lipat.
"Membangun ulang dari dasar" bukan menambahkan plugin atau membuat lapisan adaptasi. Pada PC tradisional, CPU dan GPU memiliki ruang memori masing-masing, saat memproses file PSD sangat besar atau timeline video 8K, data harus dipindahkan bolak-balik di antara dua set memori, ini adalah sumber pemborosan kinerja terbesar. Memori terpadu RTX Spark memungkinkan CPU dan GPU langsung berbagi ruang 128GB yang sama, perubahan struktur ini memiliki nilai praktis bagi alur kerja profesional kreator. Adobe mengubah kode dasar untuk ini, menunjukkan mereka mengakui arah arsitektur ini bukan sekadar trik pemasaran sekali pakai.
Namun, benchmark perbandingan "percepatan 2 kali lipat" ini apa, baik NVIDIA maupun Adobe tidak mempublikasikannya. Apakah dibandingkan dengan prosesor x86 generasi yang sama ditambah kartu grafis diskrit, atau dengan skema NPU AI PC generasi sebelumnya? Hasilnya sangat berbeda. Sebelum kondisi benchmark diumumkan, nilai angka ini masih dipertanyakan.
Dukungan juga diumumkan oleh Blackmagic Design, ComfyUI, llama.cpp, OTOY, dan beberapa vendor game. Dukungan dari ComfyUI dan llama.cpp patut diperhatikan, karena mereka adalah alat sumber terbuka paling aktif dalam alur kerja AI lokal saat ini. Dukungan awal komunitas pengembang seringkali lebih benar mencerminkan potensi ekosistem sebuah platform dibanding janji vendor besar.
NVIDIA sedang menggunakan ekosistem CUDA dan arsitektur memori terpadu untuk membangun pengalaman terintegrasi perangkat lunak dan keras serupa Apple di kubu Windows. Bedanya, tembok Apple dibangun sendiri, NVIDIA perlu meyakinkan Microsoft dan ISV untuk membangun bersama. Keinginan Adobe untuk bergerak dari dasar, setidaknya menunjukkan batu bata pertama tembok itu sudah diletakkan.
Di Luar Spesifikasi Kertas
Kembali ke pertanyaan paling praktis: Apakah perangkat-perangkat ini benar-benar bisa dibeli, dan seperti apa pengalamannya saat dipegang?
Menurut informasi yang dipublikasikan NVIDIA, perangkat RTX Spark pertama akan diluncurkan pada musim gugur tahun ini, mencakup laptop tipis dan desktop kompak dari Asus, Dell, HP, Lenovo, Microsoft Surface, dan MSI. Model dari Acer dan Gigabyte menyusul kemudian. Semua harga spesifik dan tanggal peluncuran pasti dari OEM belum diumumkan.
Yang lebih krusial dari harga adalah beberapa faktor tidak diketahui di tingkat fisik. Bagaimana menyeimbangkan daya dan pendinginan saat memasukkan chip dengan daya komputasi 1 petaflop ke dalam laptop tipis? Bagaimana kinerja harian dan daya tahan baterai RTX Spark dalam skenario non-AI seperti kerja kantor? Apakah bandwidth aktual memori terpadu 128GB dalam bentuk laptop akan menyusut signifikan karena batasan daya?
Pertanyaan-pertanyaan ini adalah ujian sebenarnya dari implementasi industrial. Daya komputasi puncak sebuah chip dalam prototipe rekayasa dan kinerja aktualnya di tangan konsumen selama 8 jam sehari seringkali berbeda. NVIDIA dalam presentasi menekankan rasio efisiensi energi RTX Spark, tetapi tidak memberikan nilai TDP spesifik atau data daya tahan baterai.
Dari sudut pandang lanskap industri PC, kehadiran RTX Spark menandakan pola pembagian kerja baru sedang terbentuk. Tiga puluh tahun terakhir, kendali atas chip inti PC dipegang oleh vendor prosesor x86, vendor GPU meskipun semakin penting, tetap sebagai "komponen yang dipasang di motherboard". NVIDIA kali ini membawa SoC lengkap, mengintegrasikan semua dari CPU, GPU, hingga pengontrol memori, bagian CPU berbasis Arm dirancang oleh MediaTek. Struktur kekuatan rantai pasokan PC sedang bergeser dari "CPU x86 ditambah GPU opsional" ke "platform SoC yang berpusat pada GPU".
Pergeseran ini tidak akan selesai dalam satu hari. Strategi penetapan harga OEM, kinerja efisiensi energi produk aktual, kemajuan adaptasi perangkat lunak ISV, siklus validasi pembelian klien korporat, setiap langkah menentukan apakah RTX Spark menjadi koordinat baru industri PC, atau hanya demonstrasi teknologi lain yang mulai tinggi lalu jatuh. Jawabannya setidaknya harus menunggu hingga musim gugur tahun ini.








