Penulis Asli: Li Hailun, Su Yang
Editor Asli: Xu Qingyang
Sumber Asli: Tencent Technology
1 Juni 2026, dalam pidato utama yang disampaikan oleh Jensen Huang, Pendiri dan CEO NVIDIA, pada Konferensi NVIDIA GTC Taipei yang diselenggarakan selama COMPUTEX 2026.
Hanya tiga bulan sejak GTC terakhir.
Saat itu, NVIDIA meluncurkan "paket lengkap chip" Vera Rubin, termasuk: CPU Vera, GPU Rubin, LPU Groq 3, DPU ConnectX-9, DPU BlueField-4, Switch Spectrum-6, enam chip membentuk satu rak superkomputer AI tingkat rak, dan mengumumkan bahwa jumlah GPU yang dibutuhkan untuk melatih model MoE besar turun menjadi seperempat, throughput inferensi per watt meningkat 10 kali lipat, dan biaya per token turun menjadi sepersepuluh.
Berbeda dengan penekanan sebelumnya pada solusi sistemik seperti "paket lengkap chip" atau "paket lengkap komputasi", tiga bulan kemudian di COMPUTEX, Jensen Huang mengalihkan pandangannya pada target yang akan dilayani oleh infrastruktur ini – Agent.
Jensen Huang mengungkapkan dalam pidatonya: Vera Rubin secara resmi memasuki tahap produksi massal, CPU Vera mulai dikirim ke seluruh dunia, DGX Station untuk pertama kalinya hadir dalam bentuk Windows di desktop perusahaan, Cosmos 3 membangun kembali kerangka persepsi AI fisik, DSX menjadi sistem operasi operasional pabrik AI. NVIDIA juga bersama Unitree merilis H2 Plus – desain referensi robot humanoid pertama berdasarkan platform Isaac GR00T, memperluas batas Agent dari dunia digital ke bentuk fisik.
NVIDIA sedang mengatur ulang keseluruhan sistem teknologi, mulai dari chip, pusat data, model, perangkat lunak hingga platform robot, di sekitar ekosistem Agent.
Jensen Huang berkata: "Era Agent AI dan kecerdasan buatan praktis telah tiba. Sekarang token (atau disebut 'unit kata') adalah unit keuntungan, AI adalah 'generator' GDP, jumlah insinyur perangkat lunak sedang meningkat. Orang-orang membicarakan AI mengurangi lapangan kerja, itu sama sekali omong kosong, sebenarnya lebih banyak insinyur perangkat lunak yang sedang direkrut".
Pabrik AI yang Sama, Menjalankan 10 Kali Lipat Tugas Agent
Platform Vera Rubin telah berproduksi penuh.
Berbeda dengan sebelumnya yang terutama berfokus pada pelatihan dan inferensi model besar, Vera Rubin sejak awal perancangan menjadikan Agent sebagai beban kerja fokus utama.
Jensen Huang menyatakan dalam pidatonya, satu tugas Agent seringkali bukan hanya satu kali inferensi model, tetapi mencakup banyak tautan seperti inferensi, pencarian, pemanggilan alat, eksekusi kode, dan verifikasi hasil, di belakangnya mungkin melibatkan ribuan langkah. Pusat data di masa depan perlu menangani bukan lagi permintaan model tunggal, tetapi lebih banyak tugas Agent yang berjalan terus-menerus dan saling berkolaborasi dalam jumlah besar.
Platform ini didefinisikan sebagai unit komputasi raksasa, superkomputer AI tingkat unit komputasi yang seragam, dibangun khusus untuk menangani beban kerja agen cerdas dari inferensi, retrieval hingga penggunaan alat. Di pusat data super besar dengan skala yang sama, menggunakan platform Vera Rubin yang baru untuk menjalankan tugas agen AI otonom, efisiensi penanganannya adalah 10 kali lipat dari platform Grace Blackwell generasi sebelumnya.
Selain platform komputasi itu sendiri, jaringan juga menjadi fokus peningkatan Vera Rubin.
Di masa lalu di pusat data, transmisi data antar GPU terutama mengandalkan arsitektur modul optik dan sakelar tradisional, tetapi ketika skala kluster terus meluas, konsumsi daya, pendinginan, dan kompleksitas penyebaran akan meningkat dengan cepat. Untuk itu, NVIDIA memperkenalkan sistem jaringan Spectrum-X Ethernet Photonics ke dalam platform Vera Rubin.
Ini adalah pertama kalinya NVIDIA memperkenalkan teknologi Co-Packaged Optics (CPO) secara besar-besaran ke dalam jaringan pusat data AI.
Secara sederhana, skema tradisional memerlukan modul optik yang dipasang di luar sakelar, sedangkan CPO mengintegrasikan perangkat optik langsung ke dalam sakelar, sehingga mengurangi konsumsi energi dan kehilangan sinyal.
Selain itu, keamanan juga menjadi kemampuan inti yang ditekankan pada platform Vera Rubin kali ini.
Untuk itu, NVIDIA memperluas kemampuan Confidential Computing ke seluruh platform Vera Rubin. Melalui lingkungan eksekusi tepercaya, verifikasi tingkat perangkat keras, dan mekanisme enkripsi ujung-ke-ujung, perusahaan dapat memperoleh jaminan keamanan tingkat lebih tinggi saat menangani data pribadi, informasi sensitif industri, dan model kunci.
Jensen Huang mengungkapkan, Vera Rubin telah memasuki tahap produksi massal. Sebagai sistem tingkat rak MGX generasi ketiga, di belakangnya melibatkan lebih dari 150 mitra, lebih dari 350 pabrik, dan sistem rantai pasokan yang mencakup lebih dari 30 negara dan wilayah. Sesuai rencana yang diumumkan NVIDIA, Vera Rubin akan mulai dikirim secara resmi musim gugur tahun ini.
Prosesor yang "Dilahirkan untuk Agent"
NVIDIA meluncurkan prosesor baru Vera yang dirancang khusus untuk era agen cerdas, dan telah berproduksi penuh.
Jensen Huang menekankan, kemajuan sistem memori akan mendorong inovasi dan modernisasi sistem penyimpanan. Semua CPU hingga saat ini dibuat untuk manusia, sedangkan Vera adalah CPU yang dirancang untuk era AI, dibuat untuk agen cerdas.
Sebagai penerus Grace, Vera mengadopsi arsitektur inti CPU "Olympus" yang dirancang sendiri oleh NVIDIA, jumlah inti meningkat dari 72 menjadi 88, dan secara signifikan meningkatkan kemampuan memori dan pemrosesan data. Menurut NVIDIA, dalam pengujian beban kerja terkait Agent, kecepatan eksekusi tugas Vera mencapai 1,8 kali lipat dari CPU server x86 dengan periode yang sama.
Dibandingkan peningkatan kinerja murni, perubahan yang lebih penting adalah hubungan antara Vera dengan GPU Rubin: Vera terhubung ke GPU Rubin melalui NVLink-C2C generasi kedua, bandwidth interkoneksi mencapai 1.8TB/s, overhead transfer data antara CPU dan GPU selama operasi Agent semakin berkurang.
Jensen Huang menyatakan, Vera Rubin menggunakan HBM (High Bandwidth Memory) dari Micron, SK Hynix, dan Samsung, dengan skala rantai pasokan "dua kali lipat" dari generasi Blackwell sebelumnya. Namun, untuk menyebarkan satu rak Blackwell besar membutuhkan dua jam, sedangkan waktu untuk Vera Rubin ditekan hingga level 5 menit.
Membawa Pabrik AI dari "Pembangunan" ke "Operasional"
DSX yang diluncurkan NVIDIA kali ini dapat dipahami sebagai satu set "kotak peralatan pembangunan dan operasional pabrik AI".
Di masa lalu, untuk membangun pusat data AI, klien perlu mempertimbangkan server, jaringan, listrik, pendinginan, desain ruang server, dan sistem operasional secara terpisah, banyak tautan yang bergantung pada kerja sama dari pemasok berbeda. Yang ingin dilakukan DSX adalah menempatkan tautan-tautan yang semula terpisah ke dalam kerangka yang sama, sehingga klien memiliki skema referensi dan verifikasi standar dari desain, simulasi, pembangunan, hingga operasional.
Jensen Huang mengatakan di tempat peluncuran: NVIDIA tidak hanya menjual chip, tetapi ingin memberikan cetak biru pabrik AI yang lengkap kepada pembangun infrastruktur.
Kemampuan tambahan terpenting DSX kali ini terutama ada dua.
Pertama adalah DSX MaxLPS. Ini menyelesaikan masalah paling nyata pabrik AI: dengan anggaran listrik tetap, bagaimana menempatkan lebih banyak GPU, dan menghasilkan lebih banyak Token.
Menurut NVIDIA, MaxLPS menggabungkan pendinginan cair dan pengoptimalan konsumsi daya dalam rak, memungkinkan operator menjalankan hingga 40% lebih banyak GPU tanpa secara signifikan mempengaruhi kinerja.
Kedua adalah DSX OS. Ini setara dengan perangkat lunak operasional pabrik AI, bertanggung jawab atas manajemen siklus hidup, penjadwalan cerdas, pemantauan kesehatan, pemulihan kegagalan, manajemen multi-tenant, dan lainnya. Singkatnya, jika pabrik AI adalah pabrik yang kompleks, DSX OS bertanggung jawab menjaga pabrik ini beroperasi dengan stabil dan berkelanjutan.
Dalam matriks produk DSX, Reference Design menyediakan desain referensi pabrik AI, memberi tahu klien bagaimana ruang server, rak, jaringan, listrik, dan sistem pendinginan seharusnya dibangun; DSX Sim bertanggung jawab atas simulasi, memungkinkan klien memverifikasi kelayakan desain sebelum pembangunan; DSX Flex menghubungkan pabrik AI ke jaringan listrik, memungkinkan pusat data menyesuaikan tugas berdasarkan sinyal harga listrik, beban, dan respons permintaan; DSX Exchange bertanggung jawab menghubungkan antarmuka data antara sistem IT, sistem operasional, sistem energi dan pendinginan.
Dalam hal ekosistem, mitra cloud seperti CoreWeave, Crusoe, Lambda sedang menyebarkan DSX Sim, MaxLPS dan DSX OS untuk mengurangi risiko dan meningkatkan utilisasi GPU. Dell, HPE, Lenovo, Supermicro serta pabrikan seperti ASUS, Foxconn, GIGABYTE, Quanta Computer sedang membangun sistem yang mendukung DSX.
Bekerja Sama dengan Windows dan ARM
Dalam pidato di tempat, Jensen Huang mengumumkan kehadiran workstation "DGX Station for Windows" yang didefinisikan NVIDIA sebagai superkomputer AI desktop tingkat desktop untuk ekosistem Windows.
Secara perangkat keras, ia dilengkapi dengan GB300 Grace Blackwell Ultra Desktop Superchip, terhubung melalui NVLink-C2C antara GPU Blackwell Ultra dengan CPU Grace 72-core, menyediakan memori terpadu hingga 748GB dan kinerja FP4 hingga 20 PFLOPS, serta dilengkapi kemampuan jaringan hingga 800Gb/s.
Fokus produk ini terletak pada perubahan cara penyebaran Agent.
NVIDIA berharap perusahaan dapat menjalankan beberapa Agent di lingkungan Windows lokal, aman, dan terkelola, dan mengintegrasikannya ke dalam alur kerja seperti desain, teknik, ilmu data, inferensi, dan Physical AI. OpenShell yang diluncurkan bersamaan bertanggung jawab atas keamanan operasi Agent, melalui kontrol kebijakan tingkat sistem dan isolasi sandbox, membatasi operasi melebihi kewenangan Agent atau kebocoran kredensial dan data pribadi.
Selain produk untuk desktop perusahaan, Jensen Huang juga meluncurkan SoC tingkat sistem – RTX Spark SoC, yang mengintegrasikan CPU N1X dan GPU Blackwell ke dalam satu chip, dengan arsitektur memori terpadu, khusus untuk laptop ringan dan desktop kecil.
Di antaranya, N1X adalah prosesor PC pertama yang dibangun bersama oleh NVIDIA dan Microsoft, berbasis arsitektur Arm, dirancang khusus oleh MediaTek, diproduksi dengan proses 3 nanometer TSMC. Akan diluncurkan pertama kali musim gugur ini pada laptop dari Microsoft, Dell, HP, ASUS, Lenovo, dan MSI, lebih dari 30 model pertama, dengan fokus pada laptop ringan kelas atas.
Ini adalah "super chip" yang dipersiapkan NVIDIA untuk era AI PC, Jensen Huang menganggapnya sebagai rekonstruksi penting dalam bentuk PC.
"Dua Otak" Agent
Dalam peluncuran kali ini, NVIDIA mengumumkan perkembangan terbaru dari dua lini produk model inti, masing-masing sesuai dengan dua skenario Agent: satu berjalan di sistem perusahaan, satu berjalan di dunia fisik.
NVIDIA merilis model campuran ahli dengan 550 miliar parameter Nemotron 3 Ultra, yang dapat menyediakan kemampuan cerdas terbaik untuk agen jangka panjang dalam pengembangan kode, penelitian ilmiah, dan alur bisnis perusahaan. Dibandingkan dengan model terdepan open-source kelas yang sama, kecepatan inferensi model ini ditingkatkan hingga 5 kali lipat, biaya penggunaan dikurangi hingga 30%, membantu agen menyelesaikan berbagai tugas dengan lebih efisien dan rendah biaya.
Di sekitar model terbuka Nemotron, NVIDIA merilis serangkaian kemajuan dalam perangkat lunak, model open source, dan kerja sama, dengan tujuan memungkinkan perusahaan membangun "rekan kerja digital" yang dapat membantu karyawan bekerja dalam skenario seperti desain rekayasa, kesehatan, pengembangan perangkat lunak, dan operasi bisnis.
Dalam kombinasi ini, Nemotron menyediakan kemampuan model dasar, NemoClaw bertanggung jawab mengatur model menjadi Agent, OpenShell bertanggung jawab atas keamanan runtime, sementara Agent Toolkit mengubah pustaka perangkat lunak NVIDIA seperti CUDA-X menjadi alat yang dapat langsung dipanggil oleh Agent. Agent dapat menggunakan alat, memanggil data, mengeksekusi tugas dalam lingkungan terkendali, dan terhubung ke sistem perusahaan yang ada.
Jensen Huang mengatakan, perusahaan perangkat lunak global sedang membawa AI Agent ke dalam sistem kerja nyata, membiarkan mereka membantu karyawan menyelesaikan tugas kompleks dengan lebih cepat. NemoClaw menyediakan komponen terbuka yang diperlukan untuk membangun Agent yang berjalan jangka panjang, termasuk kemampuan orchestration, konteks, memori, pemanggilan alat, dan kontrol keamanan.
Di masa lalu, diskusi perusahaan tentang AI lebih banyak fokus pada apa yang dapat dijawab model; sekarang NVIDIA ingin menyelesaikan bagaimana Agent dapat terhubung dengan aman ke alat, data, dan alur bisnis, dan terus berjalan dalam pekerjaan nyata.
Ada juga Cosmos 3, yang dirilis secara resmi sebagai generasi ketiga seri Cosmos, juga merupakan rekonstruksi tingkat arsitektur.
Cosmos 3 adalah model dasar dunia untuk AI fisik, menyediakan kemampuan dasar "memahami dunia fisik, memprediksi apa yang akan terjadi, memutuskan cara bertindak".
Dibandingkan dengan Cosmos sebelumnya, versi awal terutama ditujukan untuk pengembang robot dan kendaraan otonom, melakukan pembuatan video dan simulasi dunia fisik, pada dasarnya adalah kerangka generasi yang relatif unimodal. Cosmos 3 mengganti arsitektur – Transformer campuran, untuk pertama kalinya menyatukan tiga hal: penalaran visual, generasi dunia, dan prediksi tindakan ke dalam satu sistem.
Ia dapat secara native memahami dan menghasilkan teks, gambar, video, suara lingkungan, dan tindakan, mencapai tingkat akurasi fisik yang terdepan, merupakan model serba bisa sepenuhnya terbuka pertama di dunia. NVIDIA menyatakan, ia diharapkan dapat menekan siklus pelatihan dan evaluasi AI fisik dari beberapa bulan sebelumnya menjadi beberapa hari.
Jensen Huang memprediksi, berkat terobosan dalam bahasa penalaran multimodal, model visual dan dunia, ledakan besar AI fisik akan segera tiba.
Seri model serba bisa terbuka terdepan Cosmos 3 memberikan kemampuan lompatan generasi bagi pengembang, untuk membangun robot, kendaraan otonom, dan AI visual yang dapat merasakan, bernalar, merencanakan, dan bertindak di dunia fisik.
Menurunkan Ambang Batas Physical AI
NVIDIA bersama Unitree secara bersama meluncurkan H2 Plus – sebuah mesin contoh robot humanoid yang dipersiapkan untuk penelitian dan pengembang.
"Contoh" artinya: Unitree bertanggung jawab atas tubuh robot, NVIDIA bertanggung jawab atas perangkat lunak dan platform komputasi, kedua pihak mengintegrasikan perangkat keras dan perangkat lunak secara pra-terintegrasi, tim pengembang dapat langsung mulai melakukan pengembangan keterampilan setelah mendapatkannya, tidak perlu menghabiskan waktu lagi untuk menyelesaikan integrasi dasar. Ia juga merupakan robot humanoid terbuka pertama di dunia yang dibangun berdasarkan platform pengembangan NVIDIA Isaac GR00T.
Mesin contoh ini menargetkan titik nyeri yang telah lama ada dalam pengembangan robot humanoid: integrasi perangkat keras, pengumpulan data, simulasi, pelatihan, evaluasi, penyebaran, setiap tautan berjalan sendiri, seluruh alur kerja sangat terfragmentasi.
NVIDIA menyatakan, tim penelitian sering menghabiskan banyak waktu untuk menyatukan komponen dasar setelah mendapatkan tubuh robot, sedangkan pengembangan keterampilan sebenarnya justru tertunda berulang kali. Apa yang dicoba dilakukan H2 Plus adalah membuka jalan ini, memungkinkan tim penelitian melewati integrasi dasar, langsung masuk ke pengembangan keterampilan dan validasi skenario nyata.
Menurut Jensen Huang, robot humanoid akan membawa AI fisik ke industri terbesar di dunia, membuka peluang ekonomi bernilai triliunan dolar, dan H2 Plus adalah titik awal mendorong penelitian terdepan ke skenario nyata seperti pabrik, gudang, dan sistem logistik.
Selain itu, NVIDIA juga mengumumkan, secara resmi open source seperangkat alat Skills (keterampilan) AI fisik, mencakup skenario inti seperti robot, kendaraan otonom, AI visual, dan digital twin industri.
Yang disebut "keterampilan" dapat dipahami sebagai cara standar penggunaan platform NVIDIA sendiri seperti Cosmos, Omniverse, Isaac, Metropolis yang dibakukan, kemudian ditulis menjadi instruksi operasi yang dapat langsung dipahami dan dieksekusi oleh agen cerdas, instruksi-instruksi ini dibuka sumber secara paket, itulah alat yang dirilis kali ini.
Ketika agen cerdas menerima tugas, misalnya menghasilkan sejumlah data pelatihan untuk mendeteksi cacat, ia tahu model mana yang harus dipanggil, format apa yang dihasilkan, bagaimana memverifikasi hasil, seluruh proses berjalan otomatis, tidak perlu orang mengoperasikan setiap tautan langkah demi langkah.
Mengupgrade Penyimpanan AI: Dari "Berjalan Cepat" ke "Dapat Dikelola"
Pada GTC Maret di San Jose, NVIDIA merilis Vera BlueField-4 STX, saat itu Jensen Huang menekankan pada "arsitektur penyimpanan asli AI", titik jual intinya adalah menyediakan dukungan penyimpanan KV Cache kinerja tinggi untuk penalaran konteks panjang agen cerdas.
Sekarang, NVIDIA mengumumkan penambahan seperangkat kemampuan keamanan berdasarkan STX, fokus berubah dari "kinerja penyimpanan" menjadi "keamanan penyimpanan".
Logika dan pemikiran inti di sini, adalah karena latar belakang perubahan cara penggunaan AI perusahaan. Sekarang banyak perusahaan secara aktif menyebarkan agen cerdas, ketika Agent terhubung ke sistem perusahaan, terus membaca dan menulis, berbagi informasi antar sistem dalam keadaan tanpa pengawasan langsung – siapa yang mengakses data apa, apakah melebihi kewenangan, apakah ada kebocoran, semua ini adalah masalah yang merepotkan perusahaan.
Solusi NVIDIA adalah, menambahkan lapisan kemampuan keamanan di atas penyimpanan yang dipercepat – mengandalkan satu set perangkat lunak keamanan NVIDIA DOCA yang terpadu, serta kebijakan yang dieksekusi secara keras langsung di dalam chip BlueField-4, platform berbasis STX dapat memeriksa dan mengelola interaksi antara agen, data, dan memori konteks secara real-time, membantu perusahaan mencapai pelaksanaan kebijakan berkelanjutan pada jalur data AI.
Jensen Huang menjelaskan: "Agen cerdas mengubah data perusahaan menjadi sistem yang hidup dan real-time, dan sistem ini harus dilindungi di tempat data bergerak, tempat konteks disimpan, dan tempat agen bertindak. Yang ingin dilakukan Vera BlueField-4 STX adalah, dengan desain yang aman secara alami, mengeksekusi kepercayaan dengan kecepatan AI di dalam chip".
"Saling Menjadi Pemasok" dengan TSMC
Dalam konferensi kali ini, satu poin yang sangat menarik adalah kerja sama NVIDIA dan TSMC – saat ini, TSMC sedang menggunakan teknologi NVIDIA untuk meningkatkan waktu perputaran, efisiensi energi, hasil, dan produktivitas operasional pabrik wafer mutakhir.
Hubungan TSMC dan NVIDIA, tiga puluh tahun terakhir hanya memiliki satu bentuk: TSMC membantu NVIDIA membuat chip. Tetapi sekarang, peran telah berubah secara halus, NVIDIA mulai membantu TSMC "mengelola pabrik".
Jensen Huang menyatakan: "NVIDIA dan TSMC telah bekerja sama hampir tiga puluh tahun, terus mendorong batas komputasi. TSMC sedang membawa AI dan komputasi akselerasi NVIDIA ke dalam internal pabrik wafer, melalui simulasi, optimasi, dan AI untuk menghadapi tantangan desain dan manufaktur paling kompleks di dunia, untuk meningkatkan kecepatan, efisiensi, dan hasil chip generasi berikutnya."
Hubungan keduanya, dari hubungan klien-pemasok satu arah, menjadi saling ketergantungan dua arah.
Kesimpulan
Melihat kembali konferensi peluncuran ini, NVIDIA sedang menyusun cetak biru baru di sekitar "Agent".
CPU Vera menjadwalkan tugas untuk Agent, Vera Rubin menyediakan daya komputasi untuk Agent, BlueField-4 STX menjaga keamanan data untuk Agent, Cosmos 3 memungkinkan Agent memahami dunia fisik, Nemotron+NemoClaw+OpenShell memungkinkan Agent dapat diatur, dipanggil, dibatasi, DGX Station for Windows membawa Agent ke desktop karyawan perusahaan, H2 Plus memberikan tubuh pada Agent, DSX dan Skills memungkinkan semua ini diproduksi massal dan disebarluaskan secara massal.
Dari sudut pandang ini, Jensen Huang mencoba menggambarkan era komputasi baru. Ini juga sesuai dengan yang disebutkannya di pembukaan "Era Agent AI dan kecerdasan buatan praktis telah tiba".
Intinya, apa yang ingin diceritakan Jensen Huang kali ini adalah satu hal: ketika Agent menjadi infrastruktur AI, setiap lapisan dapat memiliki NVIDIA.











