Disusun & Dikompilasi: TechFlow
Tamu: Huang Renxun, CEO Nvidia
Sumber Podcast: Bonnie Blockchain
Judul Asli: 7 Poin Inti Pidato GTC Taipei 2026 Huang Renxun, Paket Pemalas untuk Strategi Terbaru Nvidia!【Bonnie Blockchain】
Tanggal Tayang: 2 Juni 2026
Ringkasan Poin
Dalam pidato GTC Taipei 2026, Huang Renxun memusatkan strategi tahap berikutnya Nvidia pada satu penilaian inti: AI telah berpindah dari menghasilkan konten ke era agen yang mampu bekerja. Token tidak lagi sekadar indikator teknis, melainkan unit produksi pendapatan, laba, dan PDB. Terkait perubahan ini, Nvidia meluncurkan Vera Rubin, CPU Vera, toolkit agen tingkat perusahaan, PC generasi baru hasil kolaborasi dengan Microsoft, serta Cosmos 3, Alpamayo 2, dan Isaac GR00T untuk AI fisik. Huang Renxun menekankan bahwa model komputasi satu dekade mendatang akan dibentuk bersama oleh model, kerangka kerja agen, keterampilan alat, dan runtime, dan akan menyebar dari cloud, perusahaan, PC lokal, hingga robot, pabrik, satelit, dan perangkat edge. Bagi rantai pasok Taiwan, ini berarti bahwa pabrik AI, efisiensi daya, kecepatan pengiriman infrastruktur, dan kemampuan kolaborasi full-stack akan menjadi kunci pertumbuhan industri pada gelombang berikutnya.
Kutipan Pandangan Menarik
Kedatangan Era Agen AI
- "AI yang berguna telah tiba. AI sekarang adalah generator laba dan juga generator PDB. Di baliknya bukan hanya model bahasa besar, melainkan sebuah model komputasi baru: agen."
- "Agen terdiri dari model bahasa besar dan kerangka kerja agen. Kerangka kerja menghubungkan memori, alat, penalaran, perencanaan, dan tindakan seperti sistem operasi."
- "Terobosan sistem agen berasal dari kemampuan model bahasa besar untuk berpikir, bernalar, merencanakan, dan menggunakan alat, serta dari kemampuan kerangka kerja agen untuk mengelola memori, mengoordinasikan proses, dan menjadwalkan alat."
- "Setiap perusahaan akan menjadi perusahaan agen. Di dalam setiap perusahaan akan berjalan agen, dan setiap perusahaan akan membutuhkan sistem operasi agennya sendiri."
Token, Pabrik AI, dan Ekonomi Infrastruktur
- "Token sekarang adalah unit pendapatan yang menghasilkan laba. Perusahaan AI yang ingin memproduksi lebih banyak Token akan membangun lebih banyak pabrik AI, inilah alasan lonjakan permintaan komputasi Taiwan."
- "Komputasi adalah pendapatan, komputasi adalah laba. Tanpa pendapatan dan laba, itu adalah kerugian."
- "Jika sebuah pabrik AI hanya memiliki daya listrik 1 gigawatt, maka batas atas daya adalah 1 gigawatt. Dalam premis ini, throughput per watt adalah pendapatan, karena setiap Token memiliki nilai."
- "Memilih arsitektur yang salah hanya karena chipnya lebih murah tidak akan diterjemahkan menjadi keuntungan nyata. Anda perlu memastikan pendapatan per watt. Semakin banyak Anda beli, semakin banyak Anda untung."
Vera Rubin dan Transformasi Infrastruktur Nvidia
- "Vera Rubin bukan sebuah chip, bukan hanya GPU, melainkan sebuah sistem lengkap yang dibangun dari ujung ke ujung."
- "Nvidia dulunya adalah perusahaan GPU, kemudian menjadi perusahaan sistem, dan sekarang lebih lanjut berubah menjadi perusahaan infrastruktur, membantu klien membangun pabrik AI."
- "Vera Rubin adalah proyek rekayasa paling ambisius dalam sejarah Nvidia. Seluruh 40.000 insinyur perusahaan terlibat di dalamnya, dan rantai pasok Taiwan juga berpartisipasi dalam penciptaan sistem ini."
- "Grace Blackwell dibuat untuk menangani AI, terutama inferensi. Vera Rubin dibuat untuk menjalankan agen."
CPU Vera dan Kebutuhan Komputasi Agen
- "Semua CPU sebelumnya dibuat untuk manusia. CPU ini dibuat untuk agen."
- "Agen tidak sabar. Dunia mereka bukan diukur dalam detik, melainkan dalam nanodetik. Saat agen menggunakan alat, mereka ingin respons secepat mungkin; saat mengakses database, mereka ingin hasil segera kembali."
- "CPU Vera dibuat untuk agen. Ia menekankan kinerja single-thread, instruksi per clock cycle, bandwidth per inti, dan bandwidth total sistem."
- "Pasar ini pasti akan lebih besar dari pasar sebelumnya karena jumlah agen akan jauh melebihi jumlah manusia, dan agen sangat tidak sabar. Inilah NVIDIA Vera CPU."
Komputer Pribadi Generasi Berikutnya
- "Model komputasi agen masa depan akan berjalan di cloud AI, di dalam perusahaan, dan juga di PC Anda."
- "Sistem operasi baru akan menjadi sistem operasi tradisional ditambah model bahasa besar. Dalam banyak hal, model bahasa besar adalah versi modern DirectX, ekstensi kecerdasan komputer."
- "Aplikasi akan digantikan oleh runtime agen. Aplikasi modern akan menjadi sebuah agen."
- "Nvidia dan Microsoft sedang menciptakan ulang PC, dan meluncurkan mesin Windows generasi baru yang mencakup desktop, laptop, dan workstation."
AI Fisik, Kendaraan Otonom, dan Robot
- "Model bahasa dilatih dengan data dari perspektif manusia, tetapi robot perlu memahami dunia dari perspektif robot itu sendiri. Masalah terbesar AI fisik adalah data."
- "Cosmos 3 adalah model dasar terdepan untuk AI fisik. Ia dapat memahami, bernalar, menghasilkan, simulasi loop tertutup, bahkan menjadi strategi itu sendiri."
- "Setelah ada AI, komputasi itu sendiri juga akan menjadi data. Cosmos 3 dapat digunakan untuk melatih lebih banyak model AI, dan meningkatkannya menjadi model khusus sendiri."
- "Baik itu agen cloud, agen PC, sistem kendaraan otonom, atau robot humanoid, model komputasi di baliknya adalah sama: model, kerangka kerja, keterampilan alat, dan runtime."
Jajanan Taiwan Pilihan Huang Renxun Menjadi Rantai Pasok AI
Huang Renxun:
Ekosistem Taiwan berkembang hingga skala seperti sekarang ini, benar-benar sulit dipercaya. Kebanyakan orang, ketika membicarakan ekosistem, pertama-tama memikirkan tumpukan perangkat lunak kami, memikirkan ekosistem pengembang di atas sistem komputasi Nvidia. Tetapi ekosistem Nvidia tidak berhenti di situ. Ekosistem ini membentang ke atas hingga rantai pasok Taiwan, tempat semuanya dimulai; dan membentang ke bawah hingga pusat data, akhirnya mencapai pengguna akhir.
Hari ini, kami hampir akan membicarakan setiap bagian dari ekosistem ini. Ada terlalu banyak orang yang patut diucapkan terima kasih. Saya mencintai ekosistem di sini. Ada sangat banyak perusahaan, dan juga banyak mitra ekosistem favorit saya. Taiwan memiliki ekosistem yang sangat kaya. Ini adalah ekosistem rantai pasok terbaik di dunia.
Era Agen AI Tiba
Huang Renxun:
Dua tahun lalu ketika saya datang ke sini, saya mulai berbicara dengan semua orang tentang bagaimana AI berkembang dari AI generatif ke gelombang berikutnya, yaitu AI agen. Hari ini kami dapat mengatakan, AI agen telah tiba, AI yang berguna telah tiba.
Dari perspektif industri, ini berarti permintaan Token menjadi sangat tinggi. Karena jika AI benar-benar dapat melakukan pekerjaan, orang akan ingin memproduksi lebih banyak kemampuan seperti itu. Token sekarang adalah unit yang menghasilkan laba, unit yang dapat menghasilkan pendapatan. Karena dapat menghasilkan uang, perusahaan AI akan ingin membangun lebih banyak Token, menghasilkan lebih banyak Token, membangun lebih banyak pabrik AI, dan inilah alasan lonjakan permintaan komputasi Taiwan.
Inilah alasan semua orang sangat sibuk, dan kinerja bisnis sangat baik. Bahkan, ini tampaknya tercermin dalam harga saham beberapa perusahaan Anda. Model komputasi telah berubah, segalanya berubah.
Poin pertama: AI yang berguna telah tiba. AI sekarang adalah generator laba dan juga generator PDB. Di baliknya, ada model komputasi yang sama sekali baru. Ini bukan hanya model bahasa besar, melainkan agen. Hampir semua yang kami bicarakan hari ini akan dibangun di atas dasar ini.
Izinkan saya meluangkan sedikit waktu untuk menjelaskan apa yang saya maksud. Di sini ada sebuah agen, sebuah aplikasi agen. Dulu, di sini akan ada aplikasi, adalah kode, adalah sistem operasi. Kode dalam aplikasi berjalan di atas sistem operasi. Hari ini, ia adalah agen, terdiri dari satu atau lebih model bahasa besar, dan ditempatkan dalam sebuah kerangka kerja agen. Kerangka kerja ini akan membantunya mengoordinasikan pekerjaan, membuatnya benar-benar menyelesaikan tugas yang produktif.
Saat input masuk ke sistem, agen harus memahami, mengamati, bernalar, bertindak, dan menggunakan alat. Alat bisa berupa spreadsheet, browser web, mesin pemrosesan data, atau juga mesin database. Setiap aliran informasi, apakah memproses konteks, memahami apa yang sedang terjadi, menalar apa yang harus dilakukan selanjutnya, atau membentuk rencana yang dapat dieksekusi, perlu dikoordinasikan oleh suatu perangkat lunak.
Jadi, inti dari agen adalah sistem seperti ini. Ia memproses memori jangka pendek, yaitu memori kerja, juga memproses memori jangka panjang, seperti manusia. Sistem manajemen memori menjadi sangat penting. Seluruh sistem ini disebut agen. Model bahasa besar bertanggung jawab untuk berpikir, kerangka kerja agen menghubungkan semuanya, seperti sistem operasi.
Ini adalah model komputasi baru, dan juga alasan agen dapat menyelesaikan tugas-tugas yang menakjubkan. Ini adalah terobosan besar: model bahasa besar sudah dapat berpikir, bernalar, merencanakan, dan menggunakan alat dengan baik; pada saat yang sama, kami juga memiliki kerangka kerja agen yang dapat mengelola memori, mengoordinasikan proses, dan memanggil alat. Oleh karena itu, kami sekarang dapat melakukan banyak hal yang tidak dapat dilakukan sebelumnya.
Apakah Token dari Pabrik AI Itu?
Huang Renxun:
Token, DSX, GPU, CPU, Vera... Kami telah menciptakan sistem generasi berikutnya Vera Rubin. Vera Rubin bukan sebuah chip, bukan hanya GPU. Dimulai dari GPU, tetapi jauh lebih dari GPU. Sistem lengkap dari ujung ke ujung, itulah Vera Rubin.
Ia mencakup GPU, NVLink 72 Vera Rubin, dan dikoordinasikan oleh CPU Vera yang akan saya perkenalkan nanti. Ia juga mencakup sistem penyimpanan Vera yang revolusioner, CX9, tumpukan perangkat lunak kami DOCA, serta prosesor keamanan bawaan. Semua data dalam sistem, baik yang disimpan secara statis, selama transmisi, atau sedang digunakan, akan dienkripsi. Seluruh sistem aman karena model AI sangat berharga. Inilah alasan seluruh sistem mengikuti komputasi rahasia.
Salah satu dari sistem ini saja, jika diambil secara terpisah, sudah cukup menjadi revolusi lengkap. Vera Rubin adalah proyek rekayasa paling ambisius dalam sejarah Nvidia. Seluruh 40.000 insinyur perusahaan terlibat dalam pekerjaan Vera Rubin, apalagi semua yang hadir di sini juga berpartisipasi dalam penciptaan seluruh sistem. Vera Rubin benar-benar sebuah keajaiban. Ia bukan hanya sebuah chip, melainkan sistem yang terdiri dari banyak komponen.
Bahkan lebih dari itu. Dahulu kala, Nvidia adalah perusahaan GPU; dalam beberapa tahun ini, kami secara bertahap berkembang menjadi perusahaan sistem. Yang Anda lihat sekarang adalah sistem paling kompleks yang pernah kami desain dari nol. Namun pada akhirnya, klien dan mitra kami tidak ingin membeli komputer, mereka ingin membangun pabrik AI.
Inilah alasan Nvidia sekali lagi mulai bertransformasi. Semua orang dapat melihat bahwa banyak teknologi kami telah berkembang hingga skala infrastruktur lengkap. Mitra kami juga berada pada skala infrastruktur: pembangkit listrik, sistem pendingin, pemasok jaringan listrik, dan banyak perusahaan industri, sekarang menjadi bagian dari ekosistem kami. Pada akhirnya, kami ingin membangun tumpukan teknologi lengkap, seperti saat membangun GPU, Grace Blackwell, NVLink 72; sekarang, kami ingin membangun sistem full-stack, memungkinkan klien membangun infrastruktur AI yang luar biasa.
Melakukan ini dengan baik, membantu klien membangun dan menerapkan pabrik AI, menjadi sangat penting. Alasannya sederhana: Komputasi adalah pendapatan, komputasi adalah laba. Tanpa pendapatan dan laba, itu adalah kerugian.
Semua orang perlu memahami satu hal: ketika satu set infrastruktur AI diluncurkan, ia dapat diluncurkan dengan cepat, atau memakan waktu lama; throughput dapat tinggi, atau rendah; elastisitas dan keandalan dapat baik, atau buruk; masa pakai efektif dapat panjang, atau pendek. Karena ini mewakili investasi sebesar 50 miliar, 60 miliar, bahkan 100 miliar dolar, kurva ini sangat penting.
Inilah alasan Nvidia adalah mitra yang baik. Kami memiliki kemampuan integrasi lengkap. Bukan hanya membuat satu slide presentasi, melainkan benar-benar menciptakan seluruh infrastruktur, menghubungkan segalanya, dan membangun sendiri dalam skala besar, memastikan sistem dapat berjalan dengan baik. Oleh karena itu, waktu Token pertama kami, waktu inferensi pertama kami, waktu peluncuran pelatihan kami lebih cepat.
Kedua, throughput per watt kami, jumlah Token per watt kami adalah kelas dunia. Alasannya adalah kami mengintegrasikan segalanya, mendesain segalanya dari nol, mensimulasikan seluruh sistem, dan mengadopsi desain bersama yang ekstrem. Seperti rak Vera Rubin yang baru saja ditampilkan, semuanya dirancang untuk mencapai throughput yang menakjubkan.
Jika pusat data Anda, pabrik Anda memiliki daya listrik 1 gigawatt, maka tidak akan ada lagi lebih dari itu, ini adalah seluruh kapasitas pembangkit listrik yang dapat Anda peroleh. Dengan daya 1 gigawatt, throughput per watt adalah pendapatan, karena setiap Token dapat menghasilkan laba, setiap Token adalah pendapatan.
Inilah masa depan. Komputasi adalah pendapatan, kinerja per watt adalah pendapatan Anda. Memilih arsitektur yang salah hanya karena chipnya lebih murah tidak akan diterjemahkan menjadi keuntungan nyata. Anda perlu memastikan pendapatan per watt. Semakin banyak Anda beli, semakin banyak Anda untung.
Saya sekarang berdiri di hadapan semua orang, dapat mengatakan kepada semua orang: Vera Rubin telah memasuki produksi penuh. Skala rantai pasok yang kami bangun untuk Vera Rubin adalah dua kali lipat dari Grace Blackwell. Dulu merakit satu rak Grace Blackwell membutuhkan dua jam, sekarang hanya perlu lima menit. Jadi tidak hanya kapasitas produksi lebih tinggi, throughput produksi juga jauh lebih cepat, dan kami membutuhkan semua ini untuk memenuhi permintaan.
Ekosistem ini luar biasa. Untuk mendukung Grace Blackwell, dan mempersiapkan peningkatan Vera Rubin, jutaan kaki persegi kapasitas telah diluncurkan. Saya ingin mengucapkan terima kasih kepada semua orang. Vera Rubin telah memasuki produksi penuh. Terima kasih.
Pengenalan Sistem Vera Rubin
Huang Renxun:
Vera Rubin tidak hanya dibangun untuk AI. Vera Rubin tidak hanya dibangun untuk menjalankan AI, ia dibangun untuk menjalankan agen. Ini adalah sistem agen. Bayangkan kompleksitas di dalamnya. Dan justru karena itu, agen adalah terobosan terakhir dalam ilmu komputer. Dibutuhkan waktu bertahun-tahun untuk akhirnya mewujudkan potensinya dan menjadi berguna. Komputer yang dapat menjalankannya seharusnya juga yang paling maju di dunia.
Inilah Vera Rubin. Mari kita lihat. Tolong bawakan Vera Rubin.
Ini Vera Rubin, NVLink 72 Vera Rubin. Ini adalah bagian dari sistem generasi berikutnya. Di GTC berikutnya, saya akan berbicara lebih banyak dengan semua orang; hari ini masih banyak konten yang harus dibicarakan. Ini adalah rak CPU Vera, 256 CPU, semuanya pendingin cair. Saya akan memperkenalkan Vera nanti. Ini adalah sistem pemrosesan penyimpanan BlueField Vera, juga sistem keamanan. Tentu saja, ada jaringan Mellanox kami, ini adalah CPO pertama di dunia. Inilah Vera Rubin, kombinasi teknologi yang menakjubkan.
Saat kami menciptakan Hopper dulu, itu untuk pra-pelatihan. Pra-pelatihan adalah aplikasi terpenting saat itu, dan juga beban kerja terpenting yang kami hadapi. Kemudian saat menciptakan Grace Blackwell, semua orang berkata: "Jensen, Nvidia sangat ahli dalam pra-pelatihan, inferensi sederhana." Ingatkah semua orang? Saat itu banyak orang berkata: "Inferensi sederhana, kami juga bisa melakukannya."
Tapi semua orang tahu, inferensi sama dengan uang. Model sangat kompleks, sangat sulit untuk mencapai keunggulan secara bersamaan dalam kecepatan respons yang sangat tinggi, interaksi cepat, dan throughput tinggi. Inilah alasan kami menciptakan NVLink 72.
Hari ini, biaya Token Nvidia adalah yang terendah di dunia. Bukan 10% lebih rendah, melainkan beberapa kali lipat lebih rendah, bahkan perbedaan orde besarnya. Semua ini karena kami melakukan desain bersama yang ekstrem, karena kami memahami model komputasi dan pola komputasi inferensi, dan menciptakan NVLink 72.
Sampai Vera Rubin, hal ini telah melampaui inferensi. Sekarang adalah inferensi dalam sistem agen. Inilah Vera Rubin. Tanpa kabel, tanpa selang, tanpa kipas. Terakhir kali saya menunjukkannya kepada semua orang, kabel ada di mana-mana.
CPU VERA: CPU untuk Agen AI
Huang Renxun:
CPU Vera, dibuat untuk era AI. Sampai saat ini, semua CPU dibuat untuk manusia. Kami dulunya adalah pengguna, juga penyewa. Cara manusia menggunakan CPU adalah hidup dalam dunia yang diukur dalam detik. Kami menyewa CPU di cloud, semakin banyak inti CPU, semakin banyak sumber daya yang dapat disewakan. Skenario penggunaan dan ekonomi CPU lama, sangat berbeda dengan agen.
Agen tidak sabar. Dunia mereka bukan diukur dalam detik, melainkan dalam nanodetik. Saat agen menggunakan alat, mereka ingin respons secepat mungkin; saat mengakses database, mereka ingin hasil segera kembali. Setiap agen menunggu sebentar, akan terhambat untuk melangkah ke tahap berikutnya, dan seterusnya. Oleh karena itu, kami harus membuat CPU dengan latensi serendah mungkin, dengan interaktivitas setinggi mungkin.
Inilah alasan kami menciptakan CPU Vera untuk era AI. Dalam sistem kami, ia memiliki tiga kegunaan. Pertama tentu saja untuk berpikir di dalam Vera Rubin. Di dalam rak Vera Rubin, sudah ada dua CPU. Semua orang tahu, kami sedang memproduksi dan menjual jutaan Vera Rubin, dan juga telah menjual jutaan Grace Blackwell. Nvidia sudah menjadi salah satu produsen CPU terbesar di dunia.
Dua CPU di rak Vera Rubin, salah satunya digunakan untuk mengoordinasikan dan mengelola GPU, mengelola cache KV, dan memproses berbagai perangkat lunak yang berjalan di rak. Kami juga memiliki Grace BlueField, untuk keamanan dan isolasi. Bagian komputasi Vera digunakan untuk kerangka kerja agen, bertanggung jawab atas koordinasi model AI, penggunaan alat, dan akses database.
Server data di sini adalah BlueField Vera, ini adalah server penyimpanan dan sistem penyimpanan tercepat di dunia. Sangat penting karena agen akan mengakses memori dengan kecepatan sangat tinggi. Server penyimpanan dan CPU sekarang berada di jalur kritis bagian paling mahal dari pusat data.
Alasan mengapa ini paling mahal, ada alasan yang kuat. Inti ekonomi pabrik AI adalah Token, dan Token diciptakan di sini. Jadi, tentu saja Anda ingin memproduksi dan menghasilkan Token sebanyak mungkin. Nilai ekonomi terkonsentrasi di sini, dan CPU serta sistem penyimpanan tidak boleh menjadi hambatan.
Oleh karena itu, CPU Vera memberikan tekanan besar pada arsitektur CPU, dan inilah alasan kami membangun arsitektur baru dari nol. Ini adalah CPU yang belum pernah dilihat dunia sebelumnya, kami menyebutnya Vera. Ini adalah CPU yang dibuat untuk agen. Semua CPU sebelumnya dibuat untuk manusia, CPU ini dibuat untuk agen.
Pertama, instruksi per clock cycle Vera harus sangat kuat, karena kami perlu memperpendek latensi, memperpendek waktu pemrosesan. Yang kami inginkan adalah kinerja single-thread, bukan sekadar throughput. Kinerja single-thread harus kelas dunia, harus yang terbaik. Jadi IPC Vera sangat tinggi, level tertinggi di dunia: mengambil, mendekode, dan mengeksekusi 10 instruksi per clock cycle.
Kedua, bandwidth yang dibutuhkan CPU untuk masuk dan keluar data harus mencapai kelas dunia. Di sini termasuk bandwidth per inti, juga bandwidth total. Seperti yang saya katakan sebelumnya, sistem agen pada dasarnya terpisah dan terdistribusi. Saat komputasi terpisah dan diterapkan secara terdistribusi, jaringan menjadi masalah. Oleh karena itu, kami harus memindahkan data secepat mungkin antar inti CPU, antara CPU dan penyimpanan, antara CPU dan GPU.
Bandwidth di sekitar sistem dan di dalam inti CPU harus mencapai kelas dunia, karena inti CPU saling berkomunikasi dengan bandwidth sangat tinggi. Mereka tidak disewakan satu per satu inti, melainkan semua bekerja sama. Bandwidth penampang Vera sangat menakjubkan. Ini adalah sistem pertama yang mendukung PCI Express Gen 6, juga pertama dilengkapi LPDDR5, bandwidth mencapai 1,2 hingga 2 TB per detik, 2 hingga 3 kali lipat dari CPU kinerja tertinggi.
Ini adalah CPU yang dibuat untuk agen. Pasar ini pasti akan lebih besar dari pasar sebelumnya karena jumlah agen akan jauh melebihi jumlah manusia, dan agen sangat tidak sabar. Inilah NVIDIA Vera CPU.
Model Komputasi Terpenting Sepuluh Tahun Mendatang
Huang Renxun:
Ini benar-benar slide terpenting. Kesimpulan inti di sini adalah: inilah model aplikasi sepuluh tahun mendatang, juga model komputasi sepuluh tahun mendatang. Agen, kerangka kerja agen, dan model bahasa besar yang dikoordinasikan oleh kerangka kerja, setiap perusahaan akan menjalankannya. Setiap perusahaan akan menjadi perusahaan agen, di dalam setiap perusahaan akan berjalan agen, setiap perusahaan akan menemukan bahwa agen membutuhkan sistem operasinya sendiri.
Setiap perusahaan bertanya kepada kami: Bagaimana menjalankan agen dengan aman? Bagaimana membangun agen untuk beban kerja sendiri? Jadi, kami memiliki Toolkit Agen AI Perusahaan NVIDIA. Sebenarnya, semua orang telah melihat saya secara terbuka membangunnya langkah demi langkah.
Hampir semua yang dilakukan Nvidia, semua orang tahu, jika melihat kembali pidato GTC saya 5 atau 10 tahun yang lalu, Anda akan melihat saya selama bertahun-tahun membicarakan hal-hal hari ini, karena kami selalu mempersiapkan diri untuk momen ini.
Perusahaan yang ingin membangun agen sebagai layanan, atau membangun agen untuk operasi, membutuhkan empat hal. Pertama, membutuhkan model. Tentu saja, semakin cerdas model bahasa besar semakin baik, semakin murah semakin baik, semakin cepat semakin baik. Kedua, membutuhkan kerangka kerja untuk mengoordinasikan seluruh sistem. Ketiga, model-model ini ingin menggunakan alat, dan alat-alat ini memiliki keterampilan. Saya baru saja menunjukkan pustaka CUDA-X, mereka akan menjadi alat kuat untuk agen di masa depan. Keempat, membutuhkan runtime, yaitu sistem operasi yang menghubungkan segalanya.
Inilah Toolkit Agen NVIDIA. Ia mencakup model yang dapat dimodifikasi, yaitu model sumber terbuka kelas dunia NVIDIA. Saya juga ingin menunjukkan lebih banyak. Anda dapat menjalankan agen dari mana saja, dapat menjalankan agen kuat seperti Claude Code, juga dapat menjalankan agen kuat seperti Codex. Anda dapat memasukkannya ke dalam kerangka kerja bernama Open Shell, berjalan dengan keamanan tinggi di dalam perusahaan.
Shell ini akan melindungi agen, membuatnya selalu terikat oleh kebijakan keamanan. Privasi dilindungi, hak akses dan hak istimewa ditetapkan dengan jelas, identitas juga dilindungi. Oleh karena itu, Open Shell sedang diadopsi secara global. NVIDIA Open Shell adalah sumber terbuka, Anda akan melihat banyak perusahaan mengadopsinya, termasuk Red Hat, Canonical, dan Microsoft. Ia akan diadopsi di mana-mana.
Ini adalah runtime penting, dan runtime ini sepenuhnya dioptimalkan untuk platform AI NVIDIA yang ada di mana-mana. Anda dapat menjalankan Open Shell di cloud apa pun, di lingkungan lokal, bahkan di perangkat. Sekarang, Anda memiliki alat dan pustaka yang dapat digunakan agen, memiliki model yang dapat dimodifikasi atau digunakan langsung, juga memiliki kerangka kerja agen. Kerangka kerja agen ini sekarang dapat berjalan secara lokal atau di tempat lain.
Salah satu kasus penggunaan agen favorit saya adalah perancang chip. Ini adalah salah satu pekerjaan terpenting Nvidia. Oleh karena itu, tentu saja kami harus bekerja sama dengan Cadence, membangun super agen desain chip. Ia dikoordinasikan oleh Codex atau Claude Code, mengambil RTL, diagram arsitektur, skema, atau spesifikasi sebagai input, membantu Anda memperbaiki konten yang perlu diperbaiki. Kami bersama-sama menciptakan beberapa super agen, dan mengoptimalkan Nemotron untuk runtime NVIDIA.
Nvidia berkomitmen untuk membangun model terbuka bagi dunia, memungkinkan Anda, kami semua, menciptakan agen kami sendiri. Hari ini, kami mengumumkan Nemotron 3 Ultra, ini adalah model terbuka generasi berikutnya kami, dan sangat cerdas. Model Nemotron tidak hanya memberi Anda model, tetapi juga semua data yang kami gunakan untuk melatih model.
Karena kami memiliki aliansi mitra yang kuat, semua orang dapat melihat semua mitra yang tercantum di sini. Kami bekerja sama, saling berkontribusi data. Melalui kemitraan hebat ini, dari model hingga skrip pelatihan, hingga data, semuanya akan sepenuhnya terbuka untuk Anda. Ini adalah bentuk kebijakan sistem model terbuka terbaik di dunia. Tujuannya sederhana: Anda dapat mengambil semua konten, terus menambahkannya, membuatnya lebih baik, dan menjadikannya model Anda sendiri.
Nemotron 3 Ultra 5 kali lebih cepat, biaya juga turun 30%, dan sepenuhnya terbuka. Kami sangat teguh tentang ini. Ini adalah Nemotron 3, kami sekarang juga sedang mengembangkan Nemotron 4. Justru toolkit lengkap yang terdiri dari model, kerangka kerja, keterampilan alat, dan runtime ini, memungkinkan setiap perusahaan di dunia menciptakan agen mereka sendiri, seperti Cadence menggunakan super agen.
Komputer Pribadi Generasi Baru NVIDIA
Huang Renxun:
Microsoft dan NVIDIA akan menciptakan ulang PC. Ini akan menjadi PC baru. Besok malam, seharusnya besok malam waktu kami di sini, saya akan bersama Satya, membicarakan lebih banyak pekerjaan yang telah kami lakukan bersama selama tiga tahun terakhir. Microsoft dan NVIDIA menghabiskan waktu begitu lama, sepenuhnya memikirkan ulang cara kerja PC, untuk bersiap menyambut momen ini.
Seperti yang saya sebutkan sebelumnya, model komputasi agen ini akan berjalan di cloud AI, akan berjalan di dalam perusahaan, juga akan berjalan di PC Anda. Ketika PC memiliki agen otonom, apa yang akan terjadi? Ia akan membantu Anda, memahami Anda. Anda dapat berbicara dengannya, ia dapat melihat Anda. Anda dapat memintanya membaca file, membantu Anda melakukan penelitian. Ia juga dapat melakukan lebih banyak hal, nanti saya akan tunjukkan.
Sistem operasi baru, tentu saja sistem operasi lama ditambah model bahasa besar. Dalam banyak hal, model bahasa besar adalah versi modern DirectX. Ia memiliki input dan output, memahami petunjuk, memahami visi komputer, dapat menghasilkan video, juga dapat menghasilkan suara. Ia adalah ekstensi kecerdasan modern PC, juga komputer.
Di atas ini, seperti yang saya katakan sebelumnya, aplikasi akan digantikan oleh runtime agen, dan aplikasi modern adalah agen.
Semuanya, laptop NVIDIA RTX Spark. Terima kasih. Terlalu banyak barang di saku saya. Oke, ini adalah chip paling menakjubkan di dunia. Ini adalah N1X yang kami buat bekerja sama dengan MediaTek. Saya tadi sepertinya melihat Rick. Ini adalah N1X, sebuah chip yang indah. Sejujurnya, ini adalah chip yang membutuhkan 33 tahun untuk dibuat.
Alasannya adalah, 100% tumpukan perangkat lunak NVIDIA dapat berjalan di sini. Anda ingin melakukan biologi digital, tidak masalah; ingin melakukan pemrosesan gempa, tidak masalah; ingin melakukan astrofisika, tidak masalah. Semua yang terkait dengan CUDA, semua fisika, semua biologi, semua genomik, semua AI, tidak ada masalah. Semua grafik komputer, juga tidak masalah.
Setiap aplikasi yang pernah dibuat Nvidia, dan setiap aplikasi yang pernah dijalankan Windows, Microsoft dan NVIDIA telah mengoptimalkannya dengan teliti, membuat komputer ini benar-benar dapat menjalankan semua yang pernah diciptakan dunia. Selain itu, ia sekarang juga dapat menjalankan agen. Ini adalah komputer yang luar biasa, saya sangat bangga dengannya.
Komputer ini dapat memiliki model Nemotron 3 Ultra lokal, atau model super Nemotron 3; juga dapat terhubung ke Claude Code, Codex, atau model lain di cloud; juga dapat terhubung ke model di jaringan. Ia akan bekerja, dan menyelesaikan hal-hal yang menakjubkan. RTX Spark adalah penciptaan ulang laptop, tetapi sebenarnya, Microsoft dan NVIDIA sedang menciptakan ulang seluruh PC.
Hari ini, kami mengumumkan sebuah lini produk baru: tiga mesin Windows revolusioner, mencakup desktop, laptop, dan workstation. Mereka 100% kompatibel dengan Windows, 100% mendukung CUDA, 100% dilengkapi NVIDIA AI Tensor Core. Segala sesuatu yang dapat Anda lihat berjalan di berbagai platform NVIDIA di seluruh dunia, dapat berjalan di sini.
Kami telah menyiapkan roadmap untuk ini. Ini adalah keluarga produk baru. Setiap generasi arsitektur, kami akan memiliki desktop, laptop, workstation; generasi berikutnya masih akan memiliki desktop, laptop, workstation. Saya sangat senang, juga sangat terhormat bahwa 100% industri PC global bergabung dengan kami, bersama-sama menciptakan ulang PC. Ini adalah lini produk baru, juga awal yang baru.
Cosmos 3: Model Dasar untuk AI Fisik
Huang Renxun:
Dalam skenario model bahasa, bahasa Inggris dan berbagai bahasa yang kami latih di internet, semuanya berasal dari perspektif manusia. Mereka ditulis oleh kami, juga dibaca oleh kami. Namun, jika ingin menciptakan data untuk robot AI, harus berasal dari persepsi dan perspektif robot itu sendiri. Mayoritas data video di dunia adalah perspektif orang ketiga, bukan perspektif orang pertama.
Oleh karena itu, untuk sistem agen, sistem robot, dan AI fisik, data adalah masalah paling sulit. Semua orang telah melihat kami mendaki tangga ini. Kami mulai dari teleoperasi, pada dasarnya adalah demonstrasi manusia. Ini tidak berbeda dengan terobosan umpan balik manusia dalam pembelajaran penguatan. Kemudian, kami menggunakan simulasi, di sinilah Omniverse berperan. Ini juga mirip dengan hadiah yang dapat diverifikasi dalam pembelajaran penguatan.
Kami menggunakan sistem ini untuk meluncurkan model AI, meluncurkan model AI fisik. Pada akhirnya, kami dapat belajar dari perspektif orang ketiga, dan memproyeksikannya kembali ke perspektif orang pertama. Melalui proses peluncuran ini, kami akhirnya memiliki model dasar dunia, yang dapat memahami dunia fisik dari perspektif apa pun yang Anda inginkan. Orang ketiga, orang pertama, dari luar ke dalam, dari dalam ke luar, semuanya bisa. Ini benar-benar terobosan besar.
Hari ini, kami mengumumkan Cosmos 3. Cosmos 3 adalah garis depan AI fisik. Kami berada di garis depan dalam model bahasa, banyak orang juga meneliti model bahasa. Tetapi dalam AI fisik, kami pasti yang terkuat di dunia. Saya sangat bangga tim dapat melakukan ini.
Ini adalah model dasar untuk semua pekerjaan Anda. Apakah Anda ingin menciptakan robot, robot pabrik, atau robot yang bekerja di pabrik, selama melibatkan dunia fisik, Anda sekarang memiliki mitra: Cosmos 3. Ia dapat memahami dan bernalar, dapat menghasilkan, dapat mensimulasikan dalam loop tertutup, bahkan dapat menjadi strategi itu sendiri. Ia berada di posisi terdepan di berbagai daftar peringkat global. Saya sangat bangga dengan Cosmos. Hari ini, kami mengumumkan Cosmos 3.
Dulu adalah data ditambah komputasi menghasilkan AI. Sekarang kami memiliki AI, komputasi juga akan menjadi data. Jadi, gunakan Cosmos 3, latih sejumlah besar model AI. Cosmos adalah sistem model terbuka yang sangat luar biasa, sepenuhnya sama dengan Nemotron. Kami membuka model, membuka data, bahkan membuka metode pelatihan, memungkinkan Anda meningkatkannya untuk diri sendiri, dan mengubah Cosmos menjadi model khusus Anda.
Alpamayo 2: Inferensi Kendaraan Otonom
Huang Renxun:
Hari ini, kami mengumumkan Alpamayo 2, ini adalah model terbuka untuk mobil self-driving. Kami sedang bekerja sama dengan perusahaan mobil global. Jika melihat merek-merek yang telah bergabung dengan NVIDIA Hyperion, sedang membangun mobil NVIDIA Hyperion, mereka mewakili sekitar 80% mobil global. Artinya, produsen ini mencakup sekitar 80% mobil global.
Akan ada banyak sistem NVIDIA Hyperion di masa depan, mereka dapat menjalankan Alpamayo, juga dapat menjalankan tumpukan teknologi self-driving lainnya. Kami juga terhubung ke layanan mobilitas. Sekitar 97% layanan mobilitas global sedang terhubung dengan kami. Oleh karena itu, ketika kami menempatkan Alpamayo di runtime Hyperion dan sistem operasi Halos, kami dapat terhubung dengan layanan-layanan global ini.
Isaac GR00T: Robot Humanoid
Huang Renxun:
NVIDIA Isaac GR00T adalah tumpukan teknologi robot humanoid kami, mencakup model, pembuatan data, simulasi, runtime, serta sistem operasi. Ia mewakili platform GR00T, yaitu platform Isaac GR00T.
Semua orang dapat melihat, setiap sistem kami mengikuti pola yang persis sama: apakah itu sistem agen di cloud, sistem agen di PC, sistem robot mobil self-driving, atau sistem robot humanoid, semuanya adalah pola yang sama.
Tentu saja, dalam setiap kasus, kami akan membangun segalanya dengan lengkap. Kami melakukan integrasi vertikal, melakukan integrasi menyeluruh, mengadopsi desain bersama dan desain bersama ekstrem, kemudian membukanya, memungkinkan setiap orang menggunakan bagian mana pun sesuai kebutuhan mereka. Anda ingin menggunakan apa, kami bahkan akan membantu Anda memodifikasinya.
Tapi sekarang masih kurang satu hal: sistem robot membutuhkan platform referensi. Sistem robot ini terlalu kompleks, memiliki banyak motor dan sensor, juga sangat rapuh. Namun, kami membutuhkan cara untuk mengirimkan platform referensi ini. Seperti yang kami lakukan untuk PC, DGX, cloud, dan mobil self-driving, sekarang kami juga akan melakukannya untuk robot.
Hari ini, kami mengumumkan NVIDIA Isaac GR00T, ini adalah platform referensi robot humanoid yang sepenuhnya terintegrasi. Ia memiliki 25 derajat kebebasan di setiap tangan, 31 derajat kebebasan di badan robot, tinggi 6 kaki, berat 150 pon. Seperti saya, hanya angka pertama lebih kecil dari saya, angka kedua lebih besar dari saya, selain itu kurang lebih sama.
Platform ini menjalankan Thor baru, serta tumpukan perangkat lunak lengkap kami, tumpukan pembuatan data, tumpukan simulasi data, dan runtime. Semuanya diintegrasikan ke dalam satu platform robot, untuk digunakan semua orang. Kami membuatnya untuk pendidikan tinggi dan peneliti universitas, karena bagi mereka, membangun platform seperti ini sendiri terlalu sulit.
Ringkasan Tinjauan
Huang Renxun:
Enam bulan terakhir, industri komputer telah benar-benar berubah. Alasan perubahan terjadi adalah karena agen akhirnya diwujudkan, dan bertemu dengan model terdepan terbaru, membuat AI sekarang dapat benar-benar melakukan pekerjaan yang berguna.
Model komputasi ini akan berulang lagi dan lagi: sebuah agen terdiri dari model dan kerangka kerja, menggunakan alat dengan keterampilan, dan berjalan di atas runtime tertentu. Runtime tergantung pada apakah ia berada di cloud, lingkungan perusahaan lokal, PC, atau robot. Tetapi model komputasi persis sama.
Anda akan menggunakan kerangka kerja berbeda sesuai preferensi Anda, juga akan menggunakan model berbeda sesuai preferensi Anda. Anda akan memperbaikinya untuk penggunaan khusus Anda sendiri. Anda akan menciptakan super agen, menyewakannya kepada orang lain, membantu orang lain menyelesaikan pekerjaan. Platform agen ini, pola agen ini, persis yang didukung oleh Toolkit AI Perusahaan NVIDIA. Bagi Anda, ini adalah cara yang baik untuk berpartisipasi dalam AI; bagi kami, ini juga adalah peluang pertumbuhan yang besar.
Vera Rubin telah memasuki produksi penuh. Grace Blackwell dibuat untuk menangani AI, terutama inferensi; Vera Rubin dibuat untuk menjalankan agen. Ia telah memasuki produksi penuh. Ia jauh lebih dari sekadar GPU, melainkan seluruh sistem pemrosesan agen yang terpisah dan terdistribusi.
Nvidia telah benar-benar menjadi perusahaan infrastruktur. Bukan hanya perusahaan GPU, bukan hanya perusahaan sistem, melainkan perusahaan infrastruktur. Tujuan kami adalah membantu Anda menciptakan pendapatan terbesar, laba terbesar, dan melakukannya secepat mungkin.
Dalam dunia agen, cara komputasi baru ini berarti CPU juga harus dibangun untuk agen, bukan untuk manusia. CPU yang dibangun untuk agen memiliki kebutuhan khususnya sendiri. NVIDIA Vera kami adalah sebuah revolusi. Saya senang melihat peningkatan dan pesanannya, ia akan menjadi peluncuran produk tercepat dan paling sukses dalam sejarah Nvidia.
NVIDIA dan Microsoft telah menciptakan lini produk PC baru. Ini adalah awal baru. Tentu saja, pola pemrosesan agen yang sama, model komputasi agen yang sama yang saya jelaskan tadi, juga akan berjalan di berbagai perangkat. Saya menyebutkan PC, tetapi di masa depan ia akan muncul di robot, satelit, stasiun pangkalan, pabrik, cloud, lokal, perangkat edge. Sistem AI agen dan model komputasi agen ini akan terus direplikasi di berbagai komputer. Pemahaman kami tentang komputer pribadi kemungkinan akan berubah.








