Pekan ini, kabar yang tidak terlalu besar namun tidak kecil juga datang dari Nvidia: CPU generasi baru Vera, yang ditujukan untuk pusat data AI, paling cepat pada bulan Agustus sudah bisa dipesan oleh klien China, dengan harga per unit jauh melebihi dua puluh ribu dolar AS. Satu kabinet berisi 256 chip ini bernilai sekitar sepuluh juta dolar AS. Dilaporkan, sudah ada satu perusahaan layanan cloud besar China yang merencanakan memesan lebih dari tiga ratus server dual-socket terlebih dahulu, masing-masing dilengkapi dengan dua CPU Vera, untuk diuji di pusat data luar negeri sebelum memutuskan apakah akan memesan secara resmi.
Vera adalah CPU independen pertama Nvidia yang dirilis pada Maret tahun ini, dirancang khusus untuk AI agen, berbasis teknologi Arm, diproduksi penuh, dan diklaim kecepatan operasinya 1,8 kali lebih cepat dari prosesor sejenis pesaing. CEO Nvidia Jensen Huang sendiri mengakui bahwa karena faktor-faktor seperti kontrol ekspor chip canggih, pangsa pasar perusahaan di China sebenarnya telah turun drastis. Dalam konteks ini, memasukkan Vera ke dalam sistem pemesanan klien China adalah sebuah langkah bisnis sekaligus upaya untuk membagikan kembali kartu di meja yang hampir habis. Ekspektasi pendapatan Nvidia untuk lini produk Vera pada tahun fiskal ini adalah dua ratus miliar dolar AS.
Namun, jika dibaca dari sisi China, pesan ini memiliki makna lain. CPU Vera ini tetap berbasis arsitektur Arm. Rantai pemesanannya, stabilitas pasokan jangka panjang, dan kekuatan negosiasi harganya semuanya berada di tangan pihak lain.
Ketika infrastruktur AI China menyerap daya komputasi dengan nafsu yang belum pernah terjadi sebelumnya, apakah lapisan CPU harus bertaruh di meja Arm? Selain dua gunung dewasa yang hampir memonopoli, yaitu x86 dan Arm, apakah ada jalur lain yang bisa menahan tarikan Arm sekaligus menopang beban komputasi kinerja tinggi?
Dalam beberapa kunjungan penulis ke berbagai kota di kawasan Delta Sungai Yangtze baru-baru ini, satu nama yang sama berulang kali disebut: RISC-V.
Kedengarannya seperti pernyataan lama, toh RISC-V telah lahir lebih dari sepuluh tahun lalu, dan volume pengiriman di bidang embedded sudah mencapai puluhan miliar unit. Namun, yang benar-benar mendorongnya ke agenda berulang kali dalam satu atau dua tahun terakhir ini bukanlah pangsa pasar embedded, melainkan tanda-tanda bahwa langit-langit di ujung pusat data, server, dan daya komputasi AI terus-menerus didorong ke atas olehnya.
Yang kami coba jawab adalah pertanyaan yang tampak lama, namun sebenarnya baru ini.
Xu Tao, Ketua Dewan Direksi Sifive yang baru saja menjabat sebagai Presiden pertama Aliansi RISC-V Hong Kong, pernah menilai bertahun-tahun lalu bahwa RISC-V berpotensi membagi pasar menjadi tiga bersama x86 dan Arm, dan semuanya bergantung pada usaha manusia: "Cara terbaik untuk memprediksi masa depan adalah dengan menciptakannya."
Jadi, ketika Nvidia mengetuk pintu dengan Vera, apakah CPU buatan China hanya tinggal satu cara hidup: "mengikuti Arm dari belakang"? Apakah jalur lain benar-benar ada, dan ke mana jalur itu menuju.
"Segitiga Mustahil" Menunggu untuk Dipatahkan
Dr. Dai Weimin, pendiri VeriSilicon, dalam konferensi puncak industri tahun lalu, menyajikan dilema seluruh industri sebagai pilihan ganda. Pilihan ganda ini kemudian digunakan oleh industri dan secara bertahap disebut "Segitiga Mustahil" industri CPU.
Tiga sudutnya adalah kemakmuran, kendali, dan kemandirian.
Kombinasi pertama, tidak terkendali namun cukup makmur, adalah x86, ekosistem global terpadat, perangkat lunak terlengkap, kinerja terkuat, tetapi merupakan wilayah pribadi milik orang lain. Kombinasi kedua, yang ingin terkendali, dengan uang yang cukup juga bisa membeli lisensi, bisa dimodifikasi, bisa digunakan, tetapi pada dasarnya tetap arsitektur yang didefinisikan orang lain, tidak bisa disebut benar-benar mandiri. Kombinasi ketiga, mandiri dan terkendali namun pasti tidak cukup makmur, adalah set instruksi pribadi yang didefinisikan sendiri oleh masing-masing perusahaan dengan menutup pintu, secara teknologi bisa berdiri, tetapi secara ekosistem pasti hanya bisa berenang di kolam kecil. Ketiga kombinasi ini masing-masing sesuai dengan situasi saat ini dari x86, jalur lisensi Arm, serta sebagian realitas CPU buatan dalam negeri.
Tiga sudut, hanya bisa menguasai dua selamanya. Ini adalah inti dari segitiga mustahil.
Dan RISC-V ditempatkan Dr. Dai Weimin di luar segitiga. Ia berpendapat bahwa saat ini, satu-satunya jalur yang benar-benar mandiri, terkendali, dan memiliki peluang untuk benar-benar makmur adalah RISC-V.
Alasannya bukan karena hari ini sudah menang, tetapi karena secara struktural memiliki kemungkinan "memiliki ketiganya": set instruksi sumber terbuka dan terbuka berarti tidak ada satu perusahaan pun yang bisa menyumbat leher rantai industri pada satu titik tunggal, filosofi desain modular dan dapat diperluas memungkinkan setiap produsen melakukan diferensiasi padanya, dan sifatnya sebagai standar internasional menentukan bahwa ia memiliki kesempatan untuk menopang ekosistem perangkat lunak yang cukup besar, sama seperti Arm dan x86.
Penilaian ini mendapatkan respons yang cukup konsisten dalam kunjungan penulis. Pada dasarnya diyakini bahwa kontribusi terbesar RISC-V bagi industri bukanlah menciptakan "chip China" lain, melainkan memberikan kartu baru kepada semua orang: parit pertahanan yang digali x86 dan Arm selama puluhan tahun, pada periode jendela saat AI menulis ulang paradigma komputasi, untuk pertama kalinya tampak tidak begitu tak tertembus.
Namun, perlu juga dikatakan. Mematahkan segitiga mustahil adalah sebuah ambisi. Ambisi untuk diwujudkan menjadi keunggulan harus menggigit tulang terkeras: komputasi kinerja tinggi.
Pangsa pasar embedded sudah dikuasai RISC-V. Begitu tolok ukur dipindahkan ke kata-kata seperti pusat data, server, daya komputasi AI, masalah segera menjadi tajam. Inilah garis yang harus diikuti selanjutnya.
Semangat Ini Harus Dikobarkan di Daratan Tiongkok
Melihat secara global, RISC-V bukanlah konsep eksklusif China. Google, Meta, Qualcomm, Nvidia, Tesla sudah merangkul RISC-V dalam berbagai tingkatan. Uni Eropa melalui CHIPS Act menginvestasikan miliaran euro untuk mendukung R&D RISC-V. EuroHPC meluncurkan proyek DARE dengan skala sekitar 240 juta euro, bertujuan untuk mengganti prosesor komputasi kinerja tinggi dengan RISC-V secara bertahap mulai 2025, dengan tulisan "kedaulatan digital" di belakangnya.
RISC-V yang sama, China melihatnya sebagai keamanan rantai pasok dan biaya, dunia melihatnya sebagai kebebasan arsitektur generasi berikutnya untuk AI. Kedua kekuatan ini kebetulan bertumpuk pada saat ini.
Namun, yang paling memiliki energi penggerak dominan untuk benar-benar mengobarkan semangat dan mendorong ekosistem dari embedded ke kinerja tinggi saat ini adalah Daratan Tiongkok. Di balik penilaian ini ada N daya dorong.
Pertama adalah "banjir daya komputasi" yang dibawa AI. Konsensus dasar industri adalah, pada 2030, skala semikonduktor global akan melampaui satu triliun dolar AS, dengan lebih dari 70% terkait AI. Nafsu AI terhadap daya komputasi, bandwidth memori, dan interkoneksi antar chip jauh melampaui aplikasi apa pun sebelumnya. Arus daya komputasi seperti air pasang mengalir ke ujung kinerja tinggi. Siapa pun yang tidak memiliki fondasi daya komputasi yang cukup akan tertinggal.
Tentu saja ada juga pengetatan pasokan akibat kontrol ekspor. Departemen Perdagangan AS terus memperketat kontrol ekspor chip komputasi canggih; Nvidia sendiri mengakui pangsa pasarnya di China hampir nol. Vera baru meskipun akan datang, tetapi harga, ritme, dan ketersediaannya, tidak satu pun berada di tangan produsen China. Di satu sisi permintaan yang terus meningkat, di sisi lain pasokan yang tersumbat, selisih gunting inilah yang paling membuat cemas sekaligus paling imajinatif bagi ekosistem China.
Selain itu, ada pengurangan biaya struktural yang dibawa oleh sumber terbuka. Seorang pakar industri yang telah lama melakukan seleksi chip cloud, selama penelitian penulis, membedah buku besar pusat data. Di server kinerja tinggi, dua jenis chip GPU dan CPU bersama-sama dapat mencapai 50% hingga 80% dari biaya perangkat keras. Upaya apa pun untuk menekan total biaya akhirnya akan jatuh pada chip termahal itu. Dan keunikan RISC-V justru terletak pada sifat sumber terbukanya: x86 adalah kotak hitam tertutup, Arm adalah domain pribadi yang dikendalikan oleh pemberi lisensi tunggal, sementara RISC-V mengembalikan lapisan barang publik yaitu set instruksi kepada seluruh industri. Ketika sebuah produsen tidak perlu membayar biaya lisensi, tidak perlu dicekik oleh set instruksi itu sendiri, struktur biaya rantai industri CPU memiliki kesempatan untuk ditulis ulang secara struktural.
Di Daratan Tiongkok, di atas tiga daya dorong ini masih ditumpuk satu hal unik, yang pada dasarnya dapat diringkas sebagai "pusat menetapkan nada, daerah menambah pendorong". Kementerian Perindustrian dan Teknologi Informasi tahun ini mengeluarkan proyek khusus berkualitas tinggi terkait pusat data RISC-V. Dana kebijakan dan skenario aplikasi lokal untuk teknologi keras juga mengikutinya secara bersamaan. Sinergi dari atas ke bawah dan dari bawah ke atas seperti ini tidak dimiliki oleh Eropa maupun AS.
Yang lebih menarik adalah perubahan sikap. Beberapa tahun lalu, di antara enam produsen CPU domestik utama, pernah ada kepala yang secara langsung mengejek penggiat RISC-V sebagai "tidak lebih dari sekelompok orang sembarangan". Namun, hari ini, keenam produsen ini tanpa terkecuali telah lulus ujian negara, dan di antaranya sudah ada yang bersedia menjadi yang pertama mencoba, mulai serius mencangkokkan percobaan generasi berikutnya mereka ke RISC-V. Dari "orang sembarangan" menjadi "yang pertama mencoba", yang di tengahnya adalah proses dua tahun terakhir di mana teknologi, kebijakan, dan pasar bersama-sama memutar medan opini.
Jika pelukan Eropa terhadap RISC-V terutama didorong oleh satu tujuan yaitu "kedaulatan digital", maka daya dorong Daratan Tiongkok berasal dari penumpukan empat kekuatan: keamanan rantai pasok, struktur biaya, kedaulatan teknologi, dan ledakan aplikasi. Inilah mengapa, hari ini, forum RISC-V tersibuk di dunia, perusahaan IP terpadat, dan balapan kinerja tinggi terketat, hampir semuanya terkonsentrasi di Daratan Tiongkok.
Sebuah kalimat yang telah menjadi konsensus industri adalah: RISC-V adalah kandang sendiri China.
Tiket Masuk, Tetap Hanya Tiket Masuk
Untuk mengukur kemajuan RISC-V menyerang komputasi kinerja tinggi, industri diam-diam menetapkan ambang batas: skor SPEC integer (SPECint) per satuan frekuensi mencapai 15 poin.
Ambang batas ini perlu sedikit dijelaskan agar tidak disalahpahami. SPEC CPU 2006 dan 2017 adalah tolok ukur kinerja prosesor yang telah lama digunakan industri, skor integer (SPECint) mengukur kemampuan CPU dalam operasi bilangan bulat umum, "per satuan frekuensi" berarti pengaruh frekuensi utama dipisahkan, murni membandingkan efisiensi eksekusi mikroarsitektur itu sendiri. Dengan kata lain, 15 poin ini memperebutkan berapa banyak pekerjaan yang dapat dilakukan satu inti tanpa mengandalkan peningkatan clock, mengukur tingkat desain, bukan keuntungan proses.
Mengapa 15 poin. Karena baseline mikroarsitektur CPU kinerja tinggi di kubu x86 dan Arm kira-kira berada di level ini. Lebih rendah dari angka ini, sebuah inti RISC-V sulit mengklaim dirinya "berada di garis start yang sama dengan arsitektur matang". Dengan kata lain, 15 poin bukanlah langit-langit absolut, melainkan garis kualifikasi. Bisa melewatinya berarti mendapatkan hak berbicara di klub kinerja tinggi; tidak bisa melewatinya, narasi pasar sebanyak apa pun hanya akan tetap di embedded dan menengah-rendah.
Seorang pakar industri yang terlibat dalam desain mikroarsitektur kinerja tinggi, selama penelitian penulis, menjelaskan makna industri di balik garis kualifikasi ini. Kesuksesan seri Apple M dan Arm Neoverse memberi tahu semua orang bahwa untuk merobek celah di pasar yang telah didominasi arsitektur matang seperti x86 selama puluhan tahun, satu-satunya yang bisa diandalkan adalah rasio efisiensi energi yang lebih tinggi; pertama-tama harus berdiri dalam kinerja per unit, lalu menunggu proses canggih matang untuk meningkatkan frekuensi utama. Jalur ini juga berlaku untuk RISC-V.
Lalu, apakah garis ini sudah terjangkau? Jawabannya: sudah terjangkau bahkan terlampaui oleh beberapa tim di Daratan Tiongkok secara berturut-turut.
Di kubu sumber terbuka, inti RISC-V kinerja tinggi sumber terbuka mainstream dalam negeri telah mencapai skor 14,78 pada jaringan Mesh delapan inti nyata, pada dasarnya sejajar dengan target 15 poin yang diumumkan sebelumnya.
Patut disebutkan, tim secara aktif mengklarifikasi prasangka industri terhadap sumber terbuka: sumber terbuka tidak sama dengan kualitas rendah. Yang ingin mereka tinggalkan bagi industri adalah baseline sumber terbuka yang benar-benar dapat digunakan. Makna baseline ini adalah, produsen chip kecil dan menengah mana pun tidak perlu lagi membuat roda dari nol, bisa mulai dari inti sumber terbuka untuk masuk ke garis start kinerja tinggi. Ini adalah kemampuan yang tidak bisa diberikan oleh kotak hitam x86 maupun lisensi tunggal Arm.
Kawasan IP komersial bahkan lebih beragam. Konsensus yang agak memaksa adalah, saat ini di Daratan Tiongkok sudah ada tidak kurang dari lima produsen yang telah atau mengklaim telah membuat inti RISC-V kinerja tinggi mereka mencapai atau melampaui 15 poin, beberapa tim bahkan mencapai kisaran 16 hingga 18 poin, dengan frekuensi utama di skenario tipikal menembus 3,4GHz ke atas.
"Melewati batas besar 3GHz, baru benar-benar melangkah ke pintu prosesor kinerja tinggi," ini adalah pernyataan penuh semangat yang dilontarkan seorang arsitek senior di hadapan penulis.
Namun, skor hanyalah tiket masuk. Pertarungan sebenarnya berada di luar skor.
Dari Satu Inti ke Satu Set Sistem: Loncatan Teknik Lainnya
Perubahan paling layak diceritakan tentang RISC-V di Daratan Tiongkok selama setahun terakhir adalah pergeseran fokus dari inti tunggal ke lompatan keseluruhan "sistem komputasi".
Untuk memahami hal ini, pertama-tama pahami wajah asli sebuah CPU server. Ia bukan hanya unit eksekusi set instruksi, melainkan satu set lengkap SoC yang terdiri dari puluhan inti, cache bersama, pengontrol memori, saluran IO, pulau keamanan, unit manajemen daya, ditambah jaringan interkoneksi on-chip yang mengatur semua ini. Yang terakhir biasanya disebut NoC, lebih tepatnya, NoC koheren: ia harus memastikan puluhan bahkan ratusan inti melihat tampilan memori yang konsisten, adalah sistem saraf pusat sistem multi-inti skala besar.
Seberapa penting lapisan ini? Intel, AMD, Nvidia memiliki bus koheren yang dikembangkan sendiri, Arm memiliki seri IP CMN, Huawei Ascend memiliki HCCS sendiri. Perusahaan yang mampu membuat IP NoC koheren ke tingkat pengiriman komersial di dunia sudah sedikit, masing-masing membutuhkan iterasi tingkat dekade. NoC koheren yang tidak baik, inti sekuat apa pun hanyalah pulau terisolasi.
Dan hingga hari ini, sudah ada produsen RISC-V di Daratan Tiongkok yang mengembangkan jaringan on-chip koheren yang dikomersialkan sendiri. Konsensus dasar adalah, ini adalah tanda kunci RISC-V buatan dalam negeri beralih dari "membuat inti" ke "membuat sistem". Seorang praktisi yang diwawancarai penulis mengatakan, perusahaan di Daratan Tiongkok yang menyerang dataran tinggi chip server RISC-V sudah tidak kurang dari sepuluh, ini adalah kepadatan yang tidak pernah dibayangkan siapa pun beberapa tahun lalu.
Selain NoC, ada serangkaian panjang indikator keras "tidak menambah satu poin pun dalam skor, tetapi menentukan apakah server mau memasangnya". BMC (Baseboard Management Controller), IPMI (Intelligent Platform Management Interface), dukungan media virtual, RAS (Reliability, Availability, Serviceability) full-stack, ini adalah persyaratan paling dasar untuk operasional pusat data. Dan ada satu desain yield yang sangat realistis, disebut Partial Goods: ketika satu inti, suatu segmen cache, atau satu saluran DDR rusak dalam chip server berukuran besar, chip keseluruhan tidak boleh jadi sampah karenanya, harus bisa memblokir area rusak dan terus dikirim dalam status degradasi. Desain seperti ini secara langsung memengaruhi yield, memengaruhi yield berarti memengaruhi ekonomi.
Dan yang paling mencerminkan ambisi adalah, sudah ada produsen di Daratan Tiongkok yang mengirimkan prosesor server RISC-V 40 inti dengan IP sepenuhnya dikembangkan sendiri. Yang paling menarik dari prosesor ini bukanlah skalanya, melainkan penahanan dirinya: nol set instruksi kustom, seratus persen kompatibel dengan standar RVA23. Di balik ini ada hukum besi industri yang hampir terus-menerus ditekankan: di pasar server, aturan lebih berharga daripada variasi.
Apa itu RVA23? Penjelasan sederhana: ini adalah profil prosesor aplikasi (Application Processor Profile) yang ditetapkan oleh RISC-V International Foundation pada 2024, mengelompokkan sekumpulan instruksi ekstensi inti menjadi "kontrak" yang seragam, termasuk 58 ekstensi wajib dan 23 ekstensi opsional. Prosesor apa pun yang mengklaim sesuai RVA23, secara teori dapat menjalankan perangkat lunak biner yang sama. Maknanya bagi ekosistem RISC-V mirip dengan ketika Arm meluncurkan Armv8-A dulu: langkah kunci dari "seratus aliran bersaing" ke "satu standar yang dapat diajak bicara".
Nol kustomisasi, ketat menyelaraskan RVA23, berarti chip ini meninggalkan jalan pintas "menambah buff" dengan instruksi pribadi untuk meningkatkan skor, menaruh janji pada kompatibilitas perangkat lunak jangka panjang. Konsensus dasar berpendapat, ini adalah penyesuaian sikap paling pragmatis RISC-V di Daratan Tiongkok dalam menyerang pasar server selama beberapa tahun terakhir.
Satu set data perbandingan lain di luar skor lebih bisa menjelaskan kemiringan nyata RISC-V mendaki ke atas. Dalam beban kerja tipikal seperti enkode-dekode video, prosesor kinerja tinggi RISC-V buatan dalam negeri sudah mencapai 90% dari produk generasi sejenis x86, 96% dari generasi sejenis Arm; dalam komputasi enkripsi-dekripsi, bahkan mencapai 1,88 kali x86, 1,67 kali Arm; operator inti inferensi model besar juga mendekati 1,67 kali level Arm. Di balik angka-angka ini adalah pengiriman perangkat keras dan lunak lengkap termasuk sistem operasi, toolchain, library komputasi, bukan sepotong silikon yang terisolasi.
Yang lebih meyakinkan adalah chip yang sudah kembali dari fabrikasi, sudah berjalan di sisi klien. Sebuah prosesor RISC-V 64-bit buatan dalam negeri dengan delapan inti terintegrasi telah menyelesaikan tape-out produksi massal pada proses 12nm. Setelah kembali dari pengujian dan pengepakan, dalam dua minggu, antarmuka grafis Ubuntu dan aplikasi desktop mainstream semuanya sudah berjalan dengan lancar. Skenario yang bisa dijalankannya sangat relevan: AI all-in-one model besar sisi edge, kluster kompilasi asli RISC-V, laptop, terminal cloud, bahkan kendaraan, semuanya dalam jangkauannya. Dari bisa menjalankan skor, bisa menyala, bisa menginstal sistem, sampai bisa bekerja, setiap langkah jaraknya tidak dekat, tetapi setiap langkah sedang sedikit demi sedikit dilalui.
Lawan Sebenarnya Bukan Arm, Melainkan Parit di Belakang Arm
Namun, begitu sampai di sini, fakta lain harus dikemukakan: semakin tinggi RISC-V mendaki, lawan yang tak terhindari semakin jelas, bukan set instruksi x86 dan Arm itu sendiri, melainkan parit pertahanan yang telah digali selama puluhan tahun di belakang mereka.
Parit itu disebut ekosistem. Dan bagian terdalamnya bernama CUDA.
Seorang praktisi senior yang pernah bekerja bertahun-tahun di Nvidia, selama penelitian penulis, menyiramkan air dingin kesadaran kepada rekan-rekannya. Dia berkata, Jensen Huang sendiri tidak pernah menganggap Nvidia sebagai perusahaan chip. Keunggulan sebenarnya GPU hari ini belum tentu pada daya komputasi per unit, melainkan pada ekosistem perangkat lunak CUDA yang sangat kuat. Jumlah pengembang CUDA global mencapai jutaan, di belakangnya adalah library operator, toolchain kompiler, debugger, Profiler yang dikembangkan selama lebih dari sepuluh tahun, serta ribuan makalah dan buku teks seputar CUDA. RISC-V harus menantang gunung inilah.
Namun yang menarik adalah, justru di titik di mana Arm dan x86 tidak bisa berbuat apa-apa terhadap RISC-V, itulah titik tumpu serangan balik RISC-V. Bao Yungang dari Institut Komputasi Akademi Ilmu Pengetahuan China, dalam diskusi dengan penulis, membagi peluang RISC-V untuk AI menjadi tiga lapisan logika. Logika ini mendapat pengakuan yang cukup luas dalam kunjungan.
Lapisan pertama adalah kolaborasi. RISC-V pada dasarnya tumbuh dari set instruksi CPU, melakukan ekstensi AI padanya adalah hal yang wajar. Pada tahun 80-an, CPU menambahkan instruksi floating-point, pada tahun 90-an menambahkan instruksi multimedia (SIMD), semuanya akhirnya melebur ke dalam desain CPU mainstream. Ekstensi AI melebur ke dalam CPU hanyalah sejarah yang terulang kembali. Dan di era AI agen, beban kerja yang membutuhkan pemanggilan berulang dan pengambilan keputusan berulang di antara berbagai model, justru menuntut kolaborasi yang lebih erat antara CPU dan akselerator. Hal ini sebenarnya adalah masalah yang ingin diselesaikan oleh CPU independen seperti Vera Nvidia yang "dirancang khusus untuk AI agen". Jika RISC-V bisa memasukkan instruksi ekstensi AI ke dalam baseline CPU, berarti selangkah lebih dulu di lapisan kolaborasi ini.
Lapisan kedua adalah pemangkasan. Keragaman skenario inferensi AI jauh melampaui pelatihan. Cloud membutuhkan model besar penuh, edge membutuhkan versi terdistilasi, ujung perangkat membutuhkan konsumsi daya yang ekstrem. Set instruksi x86 dan Arm adalah "kumpulan lengkap", tidak bisa dipangkas; desain modular bawaan RISC-V berarti setiap produsen dapat memilih subset yang mereka butuhkan dari sekelompok ekstensi (M perkalian-pembagian integer, A operasi atom, F floating-point presisi tunggal, D floating-point presisi ganda, V vektor, dll.), membuat produk yang lebih ringkas dan lebih tepat sasaran.
Lapisan ketiga dan yang paling penting adalah tumpukan perangkat lunak. Saat ini, perusahaan chip AI dalam negeri China kebanyakan adalah menara vertikal yang masing-masing bekerja sendiri, skala tim perangkat lunak bergerak ratusan hingga ribuan orang, kerja berulang dilakukan lagi dan lagi. Satu set angka yang beredar di industri adalah, di antara lebih dari seribu orang tim R&D sebuah produsen GPU ternama dalam negeri, hanya sekitar dua ratus orang yang membuat chip, enam hingga tujuh ratus sisanya mengerjakan perangkat lunak. Jika RISC-V bisa menyatukan standar di tingkat set instruksi AI, tumpukan perangkat lunak, kompiler, library operator bisa mengikuti seragam. Produsen chip bisa berangkat dengan ringan, mengembalikan energi mereka ke mikroarsitektur dan proses. Inilah jalur yang memiliki peluang untuk benar-benar beradu kekuatan dengan CUDA.
Adapun seperti apa wujud dasar chip AI di masa depan, industri memberikan dua bayangan. Satu disebut permainan Baby RISC-V: menyelipkan banyak inti RISC-V kecil dan sederhana ke dalam akselerator, khusus bertanggung jawab mengatur aliran data, kapan menggunakan instruksi apa, memberikan area silikon berharga sepenuhnya ke unit komputasi. Tenstorrent adalah perwakilan jalur ini, dan ada juga tim di Daratan Tiongkok yang mencoba ke arah ini.
Lainnya adalah Big RISC-V, menggunakan RISC-V sebagai inti kontrol utama kinerja tinggi, menanggung penjadwalan dan tugas berat. Pada dasarnya diyakini, kedua jalur tidak saling eksklusif, di masa depan lebih mungkin Baby dan Big berdampingan dalam SoC yang sama. Di bawahnya, apa pun perangkat fisiknya, apa pun unit matriksnya, apa pun mesin vektornya, semuanya mendapatkan antarmuka pemrograman perangkat lunak yang seragam melalui RISC-V. Antarmuka inilah akar kemakmuran ekosistem.
Imajinasi yang lebih berani, sudah ada yang menggambarkannya sebagai kurva evolusi: dari RISC-V ditambah AI (kopling sederhana CPU dengan akselerator), ke AI ditambah RISC-V (daya komputasi AI utama, RISC-V kontrol sekunder), akhirnya sampai ke RISC-V sama dengan AI (set instruksi dan daya komputasi AI menyatu dalam, CPU sebagai dasar komputasi AI). Apakah kurva ini berlaku masih harus dilihat dari pemenuhan teknis lima hingga sepuluh tahun ke depan, tetapi setidaknya ini menunjukkan bahwa ruang imajinasi RISC-V untuk AI jauh lebih dari sekadar "membuat produk pengganti di luar Arm".
Masalah Nyata Tidak Kurang Satu Pun, dan Semuanya Keras
Sampai di sini, cerita sepertinya sudah lengkap. Namun, sebuah artikel analisis industri yang bertanggung jawab harus membuka setengah lainnya: RISC-V menyerang komputasi kinerja tinggi, masalah nyata tidak kurang satu pun, dan semuanya keras.
Masalah nyata pertama adalah ketidaklengkapan dan fragmentasi ekosistem. Xu Qingwei, Direktur Senior Perangkat Lunak dan Ekosistem Bluechip Power, berbicara sangat blak-blakan di hadapan penulis: tantangan terbesar RISC-V dibandingkan x86 dan Arm adalah ekosistem tidak lengkap, spesifikasi tidak lengkap, fragmentasi ekosistem, ditambah kematangan perangkat lunak yang tidak cukup. Akar fragmentasi ada pada instruksi kustom, setiap produsen ingin menarik diferensiasi dengan ekstensi pribadi, hasil akhirnya adalah ekosistem perangkat lunak terkoyak menjadi pulau-pulau terpisah. Chip server "nol kustomisasi, penuh RVA23" yang disebutkan sebelumnya, pada dasarnya adalah jawaban paling pragmatis terhadap masalah nyata ini: menganggap aturan lebih penting daripada variasi.
Masalah nyata kedua tersembunyi dalam toolchain dan verifikasi. Mata rantai EDA ini, kelemahan RISC-V buatan dalam negeri sangat jelas. Raksasa EDA internasional, Direktur Teknis Synopsys Zhang Chunlin, dalam sebuah acara industri memberitahu penulis, industri telah menyediakan set uji kompatibilitas dan Benchmark yang sangat lengkap untuk Arm, sedangkan untuk RISC-V masih jauh tertinggal; ditambah masing-masing pihak melakukan kustomisasi instruksi dengan sumber terbuka, setiap kustomisasi berarti proyek verifikasi yang tidak kecil. Dan ada kesulitan lain: RISC-V adalah arsitektur terbuka, hari ini mengubah sepotong kode sembarangan, apakah efeknya menjadi lebih baik atau lebih buruk, tidak ada yang mau menunggu chip kembali dari tape-out baru tahu jawabannya, jadi verifikasi kolaborasi perangkat keras-lunak harus diselesaikan sebelum tape-out.
Seberapa sulit verifikasi? Satu set data yang sudah dipublikasikan industri adalah, error kinerja awal antara simulator dan RTL tim inti kinerja tinggi sumber terbuka dalam negeri pada SPEC integer mencapai 12,4%, floating-point bahkan mencapai 30,6%, berarti prediksi simulasi dan kinerja nyata sangat menyimpang. Banyak perusahaan menghabiskan banyak usaha untuk kalibrasi granular halus, baru bisa menekan kedua error ini hingga 1,8% dan 2,6%. Di balik angka-angka ini adalah kerja keras yang paling tidak seksi namun paling melelahkan dalam pengembangan prosesor kinerja tinggi, juga pekerjaan rumah yang tidak bisa dihindari oleh tim mana pun yang ingin membuat CPU server.
Dan ada dua gunung yang tidak bisa dihindari: kinerja inti tunggal dan efisiensi energi. Konsensus dasar industri saat ini adalah, kinerja inti tunggal dan kinerja bus interkoneksi on-chip RISC-V buatan dalam negeri masih dalam tahap mengejar, untuk berdiri kokoh di pusat data, masih banyak jalan yang harus ditempuh. Persaingan efisiensi energi lebih tersembunyi, bergantung pada proses, manajemen daya, desain sirkuit paling dasar, masing-masing adalah otot yang telah dibangun x86 dan Arm selama puluhan tahun.
data-check-id="644365">Lin Zhiming, Ketua Dewan Direksi Andes Technology, pernah memberikan perumpamaan yang sangat mudah dipahami: transistor dulu seperti tempat tidur yang tidur di tanah datar, setelah FinFET semua beralih tidur di tempat tidur 3D vertikal, kemudian seperti membangun pencakar langit di atas satu chip, tujuannya adalah memeras lebih banyak daya komputasi dalam ruang fisik terbatas. Di era pasca-Moore, siapa yang bisa membangun gedung ini lebih tinggi dan hemat energi, dialah yang menang. RISC-V harus membandingkan efisiensi energi dengan arsitektur matang di gedung ini, bukan mengandalkan set instruksi itu sendiri, melainkan pekerjaan desain sirkuit yang hampir seperti pengrajin, memeras frekuensi utama dan efisiensi energi dengan jalur data kustom.Yang paling realistis adalah proses dan waktu. Proses canggih buatan dalam negeri memang masih bermasalah, ini hanyalah keadaan transisi. Hari ini berani men-tape-out, besok saluran menyempit tidak bisa mendapatkan chip kembali, bagaimana? Setiap produsen chip memiliki buku catatannya sendiri. Liu Yanan, Direktur Teknologi Chip Departemen Produk Komputasi Awan China Mobile, selama penelitian penulis, mengatakan kalimat yang cukup jujur: masa depan cerah, pasti menang, tetapi proses ini, terutama di bidang pusat data, siklusnya akan melebihi ekspektasi semua orang. Kalimat ini layak dikutip berulang kali, karena mewakili manajemen ekspektasi paling sadar industri terhadap serangan RISC-V ke kinerja tinggi.
Pintu Telah Terbuka, Jalan Masih Panjang
Setelah berputar jauh, kembali ke pertanyaan awal: ketika Nvidia mengetuk pintu dengan Vera, apakah CPU buatan sendiri China hanya tinggal satu cara hidup: "mengikuti Arm dari belakang"?
Semua bukti menunjuk ke jawaban yang sama: jalur lain ada, dan kandang sendiri jalur ini adalah Daratan Tiongkok. Tiket masuk 15 poin itu, produksi dalam negeri sudah ada lebih dari satu yang mendapatkannya; indikator keras pusat data seperti NoC koheren, RAS, Partial Goods, juga mulai digigit satu per satu; CPU server dengan nol kustomisasi, ketat menyelaraskan RVA23 sudah di-tape-out, menandai industri ini mulai benar-benar tumbuh sesuai "aturan server"; skenario implementasi seperti mobil, komunikasi, transkode video, sudah menggunakan pesanan nyata untuk mendukung RISC-V.
Namun, juga harus diakui, produk patokan dengan kinerja mesin penuh head-to-head yang setara x86 dan Arm belum benar-benar muncul, parit ekosistem CUDA juga jauh dari bisa digali dalam beberapa tahun. Setiap langkah RISC-V mendaki ke atas disertai masalah nyata fragmentasi, kelemahan EDA, efisiensi energi inti tunggal, keuntungan proses, komputasi rahasia, dll. Tidak satu pun dari masalah ini bisa diselesaikan dalam semalam dengan slogan atau kebijakan.
Memecahkan "segitiga mustahil" bukanlah slogan. Ini berarti RISC-V harus sekaligus menyatukan tiga hal: mandiri, terkendali, makmur, dan masing-masing hal saja membutuhkan waktu puluhan tahun untuk diselesaikan. Situasi saat ini adalah fondasi mandiri sudah diletakkan, rekayasa terkendali sedang dalam perjalanan, wujud kemakmuran samar-samar terlihat. Pintu telah terbuka, tetapi di belakang pintu ada jalan yang lebih panjang dari perkiraan semua orang.
Nvidia Vera akan memasuki sistem pemesanan klien China pada Agustus, dengan harga jauh melebihi dua puluh ribu dolar AS per unit. Akan berapa banyak klien China yang menerimanya, berapa lama bisa mempertahankan pasokan, dan pada titik mana karena putaran pengetatan kontrol berikutnya akan menjadi inventaris "satu digunakan, satu berkurang", ini semua adalah kekhawatiran dekat industri. RISC-V tidak mungkin menangani semua permintaan pada titik waktu Agustus ini, dan juga tidak perlu menanganinya. Yang harus dijawabnya bukanlah masalah pasokan satu CPU saat ini, melainkan sepuluh tahun kemudian, ketika gelombang revolusi daya komputasi berikutnya datang lagi, apakah CPU buatan sendiri China masih harus mempertaruhkan nasib di meja kartu orang lain.
Kelompok yang pernah disebut "orang sembarangan" itu, kini memegang tiket masuk yang mereka kumpulkan sedikit demi sedikit. Mampukah bersama-sama menyelesaikan pekerjaan keras yang tidak seksi itu satu per satu, membuat RISC-V benar-benar memiliki posisinya sendiri di meja komputasi kinerja tinggi, ini adalah pertanyaan yang paling layak ditanyakan berulang kali di jalur CPU buatan sendiri China dalam lima tahun ke depan.
Artikel ini berasal dari akun WeChat publik: Daju Finance , penulis: Guanwang Finance, judul asli: "Nvidia CPU Berdatangan, RISC-V China Menyambut Tantangan——Pengamatan Mendalam Industri Semikonduktor Bagian Empat"






