Pada 1 Juni, NVIDIA meluncurkan Vera CPU pada acara GTC Taipei 2026 yang diadakan selama pameran komputer Taipei. Platform superkomputer AI generasi baru mereka yang dirilis bersamaan, Vera Rubin, mencakup pelanggan pertama seperti OpenAI dan Anthropic.
Ini adalah pertama kalinya NVIDIA meluncurkan lini produk CPU independen. Pertumbuhan NVIDIA selama 20 tahun terakhir hampir seluruhnya dibangun di atas GPU. CEO NVIDIA, Jensen Huang, mengatakan dalam konferensi pers bahwa di era agen AI, CPU telah menjadi hambatan kinerja kunci di pusat data, dan tidak boleh memperlambat kecepatan produksi token di "pabrik AI".
Sebelumnya, pada bulan Mei, CEO AMD, Lisa Su, mengumumkan dalam konferensi telepon laporan keuangan bahwa perkiraan ukuran pasar server CPU ditingkatkan dua kali lipat dari 60 miliar dolar AS menjadi lebih dari 120 miliar dolar AS, dengan tingkat pertumbuhan tahunan gabungan (CAGR) dari tahun 2025 hingga 2030 naik dari 18% menjadi 35%.
Menurut statistik IDC, pasar server global mencapai 444,1 miliar dolar AS pada tahun 2025, tumbuh 80,4% dibandingkan tahun sebelumnya, dengan server AI berkontribusi pada sebagian besar pertumbuhan. Dalam laporan penelitian terbaru tentang industri semikonduktor, UBS memperkirakan bahwa ukuran pasar potensial untuk server CPU akan tumbuh dari sekitar 30 miliar dolar AS pada tahun 2025 menjadi sekitar 170 miliar dolar AS pada tahun 2030, meningkat hampir 5 kali lipat dalam 5 tahun.
Data dari lembaga riset pasar Mercury Research menunjukkan bahwa pada kuartal pertama 2026, pangsa pendapatan server CPU AMD mencapai 46,2%, sementara Intel 53,8%. Namun, pangsa volume pengiriman AMD hanya 33,2%, sedangkan Intel masih mencapai 66,8%. Artinya, AMD menghasilkan pendapatan yang lebih tinggi dengan chip yang lebih sedikit, menunjukkan kemampuan premium dari produk berinti tinggi dalam kuartal ini.
Lin Meibing, analis kepala ICTIME dari Chip Talk, mengatakan kepada Economic Observer bahwa CPU adalah variabel yang paling melampaui ekspektasi dalam siklus AI saat ini. Saat AI berkembang dari dialog ke Agen (Agent), permintaan untuk CPU dalam inferensi telah melampaui pelatihan.
GPU "Menunggu" CPU
Intel bersama Georgia Tech menerbitkan makalah berjudul "A CPU-Centric Perspective on Agentic AI" pada November 2025. Dalam makalah ini, tim peneliti melakukan pengujian pada lima jenis beban kerja Agen yang khas, dan hasilnya menunjukkan bahwa waktu pemrosesan alat di sisi CPU mencapai 43,8% hingga 90,6% dari total latensi.
Seorang analis dari perusahaan sekuritas yang telah lama melacak sektor semikonduktor mengatakan bahwa selama fase pelatihan model besar, porsi kerja CPU hanya sekitar satu hingga tiga puluh persen, beberapa beban kerja mungkin mencapai hampir empat puluh persen, dengan sebagian besar perhitungan ditangani oleh GPU. Ini karena proses komputasi pelatihan model AI besar sangat terstruktur, dengan ratusan juta parameter melakukan perkalian matriks berulang kali pada data masif. Arsitektur paralel GPU dirancang untuk tugas-tugas semacam ini, sedangkan CPU bertanggung jawab untuk pemuatan data, penjadwalan komunikasi, dan penyalinan hasil, tanpa melibatkan operasi matriks inti.
Namun, pada fase inferensi, proporsi ini mulai berbalik. Porsi kerja CPU naik menjadi di atas tujuh puluh persen, dan akan lebih tinggi dalam skenario Agen. Karena tugas Agen memerlukan penalaran multi-langkah, pemanggilan alat eksternal, eksekusi kode, membaca/menulis basis data, penelusuran web, dan kemudian mengatur hasil antara menjadi output akhir.
Asisten pemrograman, alat analisis data, dan Agen penelitian otomatis termasuk dalam kategori ini, dan juga merupakan skenario dengan pertumbuhan tercepat dalam aplikasi model besar saat ini. Ciri umum dari pekerjaan ini adalah aliran kontrol yang padat, percabangan yang kompleks, dan input/output yang sering. Utilisasi GPU untuk tugas-tugas serial dan terfragmentasi seperti ini akan turun secara signifikan.
Beberapa orang di industri mengatakan bahwa dalam tugas Agen, utilisasi keseluruhan GPU umumnya kurang dari 50%, jauh lebih rendah dari layanan inferensi tradisional yang mencapai 70% hingga 85%. Konsumsi token dalam penerapan AI dengan cara Agen biasanya 20 hingga 30 kali lipat dari percakapan biasa, karena satu interaksi pengguna sering kali melibatkan puluhan panggilan alat dan penalaran antara.
Menurut perkiraan IDC, jumlah tugas yang dieksekusi oleh Agen global per tahun akan tumbuh dari sekitar 44 miliar pada tahun 2025 menjadi lebih dari 400 triliun pada tahun 2030.
Manajemen Intel menyatakan dalam konferensi telepon laporan keuangan kuartal pertama 2026 bahwa jumlah inti CPU yang diperlukan per gigawatt di era agen AI mungkin tumbuh dari saat ini sekitar 30 juta menjadi 120 juta. Lembaga riset pasar Gartner juga memprediksi bahwa pada tahun 2027, 40% proyek Agen akan dikurangi atau dibatalkan karena biaya infrastruktur yang melampaui anggaran, dengan sebagian besar kelebihan biaya berasal dari biaya berkelanjutan yang dihasilkan dari panggilan alat dan pengelolaan konteks di sisi CPU.
Agen menghasilkan sejumlah besar data antara saat menangani percakapan panjang dan tugas kompleks. Sistem AI perlu mengingat semua konten percakapan sebelumnya dan hasil panggilan alat selama proses inferensi, istilah industri menyebutnya KV Cache (cache nilai kunci), yang akan terus mengembang seiring dengan putaran percakapan. Namun, kapasitas penyimpanan bawaan GPU sangat terbatas, NVIDIA H100 hanya memiliki 80GB, dan generasi berikutnya B200 hanya 192GB. Data antara yang dihasilkan oleh satu tugas Agen yang kompleks dengan mudah melampaui batas ini.
Saat ini, metode yang umum digunakan industri adalah memindahkan data antara ini dari GPU ke sisi CPU. CPU dapat dilengkapi dengan memori DDR5 eksternal, dengan kapasitas per chip mencapai beberapa TB, satu hingga dua orde lebih besar daripada penyimpanan GPU.
Aliansi industri CXL yang terdiri dari perusahaan chip seperti Intel, AMD, ARM merilis protokol CXL 4.0 (Compute Express Link, standar terbuka untuk interkoneksi berkecepatan tinggi antar chip) pada November 2025, yang memungkinkan beberapa CPU berbagi kolam memori berkapasitas besar yang sama, mengurangi overhead perpindahan data antar chip.
Dengan demikian, CPU tidak hanya bertanggung jawab atas penjadwalan tugas, tetapi juga atas penyimpanan data dan manajemen memori selama proses inferensi AI.
Selain itu, CPU itu sendiri telah mengalami peningkatan teknologi yang intensif selama beberapa tahun terakhir. Jumlah inti server CPU meningkat dari 28 inti pada tahun 2017 menjadi 288 inti (Intel Clearwater Forest) dan 256 inti (AMD Venice) pada tahun 2026, peningkatan kepadatan mendekati 10 kali lipat.
Intel memperkenalkan set instruksi AMX (Advanced Matrix Extensions) pada tahun 2023, membuat CPU untuk pertama kalinya memiliki unit komputasi matriks khusus. Menurut data pengujian dari Intel, dalam skenario inferensi pembelajaran mendalam, prosesor Xeon generasi keempat yang dilengkapi dengan AMX menunjukkan peningkatan kinerja AI hingga hampir 10 kali lipat dibandingkan generasi sebelumnya. Subsistem memori juga ditingkatkan dari DDR4 ke DDR5, dengan bandwidth dan kapasitas per platform keduanya berlipat ganda.
Peningkatan jumlah inti dan set instruksi juga sesuai dengan perubahan rasio CPU dan GPU. CEO Intel, Patrick Gelsinger, mengatakan dalam konferensi telepon laporan keuangan kuartal pertama 2026 bahwa dalam skenario pelatihan, biasanya 7 hingga 8 GPU dipasangkan dengan 1 CPU; dalam skenario inferensi, rasio ini berkurang menjadi 3 hingga 4 GPU per 1 CPU; dan dalam skenario Agen, diharapkan dapat berkurang lebih lanjut menjadi 1:1.
CFO Intel, David Zinsner, menambahkan dalam konferensi telepon yang sama bahwa rasio CPU terhadap GPU secara keseluruhan industri telah berkurang dari 1:8 di masa lalu menjadi sekitar 1:4.
Kenaikan Harga Besar Pertama dalam Lebih dari Sepuluh Tahun
Perubahan rasio ini telah berdampak pada penetapan harga produk.
Jia Bin, kepala pasar dari distributor CPU di Shenzhen, mengatakan kepada wartawan bahwa sejak Februari 2026, Intel dan AMD secara bertahap menaikkan harga seluruh seri server CPU, dengan kenaikan keseluruhan antara 10% hingga 15%. Premium spot untuk beberapa server CPU AI kelas atas bahkan lebih tinggi, dan mungkin ada putaran kenaikan harga baru pada paruh kedua tahun ini.
Jia Bin mengatakan bahwa selama lebih dari sepuluh tahun terakhir, server CPU pada dasarnya "bertambah performanya tanpa naik harganya", kinerja meningkat dengan kemajuan proses manufaktur, tetapi harga satuan tetap. Kenaikan harga tahun ini jarang terjadi di industri ini. Tingkat utilisasi kapasitas lini produksi utama Intel telah meningkat dari sebelumnya kurang dari 80% menjadi 100%, dengan beberapa model mengalami kekurangan pasokan dan siklus pengiriman 3 hingga 4 bulan.
AMD juga menghadapi keketatan kapasitas. Jia Bin mengatakan bahwa tahun 2026 adalah pertama kalinya sejak ia bergabung dengan industri ini melihat kapasitas server CPU Intel dan AMD hampir seluruhnya dipesan. "Pasokan CPU selalu memadai di masa lalu, tahun ini justru sebaliknya."
Jia Bin juga mencatat bahwa permintaan pelanggan terhadap CPU saat membeli server AI sedang terbagi menjadi dua kategori. Satu adalah CPU yang beroperasi di dalam rak server bersama dengan GPU, mengejar jumlah inti ekstrem, di atas 128 inti, dengan harga rata-rata di atas 4000 dolar AS, sedangkan harga rata-rata server CPU tradisional hanya sedikit di atas 2000 dolar AS. Kategori lainnya adalah CPU yang diterapkan secara independen di luar rak server, digunakan untuk eksekusi alat, operasi sandbox, dan penjadwalan tugas oleh Agen, tidak memerlukan kinerja ekstrem, sekitar 64 inti sudah cukup, tetapi jumlah yang dibutuhkan jauh lebih besar.
data-check-id="404427">Jia Bin mengatakan bahwa setiap tugas Agen idealnya menggunakan satu CPU secara eksklusif, dan penerapan independen lebih efisien daripada partisi virtualisasi. Harga rata-rata CPU di luar rak sekitar 3000 dolar AS. "Semakin tinggi jumlah intinya, semakin besar persentase kenaikan harga satuan, tidak proporsional. Jadi, penggunaan produk menengah di luar rak untuk kuantitas besar, dan produk unggulan di dalam rak untuk kinerja, adalah praktik umum pelanggan saat ini."Dalam laporan penelitian industri semikonduktor berjudul "Rise of the Agents" yang dirilis Bank of America Securities pada 11 Juni, mereka merevisi perkiraan Total Addressable Market (TAM) server CPU pada tahun 2030 menjadi lebih dari 170 miliar dolar AS, dan untuk pertama kalinya membagi pasar ini menjadi tiga bagian: CPU komputasi awan tradisional sekitar 30 miliar dolar AS, CPU node kepala klaster AI sekitar 70 miliar dolar AS, dan CPU node independen agen AI sekitar 70 miliar dolar AS. Di antara ini, bagian ketiga hampir nol pada tahun 2025, merupakan pasar baru yang baru muncul mulai tahun 2026.
Morgan Stanley dalam laporan penelitian pada 4 Juni juga memprediksi bahwa agen AI akan membawa permintaan baru sebesar 32,5 hingga 60 miliar dolar AS ke pasar server CPU sebelum tahun 2030. Zhongtai Securities dalam laporan penelitian mendalam tentang CPU yang dirilis pada 7 Juni mendefinisikan tahun 2026 sebagai "tahun pertama CPU mendapatkan manfaat dari ekspansi AI".
Laporan penelitian Bank of America Securities tersebut juga mencantumkan perbandingan historis volume pengiriman: volume pengiriman CPU AI pada tahun 2022 setara dengan 19% dari volume pengiriman akselerator AI (GPU dll), pada tahun 2025 proporsi ini naik menjadi 51%, dan diproyeksikan mencapai 127% pada tahun 2030. Menurut prediksi ini, jumlah CPU dalam server AI akan melebihi GPU dalam 5 tahun.
Permintaan Baru untuk CPU Lokal
Informasi yang dirilis NVIDIA selama pameran komputer Taipei menunjukkan bahwa Vera CPU terbaru mereka berbasis pada arsitektur ARM (satu set instruksi CPU yang terkenal dengan konsumsi daya rendah dan efisiensi energi tinggi, bersaing dengan x86 sebagai dua arsitektur utama), dapat digunakan hingga 256 chip per rak, dan menggunakan pendingin cair.
Dalam skenario sandbox Agen, kinerja Vera 1,8 kali lebih tinggi daripada prosesor x86. Dalam kluster superkomputer Vera Rubin terbaru NVIDIA (platform pusat data AI generasi berikutnya NVIDIA), satu POD (unit komputasi lengkap minimal yang terdiri dari beberapa rak) dengan 40 rak berisi 1152 Rubin GPU dan hingga 1088 Vera CPU, dengan rasio keduanya mendekati 1:1.
NVIDIA juga menyebutkan bahwa Grace CPU yang dirilis sebelumnya telah mengakumulasi pengiriman hampir 2,5 juta chip, dan pendapatan terkait CPU pada tahun 2026 diperkirakan mendekati 20 miliar dolar AS.
Jia Bin berpendapat bahwa statistik 20 miliar dolar AS di atas memiliki cakupan yang relatif luas, mencakup kepemilikan pendapatan CPU dalam berbagai bentuk produk, tidak sepenuhnya sama dengan pendapatan dari penjualan chip CPU secara terpisah dalam arti tradisional. Namun, bahkan dengan mempertimbangkan perbedaan cakupan, volume ini sudah cukup besar bagi perusahaan yang belum memiliki bisnis CPU independen pada tahun 2024.
Lin Meibing berpendapat bahwa sinyal NVIDIA membuat CPU lebih signifikan daripada produk itu sendiri. Di masa lalu, server AI berfokus pada GPU, CPU hanya pelengkap. Ketika perusahaan GPU terbesar di dunia membuat CPU sendiri dan mengunci pelanggan pertamanya sebagai OpenAI dan Anthropic, posisi pasar CPU telah sangat berbeda dibandingkan dua tahun lalu.
Menurut laporan keuangan AMD kuartal pertama 2026, pendapatan bisnis pusat data perusahaan mencapai 5,775 miliar dolar AS, untuk pertama kalinya melampaui Intel yang sebesar 5,1 miliar dolar AS pada periode yang sama. Selain itu, Lisa Su mengajukan target lima tahun dalam konferensi telepon laporan keuangan: pendapatan tahunan pusat data menuju 100 miliar dolar AS.
CEO Intel, Patrick Gelsinger, juga telah menyatakan di berbagai kesempatan publik bahwa ia memiliki keyakinan kuat pada peran inti CPU di era AI.
Ini juga merupakan peluang bagi perusahaan rantai pasokan CPU di Tiongkok. Jia Bin mengatakan bahwa penyedia layanan cloud terkemuka di dalam negeri tahun ini meningkatkan pengadaan server CPU, di satu sisi untuk mendukung pembelian GPU untuk pusat data AI baru, di sisi lain karena rasio CPU terhadap GPU berkurang dari 1:8 di masa lalu menjadi 1:4 atau lebih tinggi, sehingga jumlah CPU yang dibutuhkan untuk pusat data yang sama lebih dari dua kali lipat dibandingkan tahun lalu.
Faktanya, di Tiongkok, telah terbentuk rantai industri yang relatif lengkap di sekitar server CPU.
Hygon Information (688041.SH) adalah salah satu produsen server CPU berbasis arsitektur x86 dengan volume pengiriman terbesar di Tiongkok. Menurut laporan keuangan terkait, pendapatan Hygon Information pada tahun 2025 adalah 14,377 miliar yuan, meningkat 56,92% dibandingkan tahun sebelumnya; pendapatan kuartal pertama 2026 adalah 4,034 miliar yuan, dengan laju pertumbuhan tahunan meningkat lebih lanjut menjadi 68,06%.
Menurut informasi publik, Huawei Kunpeng mengikuti jalur pengembangan mandiri penuh berbasis ARM. Kunpeng 920/950 bekerja sama erat dengan chip AI Ascend, terutama melayani ekosistem sendiri Huawei dan pasar teknologi informasi yang aman dan dapat dikendalikan (信创).
Dalam hal chip pendukung, Montage Technology (688008.SH) adalah produsen utama chip antarmuka memori (chip yang bertindak sebagai perantara sinyal antara server CPU dan modul memori). Menurut informasi publik, pangsa pasar chip antarmuka memorinya pada tahun 2024 adalah 36,8%, menempati posisi pertama global; lini produk lainnya, chip PCIe Retimer (digunakan untuk amplifikasi dan perbaikan sinyal dalam transmisi data berkecepatan tinggi), pangsa pasar global tahun 2024 adalah 10,9%, peringkat kedua.
Di segmen pengemasan dan pengujian manufaktur, menurut informasi publik, Tongfu Microelectronics (002156.SZ) adalah salah satu mitra pengemasan dan pengujian terpenting AMD secara global.
Li Bin mengatakan kepada wartawan bahwa ekosistem perangkat lunak chip lokal sedang mendekati titik kritis. Dia memberikan contoh: pada hari peluncuran DeepSeek V4, beberapa produsen chip lokal menyelesaikan adaptasi pada hari yang sama, sedangkan periode adaptasi untuk DeepSeek R1 sebelumnya membutuhkan 1 hingga 2 bulan. Percepatan signifikan dalam kecepatan adaptasi menunjukkan bahwa rantai alat perangkat lunak dan lapisan driver chip lokal matang dengan cepat, yang menguntungkan seluruh rantai industri CPU dan akselerator lokal.
Dalam pandangan Lin Meibing, logika manfaat untuk CPU lokal terbagi menjadi dua lapisan: satu adalah pertumbuhan industri yang didorong oleh peningkatan permintaan server CPU global, dan lapisan lainnya adalah substitusi produk lokal yang didorong oleh kebijakan teknologi informasi yang aman dan dapat dikendalikan (信创).
Menurut persyaratan dokumen terkait yang dikeluarkan oleh State-owned Assets Supervision and Administration Commission (SASAC) pada tahun 2022, perusahaan milik negara pusat dan daerah harus menyelesaikan transformasi sistem informasi mereka dengan produk lokal sebelum akhir tahun 2027. Wartawan juga mengetahui dalam proses wawancara bahwa tingkat lokalisasi server CPU kelas tinggi di dalam negeri saat ini masih relatif rendah, dengan ruang substitusi yang luas. Dengan waktu kurang dari 2 tahun menuju titik kebijakan, jendela pengiriman CPU untuk teknologi informasi yang aman dan dapat dikendalikan semakin sempit, yang merupakan ujian konsentrasi terhadap kematangan produk dan kemampuan pengiriman produsen CPU lokal seperti Hygon Information dan Loongson Technology (688047.SH).
Lin Meibing berpendapat bahwa siklus kenaikan harga CPU saat ini berbeda dengan masa lalu, peningkatan berasal dari permintaan baru CPU dari AI Agent, bukan permintaan penggantian yang didorong oleh peningkatan proses manufaktur.
Penilaian Ying Zhiwei serupa. Dia mengatakan bahwa perhatian pasar selama beberapa tahun terakhir hampir seluruhnya terfokus pada GPU, tetapi ketika aplikasi AI benar-benar memasuki fase penerapan skala besar, fungsi penjadwalan dan manajemen yang diambil alih oleh CPU hanya akan semakin berat. Dalam pandangannya, ini bukan tentang CPU menggantikan GPU, GPU masih penting, tetapi yang benar-benar membuat perbedaan selanjutnya adalah kemampuan kolaborasi antara CPU dan GPU, bukan parameter kinerja satu chip.
Artikel ini berasal dari akun WeChat Official: Economic Observer , penulis: Zheng Chenye







