Tiga tahun terakhir, cerita komputasi AI hampir seluruhnya berkisar pada GPU.
Mulai dari H100, H200 NVIDIA, hingga GB200, GB300, dan kluster ratusan ribu kartu yang diperluas oleh vendor cloud—semua narasi industri bercerita tentang satu hal: kendala komputasi ada di GPU. CPU dalam cerita ini, lama dianggap sebagai peran "pendukung" yang kurang penting, mengikuti GPU, mengerjakan tugas-tugas yang tidak ingin dilakukan GPU.
Tapi mulai 2026, narasi ini mulai retak.
Pada 1 Juni, Intel meluncurkan prosesor Xeon 6+ di Beijing, dirancang khusus untuk beban kerja cloud-native, AI agen, dan intensif jaringan. Ini adalah CPU pusat data pertama yang menggunakan proses Intel 18A.
Dalam deskripsi Intel sendiri, Xeon 6+ tidak berperan sebagai "pendukung" GPU, melainkan sebagai "bidang kendali" infrastruktur AI, yang bertanggung jawab atas orkestrasi, konkurensi, dan aliran data.
"Jalan perluasan AI tidak terletak pada penumpukan komponen, tetapi pada sinergi sistem." kata Kevork Kechichian, Wakil Presiden Eksekutif Intel dan General Manager Data Center and AI Group dalam sesi komunikasi. "Seiring AI memasuki era agen, orkestrasi, konkurensi, dan aliran data menjadi faktor pembatas baru. Ini memperkuat fakta inti: CPU tetap menjadi bidang kendali infrastruktur AI modern."
Ini bukan hanya penilaian Intel. Februari lalu, lembaga riset semikonduktor independen SemiAnalysis merilis laporan tentang peta CPU pusat data 2026 berjudul "CPU Resurgence", dengan penilaian yang sama langsung. Di era pelatihan dan inferensi AI berskala besar saat ini, CPU dibutuhkan kembali dengan cara yang sama sekali berbeda dari tiga tahun terakhir.
Hanya saja "kembali" ini perlu dilihat lebih dalam. Ini bukan CPU kembali menjadi bintang utama, melainkan CPU didefinisikan ulang di posisi baru.
I. Retakan Teori Sentralitas GPU
Untuk memahami mengapa CPU "kembali", kita harus kembali ke perubahan beban kerja AI itu sendiri.
Dua tahun terakhir, narasi utama komputasi AI adalah pelatihan. Skala pelatihan model besar meningkat empat hingga sepuluh kali lipat per tahun, membutuhkan komputasi paralel masif, dan di sini GPU adalah pemeran utama mutlak. Tapi pelatihan bukanlah keseluruhan beban kerja AI.
Berdasarkan penilaian Intel dalam sesi komunikasi, beban kerja komputasi AI secara garis besar dapat dibagi menjadi tiga kategori:
Pertama adalah beban kerja dasar. Penyimpanan, basis data, Web, layanan mikro, CDN. Ini bukan AI, tapi layanan dasar yang dibutuhkan agar AI dapat berjalan. Bagian ini tetap menjadi medan tempur utama CPU tradisional.
Kedua adalah pelatihan. Pelatihan model besar mutakhir hampir sepenuhnya bergantung pada GPU dan akselerator khusus. Inilah bagian yang diperebutkan semua orang dalam tiga tahun terakhir.
Ketiga adalah inferensi dan agen. Bagian ini tumbuh pesat, dan berbeda signifikan dengan pelatihan.
Perbedaan kunci kategori ketiga terletak pada bentuk beban kerja itu sendiri. Pelatihan adalah proses "menghitung" model dari nol, paralelisme sangat tinggi, kebutuhan komputasi puncak per titik sangat tinggi. Tapi inferensi dan agen tidak—ini adalah proses menjalankan model yang sudah dilatih di bisnis nyata.
Ini berarti banyak hal yang dilakukan bukan "menghitung", melainkan mengatur: menjadwalkan kolaborasi beberapa model, mengelola konteks, mengoordinasi aliran data antar-agen, menangani permintaan konkuren dari pengguna, memastikan prediktabilitas latensi.
Hal-hal ini bukan keahlian GPU.
"Dalam skenario ini, kami melihat beban kerja yang menggabungkan akselerasi tingkat GPU, tetapi intinya tetap adalah beban kerja dengan CPU tradisional sebagai inti." kata Kevork Kechichian.
Di balik ini ada fakta industri yang lebih konkret. SemiAnalysis dalam laporan "CPU Resurgence" memberi contoh: di pusat data "Fairwater" yang dibangun Microsoft untuk OpenAI, satu gedung CPU dan penyimpanan 48 MW, mendukung kluster GPU 295 MW.
Artinya, agar kluster GPU 295 MW itu benar-benar berjalan, dibutuhkan ribuan CPU untuk memproses aliran data tingkat PB yang dihasilkan GPU, menjadwalkan tugas, dan mengelola penyimpanan.
Semakin tinggi komputasi GPU didorong, semakin besar "permintaan komputasi sekitarnya" yang dihasilkannya. Dan permintaan komputasi sekunder ini akhirnya jatuh ke CPU.
Jadi, kembalinya CPU bukan berarti "CPU kembali lebih cepat dari GPU". Melainkan, ketika bentuk komputasi AI berkembang dari "melatih satu model besar" menjadi "menjalankan ribuan agen", hal-hal seperti orkestrasi dan aliran data kembali menjadi hambatan. GPU tidak bisa menyelesaikan ini, CPU bisa.
Inilah sisi lain dari narasi AI tiga tahun terakhir yang terabaikan.
II. Jalan Apa yang Ditempuh Xeon 6+?
Taruhan penilaian Intel tercermin dalam definisi produk Xeon 6+.
Angka paling langsung adalah maksimal 288 inti, dan semuanya adalah inti efisiensi (E-core).
E-core dan P-core adalah percabangan arsitektur CPU yang dilakukan Intel beberapa tahun terakhir. P-core adalah inti performa, mengejar performa inti tunggal maksimal, target desain CPU server tradisional. E-core adalah inti efisiensi, performa inti tunggal lebih rendah, tapi area lebih kecil, daya lebih rendah, bisa memasukkan lebih banyak inti dalam area chip yang sama.
Xeon 6+ mendorong percabangan ini ke ekstrem. 288 inti efisiensi, berarti Intel bertaruh bukan pada "seberapa cepat tiap inti", melainkan "berapa banyak inti yang bisa dimasukkan dalam satu CPU".
Logika definisi produk ini adalah: beban kerja AI agen bukan masalah seberapa cepat satu inti bisa berjalan, tapi apakah bisa menjalankan ribuan tugas ringan secara bersamaan. Ketika satu server perlu mengatur ratusan agen, menangani ribuan permintaan inferensi, mempertahankan puluhan ribu koneksi konkuren secara bersamaan, kemampuan throughput 288 E-core jauh lebih penting daripada performa inti tunggal 64 P-core.
Ini adalah definisi produk yang bertentangan dengan arus utama. Selama beberapa dekade, narasi utama CPU server adalah berlomba dalam performa inti tunggal, frekuensi lebih tinggi, IPC lebih kuat, cache lebih besar. Jalur E-core pada dasarnya mengakui: narasi itu mungkin akan berakhir.
Tapi ada beberapa hal yang harus dilihat bersamaan.
Pertama, jalur E-core bukan monopoli Intel. AMD sudah meluncurkan Bergamo pada 2023, berbasis inti Zen 4c yang dioptimalkan untuk kepadatan. Seri Graviton AWS, seri AmpereOne Ampere juga sudah lama mengambil jalur "inti kepadatan tinggi + prioritas efisiensi". Dalam peta jalan AmpereOne Aurora yang diumumkan Ampere pada 2024, jumlah inti sudah mencapai 512.
Artinya, Xeon 6+ adalah Intel yang mengejar arah industri yang sudah ada—Intel bukan pemimpin, melainkan pemain yang kembali ke arah industri.
Kedua, Xeon 6+ adalah CPU pusat data pertama dengan proses Intel 18A, dan dalam konteks Intel sendiri, ini mungkin lebih penting daripada "288 inti E-core".
Intel 18A adalah taruhan terbesar Intel beberapa tahun terakhir. Ini tidak hanya tentang satu CPU, tapi tentang apakah Intel Foundry, bisnis fabilikasi Intel, bisa bertahan. Jika proses 18A tidak bisa memberikan produk yang kompetitif, cerita Intel Foundry tidak akan bertahan.
Xeon 6+ dibuat dengan proses 18A, jumlah inti efisiensi didorong ke 288, dan diumumkan memiliki "kepadatan performa terdepan di industri"—ini adalah salah satu jawaban Intel kepada pasar. Apakah ini diakui pasar, apakah bisa bertahan dalam kompetisi generasi yang sama dengan N2 TSMC dan 2nm Samsung, adalah masalah lain.
Ketiga, daftar pelanggan Xeon 6+ menampilkan beberapa nama yang bermakna industri—Ericsson menggunakan Xeon 6+ untuk menguji jaringan inti 5G, T-Systems anak perusahaan Deutsche Telekom menggunakan Xeon 6+ untuk membangun infrastruktur AI agen privat. Kedua pelanggan ini adalah pembeli CPU pusat data tradisional yang stabil, pilihan pembelian mereka sendiri adalah sinyal pasar.
Melihat ketiga hal ini bersama-sama, Xeon 6+ menempuh jalan seperti ini: menggunakan proses 18A untuk mendapatkan keunggulan efisiensi, menggunakan 288 E-core untuk mendapatkan kepadatan inti, menargetkan beban kerja tipe "kepadatan tinggi, efisiensi tinggi, throughput tinggi" dalam skenario inferensi dan agen AI.
Ini bukan cerita CPU kembali ke panggung utama komputasi, melainkan cerita CPU menemukan posisi baru.
III. Apakah Ini Benar-benar Berhasil?
Apakah cerita "kembalinya CPU" yang diceritakan Intel ini benar-benar berhasil? Perlu dilihat beberapa variabel lain dalam industri.
Variabel pertama adalah reaksi vendor GPU.
NVIDIA dalam dua tahun terakhir juga melakukan hal terkait "orkestrasi", kombinasi Grace CPU + Hopper GPU sendiri adalah upaya NVIDIA untuk melengkapi peran CPU. Jika vendor GPU sendiri membuat solusi terintegrasi "CPU + GPU" menjadi arus utama, posisi vendor CPU sebagai peran independen akan tertekan. Ini adalah lawan terbesar narasi Intel "CPU adalah bidang kendali", bukan AMD, melainkan NVIDIA sendiri.
Variabel kedua adalah CPU buatan sendiri vendor cloud.
AWS Graviton sudah digunakan dalam skala besar di pusat data AWS sendiri, menangani sebagian besar beban kerja komputasi umum internal AWS. Microsoft mengerjakan Cobalt, Google mengerjakan Axion, Alibaba mengerjakan Yitian, hampir semua vendor cloud utama mengembangkan CPU server berbasis ARM sendiri.
CPU buatan sendiri ini juga mengambil jalur "kepadatan tinggi, prioritas efisiensi"—berada dalam persaingan langsung dengan Xeon 6+ dalam definisi produk.
Artinya, pasar yang ingin direbut Xeon 6+, sedang dibuat sendiri oleh vendor cloud. Intel perlu membuktikan bahwa di luar CPU buatan sendiri vendor cloud, masih ada pasar yang cukup besar. Misalnya operator telekomunikasi, cloud privat, pusat data industri vertikal.
Variabel ketiga adalah proses 18A itu sendiri.
Xeon 6+ adalah CPU pusat data pertama dengan Intel 18A, ini sendiri berarti chip ini memiliki makna industri jauh melebihi produk itu sendiri. Jika proses 18A memiliki masalah dalam hasil produksi, stabilitas performa, validasi pelanggan, kinerja pasar Xeon 6+ akan terdampak. Sebaliknya, jika 18A stabil, Xeon 6+ justru bisa memberikan ruang bernapas bagi Intel Foundry.
Tapi 18A tidak berjalan dalam ruang hampa—proses N2 TSMC mulai diproduksi massal paruh kedua 2026, 2nm Samsung juga sedang dalam perjalanan. Yang ingin dicapai Intel 18A bukan hanya "bisa dibuat", tapi "bisa dibuat dan tetap unggul", ini standar yang lebih tinggi.
Menggabungkan ketiga variabel ini, kualitas akhir Xeon 6+ tidak hanya bergantung pada dirinya sendiri, tetapi juga pada apakah NVIDIA akan mengambil alih peran CPU sendiri, apakah vendor cloud akan terus mengembangkan CPU sendiri, apakah Intel 18A bisa bertahan dalam kompetisi generasi yang sama dengan TSMC dan Samsung.
Inilah mengapa hal "kembalinya CPU", dilihat dari penilaian tingkat industri adalah valid, namun dari sudut pandang apakah Intel sendiri bisa mendapatkan manfaat dari kembalinya ini, masih merupakan tanda tanya.
Perebutan posisi CPU di panggung komputasi AI telah berlangsung selama tiga tahun.
Naskah tiga tahun terakhir adalah "GPU adalah pusat, CPU adalah pendukung". Naskah ini mulai longgar pada 2026—bukan karena CPU kembali lebih cepat dari GPU, tetapi karena bentuk komputasi AI sendiri berubah. Ketika AI berkembang dari "melatih satu model" menjadi "menjalankan ribuan agen", hal-hal seperti orkestrasi, konkurensi, aliran data kembali menjadi hambatan sistem, dan CPU menjadi tak tergantikan di posisi ini.
Intel memasang taruhan pada hal ini, Xeon 6+ adalah jawabannya. Tapi apakah ini akan berhasil, apakah Intel sendiri bisa mendapatkan manfaat dari gelombang ini, akhirnya harus dijawab di ruang server pelanggan pada 2027, 2028. AMD, kubu ARM, CPU buatan sendiri vendor cloud, NVIDIA yang membuat CPU sendiri, setiap variabel bisa mengubah arah naskah.
Kembalinya CPU itu nyata, tapi siapa yang memimpin kembalinya ini, masih belum pasti.






