Selama dua tahun terakhir, inti dari perangkat keras AI hampir hanya satu: GPU.
Dari pelatihan model besar, hingga kluster inferensi, hingga komputasi ujung-ke-awan, seluruh industri membahas siapa yang bisa mendapatkan lebih banyak GPU, siapa yang bisa memasukkan lebih banyak kartu komputasi ke pusat data. Bisa dikatakan, seluruh industri AI berputar di sekitar GPU, yang juga mendorong harga saham NVIDIA mencapai rekor tertinggi berulang kali.
Tetapi di COMPUTEX 2026, Intel memberikan penilaian yang berbeda: Tahap berikutnya dari AI, tidak bisa hanya dilihat dari GPU. Inti dari penilaian ini adalah kata kunci yang terus ditekankan oleh Pat Gelsinger dalam pidato utamanya: Agentic AI, atau yang biasa kita sebut sebagai agen cerdas.
Sumber: Intel
Agen Cerdas Sedang Mengubah Ekosistem Komputasi
Perbedaan agen cerdas dengan AI tradisional sebenarnya cukup besar. AI tradisional digunakan seperti mesin tanya-jawab "giliran", sedangkan agen cerdas harus masuk ke dalam alur kerja nyata, secara aktif menyelesaikan siklus "berpikir, merencanakan, bertindak, merefleksikan". Dengan kata lain, ia harus belajar membaca data, memanggil alat, menjalankan tugas dan memeriksa hasil, kemudian terus menyesuaikan langkah berikutnya berdasarkan umpan balik.
Ini berarti inferensi AI tidak lagi hanya transaksi "sekali selesai", tetapi menjadi sistem pengambilan keputusan dan penalaran mandiri yang berjalan terus-menerus, yang juga sepenuhnya mengubah cara penggunaan daya komputasi. Jadi, poin inti Intel kali ini adalah: Agentic AI akan membentuk ulang rasio daya komputasi di pusat data.
Saat ini, pada tahap pelatihan model mutakhir, rasio CPU dan GPU bisa mendekati 1:8, dengan GPU menanggung sebagian besar tekanan komputasi. Tetapi saat memasuki mode inferensi agen cerdas, CPU perlu bertanggung jawab atas penjadwalan tugas, pemanggilan alat, migrasi data, dan koordinasi sistem. Pada saat ini, rasio CPU dan GPU akan perlahan bergerak menuju 1:1, bahkan mungkin membutuhkan kepadatan CPU yang lebih tinggi untuk memecah tugas dengan cepat.
Faktanya, ketika seorang agen cerdas tidak hanya menghasilkan sebuah jawaban, tetapi perlu terus memanggil model, alat, dan sistem eksternal, status kerjanya menjadi sangat berbeda dari AI tradisional. Intel dalam pidatonya menyebutkan sebuah data: dibandingkan dengan inferensi satu putaran, konsumsi Token sebuah agen cerdas bisa meningkat hingga 1000 kali lipat.
Sumber: Intel
Dengan kata lain, yang dibawa oleh agen cerdas bukanlah pertumbuhan sederhana dalam volume inferensi, tetapi beban sistem yang lebih kompleks, lebih frekuen, dan lebih tersegmentasi. Jika beban ini semua dibebankan ke GPU, itu akan menjadi tidak efisien dan mahal.
Prosesor Xeon 6+ yang diluncurkan Intel kali ini dibuat berdasarkan proses manufaktur Intel 18A, dilengkapi dengan maksimal 288 core efisiensi, dan dilengkapi dengan cache L3 hingga 576MB, ditujukan untuk kebutuhan beban kerja seperti cloud-native, Agentic AI, dan intensif jaringan, dapat memberikan efisiensi energi yang lebih tinggi dan performa berkelanjutan yang lebih stabil.
Dalam skema yang diberikan Intel, satu rak berpendingin cair yang menempati ruang komputasi 32U, dapat menyediakan 36864 core; konsumsi daya rak hanya sekitar 100kW, cukup untuk menampung deployment agen cerdas berkepadatan tinggi. Meskipun 100kW terdengar menakutkan, dibandingkan dengan rak server berperforma setara di masa lalu, konsumsi dayanya sudah jauh berkurang.
Dan di luar Xeon 6+, ada hal lain yang lebih layak diperhatikan: pemisahan ulang arsitektur inferensi oleh Intel.
Dalam pidatonya, Intel mengumumkan kerja sama dengan SambaNova, Vista Equity Partners, Cambium Capital, dan mitra lainnya, secara resmi meluncurkan skema inferensi terpisah sepenuhnya yang baru. Skema ini berjalan di Vector Core Compute Intelligent Cloud, dengan prosesor Intel Xeon 6 bertanggung jawab atas orkestrasi dan eksekusi, kemudian melalui SambaNova SN40 RDU bertanggung jawab atas decoding, dan akhirnya oleh GPU NVIDIA Blackwell bertanggung jawab atas prefilling.
Sumber: Intel
Skema baru ini dirancang khusus untuk beban kerja agen cerdas. Berbeda dengan banyak sistem AI di masa lalu yang terbiasa menyerahkan sebagian besar pekerjaan dalam rantai inferensi ke GPU, dalam sistem ini, CPU, RDU, dan GPU akan menjalankan perannya masing-masing, bertanggung jawab atas penjadwalan sistem, decoding, prefilling, dan tautan berbeda lainnya, memastikan setiap tahap inferensi berjalan di perangkat keras yang paling sesuai, memaksimalkan efisiensi.
Dan setelah memperkenalkan Xeon 6+, prosesor Core Ultra generasi ketiga yang diluncurkan beberapa waktu lalu juga muncul kembali. Ini adalah bagian lain dari ekosistem AI Intel — inti AI di sisi ujung. Dalam pidato tersebut, server hybrid lokal yang ditunjukkan oleh Intel dan Perplexity, dibangun berdasarkan server ujung Core Ultra generasi ketiga dan server awan Xeon 6+.
Sumber: Intel
Ini dapat secara dinamis mendistribusikan beban kerja antara lokal dan awan berdasarkan kemampuan perangkat dan karakteristik fungsionalnya, lebih lanjut mengurangi ketergantungan pada daya komputasi awan. Ini juga merupakan bentuk ideal dari PC AI di masa depan: dengan mengalokasikan performa secara dinamis, mengurangi biaya Token sekaligus memastikan ketepatan waktu tugas dan privasi data terlindungi.
Selain PC, Intel juga memperluas Core Ultra generasi ketiga ke area perangkat genggam game dan komputasi tepi. Prosesor Arc G3 series yang baru diluncurkan ditujukan untuk perangkat game genggam, dioptimalkan berdasarkan arsitektur generasi yang sama, akan dirilis pada akhir bulan ini (iGPU yang paling dinantikan pengguna perangkat genggam akan datang).
Dari Umum ke Kustomisasi, Intel Juga Ingin "Ada di Mana-mana"
Dan selain prosesor umum, Intel kali ini juga menekankan chip kustom, yang merupakan bisnis yang terus dipromosikan oleh Pat Gelsinger sejak menjabat sebagai CEO Intel.
Intel percaya bahwa chip kustom akan memiliki pasar yang besar di masa depan, karena seiring AI masuk ke industri yang berbeda, pelanggan akan semakin tidak puas dengan daya komputasi umum. Untuk mengejar efisiensi dan performa yang lebih tinggi, mereka akan cenderung beralih ke chip kustom untuk mempertahankan daya saing mereka.
Dalam pidatonya, Intel menyebutkan sedang bekerja sama dengan Google untuk meluncurkan IPU, chip semacam ini sangat penting bagi penyedia layanan cloud untuk meningkatkan performa infrastruktur. Bersamaan, Intel juga bekerja sama dengan pelanggan telekomunikasi seperti Ericsson, menyediakan chip infrastruktur nirkabel canggih di seluruh dunia.
Ini sebenarnya adalah tema lain dari pidato Pat Gelsinger ini: Intel tidak lagi hanya mengandalkan satu chip umum untuk memenangkan pasar, tetapi mengemas chip, sistem, perangkat lunak, dan kerja sama industri menjadi satu set solusi lengkap, dan dapat disesuaikan bebas sesuai kebutuhan perusahaan yang berbeda, untuk memaksimalkan keunggulan Intel.
Sumber: Intel
Menurut Lei Technology, Intel sebenarnya sedang mendefinisikan ulang posisi ekosistemnya: pusat data membutuhkan CPU untuk bertanggung jawab atas orkestrasi agen cerdas, sistem inferensi membutuhkan heterogenitas dan pemisahan untuk mengurangi biaya, PC membutuhkan pemrosesan AI lokal untuk masalah privasi dan kepatuhan, komputasi tepi dan embodied intelligence membutuhkan chip berdaya tinggi, dan pelanggan industri membutuhkan chip yang dapat disesuaikan.
Dengan memenuhi kebutuhan perusahaan di bidang dan tautan yang berbeda, Intel akan menjadi lebih "ada di mana-mana" daripada NVIDIA.
Tentu saja, tekanan di depan Intel masih besar. Keunggulan NVIDIA dalam akselerator AI dan ekosistem perangkat lunak masih jelas, AMD juga terus menyerang dalam CPU server dan chip AI. Agar Intel berhasil menempuh jalan ini, akhirnya tergantung pada kecepatan produksi massal 18A dan apakah skema tingkat rak Xeon 6+ dapat diimplementasikan dengan cepat, serta apakah pelanggan benar-benar dapat melihat manfaat signifikan dari skema baru ini.
Tapi setidaknya kali ini, arah Intel lebih jelas daripada sebelumnya.
Bisa dikatakan, seiring AI memasuki era agen cerdas, persaingan sudah lama bukan lagi hanya perbandingan performa puncak dari satu chip tunggal, tetapi melibatkan optimalisasi efisiensi sinergi dari seluruh sistem komputasi. GPU masih penting, tetapi CPU, perangkat tepi, AI lokal, dan chip kustom juga akan menjadi kunci kembali.
Dan yang ingin ditangkap oleh Intel, adalah periode jendela pembagian kerja ulang infrastruktur AI ini.












