Berhenti Fokus pada GPU, Intel Lemparkan Gerakan Besar, Bisakah Mengakhiri Monopoli Komputasi NVIDIA?

marsbit发布于2026-06-03更新于2026-06-03

文章摘要

Dalam dua tahun terakhir, GPU telah menjadi pusat perangkat keras AI, mendorong dominasi Nvidia. Namun, di COMPUTEX 2026, Intel menyajikan perspektif berbeda: **era AI selanjutnya tidak boleh hanya berfokus pada GPU**. Kuncinya adalah **Agentic AI (agen cerdas)**. Agen cerdas mengubah paradigma komputasi dari sistem tanya-jawab menjadi entitas yang aktif "berpikir, merencanakan, bertindak, dan merefleksikan" dalam alur kerja nyata. Pergeseran ini akan **membentuk ulang alokasi komputasi di pusat data**. Untuk beban kerja pelatihan model, rasio CPU:GPU bisa mencapai 1:8, tetapi untuk inferensi agen cerdas yang membutuhkan pengaturan tugas, pemanggilan alat, dan koordinasi sistem, rasio tersebut bergerak menuju 1:1 atau bahkan membutuhkan kepadatan CPU lebih tinggi. Intel meluncurkan **prosesor Xeon 6+** berbasis proses 18A, dengan hingga 288 core efisiensi dan 576MB cache L3, dirancang untuk beban kerja cloud-native, Agentic AI, dan jaringan yang padat. Solusi rak yang ditawarkan menawarkan efisiensi energi lebih tinggi. Lebih lanjut, Intel memperkenalkan **arsitektur inferensi terpisah (fully decoupled inference)** bekerja sama dengan mitra seperti SambaNova. Skema ini membagi tugas inferensi agen cerdas di antara CPU Xeon 6 (untuk pengaturan), SambaNova SN40 RDU (dekode), dan GPU NVIDIA Blackwell (prefill), sehingga setiap tahap berjalan pada perangkat keras paling optimal. Di sisi *edge*, **prosesor Core Ultra Gen 3** menjadi inti AI lokal, memungkinkan alokasi beban ke...

Selama dua tahun terakhir, inti dari perangkat keras AI hampir hanya satu: GPU.

Dari pelatihan model besar, hingga kluster inferensi, hingga komputasi ujung-ke-awan, seluruh industri membahas siapa yang bisa mendapatkan lebih banyak GPU, siapa yang bisa memasukkan lebih banyak kartu komputasi ke pusat data. Bisa dikatakan, seluruh industri AI berputar di sekitar GPU, yang juga mendorong harga saham NVIDIA mencapai rekor tertinggi berulang kali.

Tetapi di COMPUTEX 2026, Intel memberikan penilaian yang berbeda: Tahap berikutnya dari AI, tidak bisa hanya dilihat dari GPU. Inti dari penilaian ini adalah kata kunci yang terus ditekankan oleh Pat Gelsinger dalam pidato utamanya: Agentic AI, atau yang biasa kita sebut sebagai agen cerdas.

Sumber: Intel

Agen Cerdas Sedang Mengubah Ekosistem Komputasi

Perbedaan agen cerdas dengan AI tradisional sebenarnya cukup besar. AI tradisional digunakan seperti mesin tanya-jawab "giliran", sedangkan agen cerdas harus masuk ke dalam alur kerja nyata, secara aktif menyelesaikan siklus "berpikir, merencanakan, bertindak, merefleksikan". Dengan kata lain, ia harus belajar membaca data, memanggil alat, menjalankan tugas dan memeriksa hasil, kemudian terus menyesuaikan langkah berikutnya berdasarkan umpan balik.

Ini berarti inferensi AI tidak lagi hanya transaksi "sekali selesai", tetapi menjadi sistem pengambilan keputusan dan penalaran mandiri yang berjalan terus-menerus, yang juga sepenuhnya mengubah cara penggunaan daya komputasi. Jadi, poin inti Intel kali ini adalah: Agentic AI akan membentuk ulang rasio daya komputasi di pusat data.

Saat ini, pada tahap pelatihan model mutakhir, rasio CPU dan GPU bisa mendekati 1:8, dengan GPU menanggung sebagian besar tekanan komputasi. Tetapi saat memasuki mode inferensi agen cerdas, CPU perlu bertanggung jawab atas penjadwalan tugas, pemanggilan alat, migrasi data, dan koordinasi sistem. Pada saat ini, rasio CPU dan GPU akan perlahan bergerak menuju 1:1, bahkan mungkin membutuhkan kepadatan CPU yang lebih tinggi untuk memecah tugas dengan cepat.

Faktanya, ketika seorang agen cerdas tidak hanya menghasilkan sebuah jawaban, tetapi perlu terus memanggil model, alat, dan sistem eksternal, status kerjanya menjadi sangat berbeda dari AI tradisional. Intel dalam pidatonya menyebutkan sebuah data: dibandingkan dengan inferensi satu putaran, konsumsi Token sebuah agen cerdas bisa meningkat hingga 1000 kali lipat.

Sumber: Intel

Dengan kata lain, yang dibawa oleh agen cerdas bukanlah pertumbuhan sederhana dalam volume inferensi, tetapi beban sistem yang lebih kompleks, lebih frekuen, dan lebih tersegmentasi. Jika beban ini semua dibebankan ke GPU, itu akan menjadi tidak efisien dan mahal.

Prosesor Xeon 6+ yang diluncurkan Intel kali ini dibuat berdasarkan proses manufaktur Intel 18A, dilengkapi dengan maksimal 288 core efisiensi, dan dilengkapi dengan cache L3 hingga 576MB, ditujukan untuk kebutuhan beban kerja seperti cloud-native, Agentic AI, dan intensif jaringan, dapat memberikan efisiensi energi yang lebih tinggi dan performa berkelanjutan yang lebih stabil.

Dalam skema yang diberikan Intel, satu rak berpendingin cair yang menempati ruang komputasi 32U, dapat menyediakan 36864 core; konsumsi daya rak hanya sekitar 100kW, cukup untuk menampung deployment agen cerdas berkepadatan tinggi. Meskipun 100kW terdengar menakutkan, dibandingkan dengan rak server berperforma setara di masa lalu, konsumsi dayanya sudah jauh berkurang.

Dan di luar Xeon 6+, ada hal lain yang lebih layak diperhatikan: pemisahan ulang arsitektur inferensi oleh Intel.

Dalam pidatonya, Intel mengumumkan kerja sama dengan SambaNova, Vista Equity Partners, Cambium Capital, dan mitra lainnya, secara resmi meluncurkan skema inferensi terpisah sepenuhnya yang baru. Skema ini berjalan di Vector Core Compute Intelligent Cloud, dengan prosesor Intel Xeon 6 bertanggung jawab atas orkestrasi dan eksekusi, kemudian melalui SambaNova SN40 RDU bertanggung jawab atas decoding, dan akhirnya oleh GPU NVIDIA Blackwell bertanggung jawab atas prefilling.

Sumber: Intel

Skema baru ini dirancang khusus untuk beban kerja agen cerdas. Berbeda dengan banyak sistem AI di masa lalu yang terbiasa menyerahkan sebagian besar pekerjaan dalam rantai inferensi ke GPU, dalam sistem ini, CPU, RDU, dan GPU akan menjalankan perannya masing-masing, bertanggung jawab atas penjadwalan sistem, decoding, prefilling, dan tautan berbeda lainnya, memastikan setiap tahap inferensi berjalan di perangkat keras yang paling sesuai, memaksimalkan efisiensi.

Dan setelah memperkenalkan Xeon 6+, prosesor Core Ultra generasi ketiga yang diluncurkan beberapa waktu lalu juga muncul kembali. Ini adalah bagian lain dari ekosistem AI Intel — inti AI di sisi ujung. Dalam pidato tersebut, server hybrid lokal yang ditunjukkan oleh Intel dan Perplexity, dibangun berdasarkan server ujung Core Ultra generasi ketiga dan server awan Xeon 6+.

Sumber: Intel

Ini dapat secara dinamis mendistribusikan beban kerja antara lokal dan awan berdasarkan kemampuan perangkat dan karakteristik fungsionalnya, lebih lanjut mengurangi ketergantungan pada daya komputasi awan. Ini juga merupakan bentuk ideal dari PC AI di masa depan: dengan mengalokasikan performa secara dinamis, mengurangi biaya Token sekaligus memastikan ketepatan waktu tugas dan privasi data terlindungi.

Selain PC, Intel juga memperluas Core Ultra generasi ketiga ke area perangkat genggam game dan komputasi tepi. Prosesor Arc G3 series yang baru diluncurkan ditujukan untuk perangkat game genggam, dioptimalkan berdasarkan arsitektur generasi yang sama, akan dirilis pada akhir bulan ini (iGPU yang paling dinantikan pengguna perangkat genggam akan datang).

Dari Umum ke Kustomisasi, Intel Juga Ingin "Ada di Mana-mana"

Dan selain prosesor umum, Intel kali ini juga menekankan chip kustom, yang merupakan bisnis yang terus dipromosikan oleh Pat Gelsinger sejak menjabat sebagai CEO Intel.

Intel percaya bahwa chip kustom akan memiliki pasar yang besar di masa depan, karena seiring AI masuk ke industri yang berbeda, pelanggan akan semakin tidak puas dengan daya komputasi umum. Untuk mengejar efisiensi dan performa yang lebih tinggi, mereka akan cenderung beralih ke chip kustom untuk mempertahankan daya saing mereka.

Dalam pidatonya, Intel menyebutkan sedang bekerja sama dengan Google untuk meluncurkan IPU, chip semacam ini sangat penting bagi penyedia layanan cloud untuk meningkatkan performa infrastruktur. Bersamaan, Intel juga bekerja sama dengan pelanggan telekomunikasi seperti Ericsson, menyediakan chip infrastruktur nirkabel canggih di seluruh dunia.

Ini sebenarnya adalah tema lain dari pidato Pat Gelsinger ini: Intel tidak lagi hanya mengandalkan satu chip umum untuk memenangkan pasar, tetapi mengemas chip, sistem, perangkat lunak, dan kerja sama industri menjadi satu set solusi lengkap, dan dapat disesuaikan bebas sesuai kebutuhan perusahaan yang berbeda, untuk memaksimalkan keunggulan Intel.

Sumber: Intel

Menurut Lei Technology, Intel sebenarnya sedang mendefinisikan ulang posisi ekosistemnya: pusat data membutuhkan CPU untuk bertanggung jawab atas orkestrasi agen cerdas, sistem inferensi membutuhkan heterogenitas dan pemisahan untuk mengurangi biaya, PC membutuhkan pemrosesan AI lokal untuk masalah privasi dan kepatuhan, komputasi tepi dan embodied intelligence membutuhkan chip berdaya tinggi, dan pelanggan industri membutuhkan chip yang dapat disesuaikan.

Dengan memenuhi kebutuhan perusahaan di bidang dan tautan yang berbeda, Intel akan menjadi lebih "ada di mana-mana" daripada NVIDIA.

Tentu saja, tekanan di depan Intel masih besar. Keunggulan NVIDIA dalam akselerator AI dan ekosistem perangkat lunak masih jelas, AMD juga terus menyerang dalam CPU server dan chip AI. Agar Intel berhasil menempuh jalan ini, akhirnya tergantung pada kecepatan produksi massal 18A dan apakah skema tingkat rak Xeon 6+ dapat diimplementasikan dengan cepat, serta apakah pelanggan benar-benar dapat melihat manfaat signifikan dari skema baru ini.

Tapi setidaknya kali ini, arah Intel lebih jelas daripada sebelumnya.

Bisa dikatakan, seiring AI memasuki era agen cerdas, persaingan sudah lama bukan lagi hanya perbandingan performa puncak dari satu chip tunggal, tetapi melibatkan optimalisasi efisiensi sinergi dari seluruh sistem komputasi. GPU masih penting, tetapi CPU, perangkat tepi, AI lokal, dan chip kustom juga akan menjadi kunci kembali.

Dan yang ingin ditangkap oleh Intel, adalah periode jendela pembagian kerja ulang infrastruktur AI ini.

你可能也喜欢

你交给Claude的订阅费，光模块公司能拿到多少？

一张将Claude Pro约20美元月费拆解给模型公司、云算力、GPU折旧、电力及供应链的估算图，引发了投资者对AI应用估值逻辑的重新审视。核心问题在于：用户为AI应用支付的订阅费，有多少能像传统SaaS（软件即服务）那样沉淀为高软件毛利？传统SaaS新增用户成本极低，毛利率可达70%-80%。而AI应用不同，用户每一次调用模型（推理）都会消耗GPU算力、电力和云资源，导致边际成本显著。固定月费背后是随使用量波动的成本链，重度用户的成本可能急剧上升。因此，AI应用公司要获得高估值，不仅需证明用户付费意愿，更需证明在考虑使用量后，其毛利率能持续改善并接近传统软件公司。当前阶段，AI使用量的增长更直接地转化为对底层基础设施（如英伟达GPU、台积电芯片、HBM内存、电力及数据中心）的需求，这使得基础设施供应商的业绩和估值更早、更确定地得到验证。支持AI应用高毛利前景的观点认为，当前推理成本高是早期现象。通过模型优化、缓存技术、使用小模型、自研芯片以及提高集群利用率，单位成本有望快速下降。行业已有案例显示，部分模型的单位成本大幅降低。然而，挑战在于，AI应用正从简单问答转向更复杂、耗能更高的任务（如代码生成、长文档处理）。关键在于，推理成本下降的速度能否超越用户使用量和任务复杂度的增长速度。总之，该分析图的价值在于提醒市场：在AI应用公司缺乏透明毛利率数据的情况下，不应简单将其收入等同于高毛利SaaS收入。投资者需要关注其成本结构、用户使用行为分层以及效率提升的实际证据。模型公司最终需要证明，即使在重度使用下，订阅收入也能转化为可观的利润。

marsbit5分钟前

marsbit5分钟前

OpenAI的Hyperliquid盘前定价生意，为何只撑了半年？

文章讨论了在Hyperliquid平台上两家从事“盘前定价”业务的团队：Trade.xyz和Ventuals的不同命运。 Trade.xyz团队匿名，却成为平台上最大的盘前合约市场，成功抓住了SpaceX上市前的交易机会。其策略聪明之处在于，选择像SpaceX这样上市日期和发行价都已确定的标的，最终价格能与现实市场“锚定”，风险相对可控。而获得顶级风投Paradigm支持的Ventuals，手握OpenAI和Anthropic这类更稀缺但无明确上市计划的标的，反而在运营九个月后关停。其失败关键在于定价机制存在缺陷：合约价格一半依赖外部非公开的老股报价，另一半则参考其自身价格的均线，形成了一个自我强化的循环。这导致价格长期虚高，缺乏真实市场流动性的支撑和纠错，最终失去市场认可。 Ventuals关停时，其定出的OpenAI（1341.80美元）和Anthropic（1618.90美元）的最终价，甚至被部分内部人士作为估值参考，凸显了未上市公司对流动定价的强烈需求，也暴露了这类定价的脆弱性。文章指出，为未上市明星公司提供实时交易价格正成为一门热门生意，Coinbase等大机构也已入场。但Ventuals的案例表明，这门生意的核心挑战在于，缺乏一个公开、有效、能持续纠错的市场机制来形成真正公允的价格。在标的公司真正上市前，任何定价都可能面临“悬空”的风险。

marsbit21分钟前

marsbit21分钟前

OpenAI 审计财报：2025 年亏损 385 亿美元，研发烧钱 192 亿，微软一年收走 172 亿

OpenAI 审计财报首次曝光，其2025年财务状况远超外界预期。数据显示，2025年公司营收130.7亿美元，但成本和费用高达340亿美元，导致运营亏损209.2亿美元。受公司从非营利组织转为营利性实体等因素影响，经调整后归属于公司的净亏损高达385.3亿美元。相比之下，2024年净亏损为51亿美元。亏损激增主要源于巨额的研发投入，2025年研发支出达191.8亿美元。此外，销售与市场费用（57.3亿美元）和收入成本（75亿美元）也大幅攀升。值得注意的是，OpenAI在2025年向微软支付了总计172亿美元的费用，其中105.9亿美元被标注为“研发”费用，可能用于模型训练。同时，公司对微软还有数十亿美元的负债。主要客户方面，软银和微软在2025年分别向OpenAI支付了8.67亿和3.03亿美元。截至2025年底，OpenAI拥有略超500亿美元的资产，其中近半为现金。这份财报揭示了这家高估值AI公司在追求技术前沿的同时，面临的巨大盈利挑战和沉重的成本压力。

marsbit29分钟前

OpenAI 审计财报：2025 年亏损 385 亿美元，研发烧钱 192 亿，微软一年收走 172 亿

marsbit29分钟前

日活冲到行业第二的3-4倍，腾讯WorkBuddy撕开了办公Agent的哪条裂缝？

2026年上半年，腾讯推出的办公智能体（Agent）产品WorkBuddy日活跃用户已达行业第二名产品的3到4倍，其高速增长的核心在于成功吸引了大量非技术岗位用户（如HR、运营、行政）。这与OpenAI同期披露的Codex趋势相似（非开发者增速是开发者的3倍以上），但二者路径截然不同。 WorkBuddy并非预设产品，其前身是代码助手CodeBuddy。转折点在于腾讯内部非技术员工自发用它处理研究、报告等非编码任务。团队洞察到“产物才是目的”，于2026年1月快速推出极简版WorkBuddy，公测前已有超2000名内部非技术员工每日使用。其成功源于三个关键设计决策： 1. **用自然语言替代技术概念**：用户无需理解Agent、prompt等术语，直接以日常语言下达任务。 2. **预封装场景模板**：内置超20种Skills技能包（如数据处理、竞品调研），开箱即用，无需自建流程。 3. **深度原生集成生态**：深度“住进”腾讯文档、微信等国内高频办公软件，成为现有工作流的一部分，而非独立工具。这些设计拆除了认知、场景和环境三重门槛。相比之下，Codex和Claude Code从命令行/IDE出发，面向开发者，非技术用户需跨越安装、配置和理解交互逻辑的障碍。尽管OpenAI和Anthropic已开始推出角色插件或简化界面（如Claude Cowork）向非技术用户转向，但交互范式和生态集成的重构需要时间，这为WorkBuddy创造了约半年的领先窗口。数据显示，WorkBuddy在2026年3月公测后增速迅猛（环比达831%），PC端月访问量领先第二名2.6倍。其定价（个人版起价39元/月）也低于海外同类产品（20美元/月起），在国内市场触及面更广。 WorkBuddy代表“场景封装”路线，追求用户使用路径最短；海外产品则侧重“底层能力”，追求功能最强。当前，WorkBuddy已发布企业版以巩固优势，但面对海外巨头在底层模型能力和快速追赶，其先发优势将面临长期考验。核心差异在于：用户无需懂技术，只需知道自己要什么。

marsbit30分钟前

日活冲到行业第二的3-4倍，腾讯WorkBuddy撕开了办公Agent的哪条裂缝？

marsbit30分钟前

比特币矿场变AI数据中心：Sangha的“卖身”抉择

2025年12月，Spencer Marr在美国德州为名为Genesis的比特币矿场剪彩。这座规模19.9兆瓦的矿场采用“表后直供”模式，直接从相邻的太阳能农场获取低价电力，实现了低至约32美元/兆瓦时的运营成本，使其在比特币行情下行时仍能盈利。然而，通电仅半年后的2026年6月，Marr的公司Sangha便通过投行放出消息，考虑出售、合资或引入战略伙伴。其根本原因并非经营不善，而是AI算力需求爆发带来了新的估值逻辑。对于亟需电力与数据中心资源的AI公司而言，Genesis这样一个已通电、有扩容潜力（规划至110.4兆瓦）且电力接入手续齐全的站点，价值远超过其作为矿场的本身。 Sangha的商业模式是项目制，通过设立特殊目的载体（SPV）吸引投资。如今，他们计划在估值高点出售这份“电力资产”，这比自行扩建为AI数据中心更为划算。其推介重点也已从比特币挖矿转向AI计算、高性能计算等多元场景。这一转变并非个例，Core Scientific等上市矿企也已纷纷转向AI/HPC业务。Sangha的案例凸显了一个趋势：在AI的巨大需求下，拥有稳定、低价电力资源的比特币矿场基础设施，正成为被争抢的稀缺资产。矿工们面临的抉择是：是坚守挖矿，还是将阵地拱手让给AI，换取丰厚的资本回报。

marsbit1小时前