Stop Staring at GPUs, Intel Unleashes a Major Move—Can It End Nvidia's Computing Power Monopoly?

marsbit發佈於 2026-06-03更新於 2026-06-03

Over the past two years, AI hardware has essentially had one core focus: the GPU.

From large model training to inference clusters, and from edge to cloud computing power, the entire industry has been discussing who can secure more GPUs and who can pack more compute cards into data centers. It's fair to say the entire AI industry has been revolving around GPUs, which has also driven Nvidia's stock price to record highs.

However, at COMPUTEX 2026, Intel presented a different perspective: AI's next stage should not focus solely on GPUs. The core of this argument is the keyword repeatedly emphasized by CEO Pat Gelsinger in his keynote speech: Agentic AI, which we commonly refer to as agents.

Image Source: Intel

Agents Are Changing the Computing Ecosystem

The difference between agents and traditional AI is actually quite significant. Traditional AI operates like a turn-based Q&A machine, while agents are meant to integrate into real-world workflows, proactively completing cycles of "thinking, planning, acting, and reflecting." In other words, they must learn to read data, call tools, execute tasks, check results, and continuously adjust their next steps based on feedback.

This means AI inference is no longer a "one-off deal" but becomes a continuously running system of self-decision-making and self-reasoning, fundamentally changing how computing power is utilized. Therefore, Intel's core message this time is: Agentic AI will reshape the compute power ratio within data centers.

Currently, in the cutting-edge model training phase, the CPU-to-GPU ratio can approach 1:8, with GPUs bearing the vast majority of the computational load. However, upon entering an agentic inference mode, CPUs need to handle task orchestration, tool invocation, data migration, and system coordination. In this scenario, the CPU-to-GPU ratio will gradually move towards 1:1, or may even require higher CPU density to rapidly decompose tasks.

In fact, when an agent not only generates an answer but also needs to continuously invoke models, tools, and external systems, its operational state is completely different from that of traditional AI. Intel mentioned a statistic in the presentation: compared to single-turn inference, an agent's Token consumption can increase by up to 1000 times.

Image Source: Intel

In other words, agents don't bring simple growth in inference volume, but rather more complex, higher-frequency, and more fragmented system loads. Throwing all these loads at GPUs for resolution would be inefficient and expensive.

The Xeon 6+ processor launched by Intel is built on the Intel 18A process, featuring up to 288 efficiency cores and equipped with up to 576MB of L3 cache. Targeting cloud-native, Agentic AI, and network-intensive workloads, it promises higher energy efficiency and more stable sustained performance.

In Intel's proposed solution, a single liquid-cooled rack occupying 32U of compute space can provide 36,864 cores; the rack power consumption is only about 100kW, sufficient to support high-density agent deployment. While 100kW may sound daunting, compared to previous server racks with equivalent performance, power consumption has already been significantly reduced.

Beyond Xeon 6+, there's something even more noteworthy: Intel's restructuring of the inference architecture.

In the presentation, Intel announced a partnership with SambaNova, Vista Equity Partners, Cambium Capital, and others to officially launch a new, fully disaggregated inference solution. This solution runs on the Vector Core Compute Agent Cloud, where Intel Xeon 6 processors handle orchestration and execution, SambaNova SN40 RDUs are responsible for decoding, and finally, NVIDIA Blackwell GPUs handle pre-filling.

Image Source: Intel

This new architecture is specifically designed for agentic workloads. Unlike many past AI systems that tended to offload most of the work in the inference pipeline to GPUs, in this system, CPUs, RDUs, and GPUs will each have their specific roles—handling system scheduling, decoding, pre-filling, and other different stages respectively—ensuring each inference phase runs on the most suitable hardware to maximize efficiency.

Following the introduction of Xeon 6+, the recently launched 3rd Gen Core Ultra processors also made another appearance. They represent another link in Intel's AI ecosystem—the core of edge-side AI. In the presentation, the hybrid local server demonstrated by Intel and Perplexity was precisely built on the 3rd Gen Core Ultra and Xeon 6+ cloud servers.

Image Source: Intel

It can dynamically allocate workloads between the local device and the cloud based on device capability and functional requirements, further reducing reliance on cloud computing power. This is also the ideal form for future AI PCs: by dynamically distributing performance, it lowers Token costs while ensuring task immediacy and data privacy.

Beyond PCs, Intel is extending the 3rd Gen Core Ultra to gaming handhelds and edge computing. The newly announced Arc G3 series of processors are optimized for handheld gaming devices based on the same architecture and will be available later this month (the integrated graphics card most anticipated by handheld gamers is coming).

From General-Purpose to Custom, Intel Aims to Be 'Everywhere'

Beyond general-purpose processors, Intel also emphasized custom chips this time, a business segment CEO Pat Gelsinger has been championing since taking the helm.

Intel believes the custom chip market will be vast in the future because as AI penetrates various industries, customers will become increasingly dissatisfied with general-purpose compute power. In pursuit of higher efficiency and performance, they will gradually lean towards custom chips to maintain their competitiveness.

In the presentation, Intel mentioned collaborations, such as with Google to launch IPUs—chips crucial for cloud service providers to enhance infrastructure performance. Intel is also partnering with telecom clients like Ericsson to provide advanced wireless infrastructure chips globally.

This actually reveals another theme of Gelsinger's speech: Intel is no longer relying on a single, general-purpose chip to win the market. Instead, it's packaging chips, systems, software, and industry partnerships into a complete set of solutions that can be freely customized according to the needs of different enterprises, thereby maximizing Intel's advantages.

Image Source: Intel

From the perspective of Lei Technology, Intel is essentially redefining its position in the ecosystem: data centers need CPUs for agent orchestration; inference systems require heterogeneous disaggregation to reduce costs; PCs need local AI to handle privacy and compliance; edge and embodied intelligence require high-efficiency chips; and industry clients need customized chips.

By meeting the needs of enterprises across different fields and various points in the value chain, Intel aims to become even more "everywhere" than Nvidia.

Of course, the pressure on Intel remains immense. Nvidia's advantages in AI accelerators and software ecosystems are still evident, and AMD continues its offensive in server CPUs and AI chips. For Intel to successfully navigate this path, it ultimately depends on the mass production speed of the 18A process, whether the Xeon 6+ rack-level solutions can be deployed quickly, and whether customers can truly see significant benefits from this new architecture.

But at least this time, Intel's direction is clearer than before.

It can be said that as AI enters the era of agents, competition is no longer just about comparing the peak performance of a single chip. Instead, it involves the collaborative efficiency optimization of the entire computing system. GPUs remain important, but CPUs, edge devices, local AI, and custom chips are also regaining critical importance.

And what Intel aims to seize is precisely this window of opportunity where AI infrastructure is undergoing a re-division of labor.

你可能也喜歡

Solana 隐私生态全景图,从计算到 AI 的完整隐私栈

Solana隐私生态仍处于早期阶段,但正在快速发展。其独特架构(如ZK压缩)有望实现无需持久Rollup的大规模可组合隐私协议。理想的“最终隐私栈”可能是全同态加密(FHE)与零知识证明(ZK)的结合。 目前隐私计算主要由Arcium和MagicBlock提供。Arcium利用多方计算(MPC)构建可定制的执行环境,处理加密数据并正在开发保密代币标准(C-SPL),应用场景包括私密支付、数据分析及医疗保健。MagicBlock则基于可信执行环境(TEE)创建私密临时Rollup,确保交易的机密性、可扩展性和可组合性。两者基础设施催生了诸多应用。 私密转账与余额方面,Umbra基于Arcium构建,提供加密代币账户,实现金额、余额和关联关系的隐私,并支持选择性审计。Privacy Cash采用类似Tornado的屏蔽池处理SOL,Hush则整合了质押收益和私密兑换功能。 为消除链上痕迹,encifherio通过包装代币和TEE保护兑换隐私;Vanish Trade利用屏蔽流动性路由隐藏交易策略;Darklake构建ZK原生流动性基础设施和暗池,防止前端运行。 更高级的应用如私密预测市场(如Melee Markets)利用Arcium加密订单簿,保护参与者策略。在私密AI领域,Loyal结合Magic Block和Arcium技术,在链上加密存储和处理用户数据、对话及交易,确保用户拥有数据控制权。 总体而言,Solana隐私生态正从基础计算层向复杂应用层构建,覆盖支付、DeFi、预测市场及AI等多个垂直领域。

Foresight News9 分鐘前

Solana 隐私生态全景图,从计算到 AI 的完整隐私栈

Foresight News9 分鐘前

关于「DeepSeek 完成超 500 亿元融资」的 7 个关键问题

DeepSeek首轮融资据外媒报道已完成超500亿元,估值突破500亿美元,但尚未获官方确认。此轮融资启动于2026年4月,是DeepSeek成立以来首次对外融资,打破了其长期“不融资、不上市、不商业化”的原则。 融资有七大关键看点: 1. 整体情况:融资额超500亿元,创始人梁文锋投资200亿,其他投资方包括腾讯、宁德时代、京东、网易、IDG资本等。公司估值在两个月内从约100亿美元跃升至超500亿美元。 2. 特殊安排:大多数投资者需将资金注入由梁文锋控制的有限合伙企业,而非直接投给公司,且有5年锁定期。这些投资者无投票权,但享有优先财务信息和后续投资的优先权。唯一的例外是国家人工智能产业投资基金,可直接投资并拥有投票权,无锁定期。 3. 安排目的:核心是为了保障梁文锋对公司的绝对控制权,确保投资方是具备战略定力的“耐心资本”,以支持其推进开源AI和实现通用人工智能(AGI)的长期目标,而非短期盈利。 4. 腾讯入局:腾讯是DeepSeek的早期业务合作方,此次属于战略投资,与其长期“助力但不干预”的投资风格相符。 5. 宁德时代逻辑:投资核心结合点在于AI数据中心所需的能源解决方案。宁德时代将AI视为工具,希望在其储能业务新增长曲线上为AIDC的能源需求做出贡献。 6. 国家队意义:国家人工智能产业投资基金的入局凸显了DeepSeek战略重要性已超越技术范畴。融资条款要求核查基金背后有限合伙人身份,防范风险。 7. 后续发展:融资后,DeepSeek可能推出新模型,增加对图像、音频的支持,并迈向商业化。同时,将加大在基础设施(如自建数据中心)、人才和模型训练上的投入。实现AGI是长远目标,梁文锋需在保持技术初心与满足资本回报期望之间取得平衡。本轮融资仅是漫长征程的开端。

marsbit54 分鐘前

关于「DeepSeek 完成超 500 亿元融资」的 7 个关键问题

marsbit54 分鐘前

世界杯来临,预测市场的入口战争已打响

2026年美加墨世界杯拉开战幕,除了场内的竞技,场外的预测市场也成为了新看点。一种源于加密货币世界的链上工具——预测市场,正让球迷可以就比赛结果、冠军归属等进行预测和交易。 预测市场能转化群体智慧为市场概率,但在过去,其复杂的链上操作(如钱包、Gas费等)将大量潜在用户挡在门外。中心化交易所(CEX)如Gate正尝试改变这一局面。Gate通过与知名预测市场平台Polymarket合作,为用户提供了更便捷的入口。用户可直接使用交易所账户和USDT参与,无需处理钱包、跨链等繁琐步骤,大幅降低了参与门槛。 Gate提供了两种主要交互模式:“预测模式”适合普通用户,操作简单直观;“交易模式”则提供订单簿、K线等专业工具,满足高阶用户需求。同时,平台允许用户在事件结算前随时买卖,增加了灵活性。除了体育赛事,其预测市场还涵盖加密货币、宏观经济等多个领域。 为了帮助用户决策,Gate还构建了信息辅助体系,包括“聪明钱排行榜”、市场动态监控、实时Live专区以及AI洞察等工具,旨在形成从信息获取到交易执行的完整链路。 针对世界杯,Gate专门设立了主题专区,聚合赛程、积分榜和预测市场,方便球迷一站式参与。预测市场让观赛体验发生了变化,用户交易的是对比赛走势的判断和市场共识的变动。 预测市场已证明其产品价值,但大规模普及的关键在于能否吸引更多普通用户。降低学习成本、优化体验成为竞争重点。Gate等平台通过简化流程、整合服务,正推动预测市场从加密原生圈走向更广泛的大众市场。当更多人能轻松参与时,预测市场的增长故事或许才真正开始。

Odaily星球日报1 小時前

世界杯来临,预测市场的入口战争已打响

Odaily星球日报1 小時前

交易

現貨
合約

熱門文章

什麼是 $S$

理解 SPERO:全面概述 SPERO 簡介 隨著創新領域的不斷演變,web3 技術和加密貨幣項目的出現在塑造數字未來中扮演著關鍵角色。在這個動態領域中,SPERO(標記為 SPERO,$$s$)是一個引起關注的項目。本文旨在收集並呈現有關 SPERO 的詳細信息,以幫助愛好者和投資者理解其基礎、目標和在 web3 和加密領域內的創新。 SPERO,$$s$ 是什麼? SPERO,$$s$ 是加密空間中的一個獨特項目,旨在利用去中心化和區塊鏈技術的原則,創建一個促進參與、實用性和金融包容性的生態系統。該項目旨在以新的方式促進點對點互動,為用戶提供創新的金融解決方案和服務。 SPERO,$$s$ 的核心目標是通過提供增強用戶體驗的工具和平台來賦能個人。這包括使交易方式更加靈活、促進社區驅動的倡議,以及通過去中心化應用程序(dApps)創造金融機會的途徑。SPERO,$$s$ 的基本願景圍繞包容性展開,旨在彌合傳統金融中的差距,同時利用區塊鏈技術的優勢。 誰是 SPERO,$$s$ 的創建者? SPERO,$$s$ 的創建者身份仍然有些模糊,因為公開可用的資源對其創始人提供的詳細背景信息有限。這種缺乏透明度可能源於該項目對去中心化的承諾——這是一種許多 web3 項目所共享的精神,優先考慮集體貢獻而非個人認可。 通過將討論重心放在社區及其共同目標上,SPERO,$$s$ 體現了賦能的本質,而不特別突出某些個體。因此,理解 SPERO 的精神和使命比識別單一創建者更為重要。 誰是 SPERO,$$s$ 的投資者? SPERO,$$s$ 得到了來自風險投資家到天使投資者的多樣化投資者的支持,他們致力於促進加密領域的創新。這些投資者的關注點通常與 SPERO 的使命一致——優先考慮那些承諾社會技術進步、金融包容性和去中心化治理的項目。 這些投資者通常對不僅提供創新產品,還對區塊鏈社區及其生態系統做出積極貢獻的項目感興趣。這些投資者的支持強化了 SPERO,$$s$ 作為快速發展的加密項目領域中的一個重要競爭者。 SPERO,$$s$ 如何運作? SPERO,$$s$ 採用多面向的框架,使其與傳統的加密貨幣項目區別開來。以下是一些突顯其獨特性和創新的關鍵特徵: 去中心化治理:SPERO,$$s$ 整合了去中心化治理模型,賦予用戶積極參與決策過程的權力,關於項目的未來。這種方法促進了社區成員之間的擁有感和責任感。 代幣實用性:SPERO,$$s$ 使用其自己的加密貨幣代幣,旨在在生態系統內部提供多種功能。這些代幣使交易、獎勵和平台上提供的服務得以促進,增強了整體參與度和實用性。 分層架構:SPERO,$$s$ 的技術架構支持模塊化和可擴展性,允許在項目發展過程中無縫整合額外的功能和應用。這種適應性對於在不斷變化的加密環境中保持相關性至關重要。 社區參與:該項目強調社區驅動的倡議,採用激勵合作和反饋的機制。通過培養強大的社區,SPERO,$$s$ 能夠更好地滿足用戶需求並適應市場趨勢。 專注於包容性:通過提供低交易費用和用戶友好的界面,SPERO,$$s$ 旨在吸引多樣化的用戶群體,包括那些以前可能未曾參與加密領域的個體。這種對包容性的承諾與其通過可及性賦能的總體使命相一致。 SPERO,$$s$ 的時間線 理解一個項目的歷史提供了對其發展軌跡和里程碑的關鍵見解。以下是建議的時間線,映射 SPERO,$$s$ 演變中的重要事件: 概念化和構思階段:形成 SPERO,$$s$ 基礎的初步想法被提出,與區塊鏈行業內的去中心化和社區聚焦原則密切相關。 項目白皮書的發布:在概念階段之後,發布了一份全面的白皮書,詳細說明了 SPERO,$$s$ 的願景、目標和技術基礎設施,以吸引社區的興趣和反饋。 社區建設和早期參與:積極進行外展工作,建立早期採用者和潛在投資者的社區,促進圍繞項目目標的討論並獲得支持。 代幣生成事件:SPERO,$$s$ 進行了一次代幣生成事件(TGE),向早期支持者分發其原生代幣,並在生態系統內建立初步流動性。 首次 dApp 上線:與 SPERO,$$s$ 相關的第一個去中心化應用程序(dApp)上線,允許用戶參與平台的核心功能。 持續發展和夥伴關係:對項目產品的持續更新和增強,包括與區塊鏈領域其他參與者的戰略夥伴關係,使 SPERO,$$s$ 成為加密市場中一個具有競爭力和不斷演變的參與者。 結論 SPERO,$$s$ 是 web3 和加密貨幣潛力的見證,能夠徹底改變金融系統並賦能個人。憑藉對去中心化治理、社區參與和創新設計功能的承諾,它為更具包容性的金融環境鋪平了道路。 與任何在快速發展的加密領域中的投資一樣,潛在的投資者和用戶都被鼓勵進行徹底研究,並對 SPERO,$$s$ 的持續發展進行深思熟慮的參與。該項目展示了加密行業的創新精神,邀請人們進一步探索其無數可能性。儘管 SPERO,$$s$ 的旅程仍在展開,但其基礎原則確實可能影響我們在互聯網數字生態系統中如何與技術、金融和彼此互動的未來。

89 人學過發佈於 2024.12.17更新於 2024.12.17

什麼是 $S$

什麼是 AGENT S

Agent S:Web3中自主互動的未來 介紹 在不斷演變的Web3和加密貨幣領域,創新不斷重新定義個人如何與數字平台互動。Agent S是一個開創性的項目,承諾通過其開放的代理框架徹底改變人機互動。Agent S旨在簡化複雜任務,為人工智能(AI)提供變革性的應用,鋪平自主互動的道路。本詳細探索將深入研究該項目的複雜性、其獨特特徵以及對加密貨幣領域的影響。 什麼是Agent S? Agent S是一個突破性的開放代理框架,專門設計用來解決計算機任務自動化中的三個基本挑戰: 獲取特定領域知識:該框架智能地從各種外部知識來源和內部經驗中學習。這種雙重方法使其能夠建立豐富的特定領域知識庫,提升其在任務執行中的表現。 長期任務規劃:Agent S採用經驗增強的分層規劃,這是一種戰略方法,可以有效地分解和執行複雜任務。此特徵顯著提升了其高效和有效地管理多個子任務的能力。 處理動態、不均勻的界面:該項目引入了代理-計算機界面(ACI),這是一種創新的解決方案,增強了代理和用戶之間的互動。利用多模態大型語言模型(MLLMs),Agent S能夠無縫導航和操作各種圖形用戶界面。 通過這些開創性特徵,Agent S提供了一個強大的框架,解決了自動化人機互動中涉及的複雜性,為AI及其他領域的無數應用奠定了基礎。 誰是Agent S的創建者? 儘管Agent S的概念根本上是創新的,但有關其創建者的具體信息仍然難以捉摸。創建者目前尚不清楚,這突顯了該項目的初期階段或戰略選擇將創始成員保密。無論是否匿名,重點仍然在於框架的能力和潛力。 誰是Agent S的投資者? 由於Agent S在加密生態系統中相對較新,關於其投資者和財務支持者的詳細信息並未明確記錄。缺乏對支持該項目的投資基礎或組織的公開見解,引發了對其資金結構和發展路線圖的質疑。了解其支持背景對於評估該項目的可持續性和潛在市場影響至關重要。 Agent S如何運作? Agent S的核心是尖端技術,使其能夠在多種環境中有效運作。其運營模型圍繞幾個關鍵特徵構建: 類人計算機互動:該框架提供先進的AI規劃,力求使與計算機的互動更加直觀。通過模仿人類在任務執行中的行為,承諾提升用戶體驗。 敘事記憶:用於利用高級經驗,Agent S利用敘事記憶來跟蹤任務歷史,從而增強其決策過程。 情節記憶:此特徵為用戶提供逐步指導,使框架能夠在任務展開時提供上下文支持。 支持OpenACI:Agent S能夠在本地運行,使用戶能夠控制其互動和工作流程,與Web3的去中心化理念相一致。 與外部API的輕鬆集成:其多功能性和與各種AI平台的兼容性確保了Agent S能夠無縫融入現有技術生態系統,成為開發者和組織的理想選擇。 這些功能共同促成了Agent S在加密領域的獨特地位,因為它以最小的人類干預自動化複雜的多步任務。隨著項目的發展,其在Web3中的潛在應用可能重新定義數字互動的展開方式。 Agent S的時間線 Agent S的發展和里程碑可以用一個時間線來概括,突顯其重要事件: 2024年9月27日:Agent S的概念在一篇名為《一個像人類一樣使用計算機的開放代理框架》的綜合研究論文中推出,展示了該項目的基礎工作。 2024年10月10日:該研究論文在arXiv上公開,提供了對框架及其基於OSWorld基準的性能評估的深入探索。 2024年10月12日:發布了一個視頻演示,提供了對Agent S能力和特徵的視覺洞察,進一步吸引潛在用戶和投資者。 這些時間線上的標記不僅展示了Agent S的進展,還表明了其對透明度和社區參與的承諾。 有關Agent S的要點 隨著Agent S框架的持續演變,幾個關鍵特徵脫穎而出,強調其創新性和潛力: 創新框架:旨在提供類似人類互動的直觀計算機使用,Agent S為任務自動化帶來了新穎的方法。 自主互動:通過GUI自主與計算機互動的能力標誌著向更智能和高效的計算解決方案邁進了一步。 複雜任務自動化:憑藉其強大的方法論,能夠自動化複雜的多步任務,使過程更快且更少出錯。 持續改進:學習機制使Agent S能夠從過去的經驗中改進,不斷提升其性能和效率。 多功能性:其在OSWorld和WindowsAgentArena等不同操作環境中的適應性確保了它能夠服務於廣泛的應用。 隨著Agent S在Web3和加密領域中的定位,其增強互動能力和自動化過程的潛力標誌著AI技術的一次重大進步。通過其創新框架,Agent S展現了數字互動的未來,為各行各業的用戶承諾提供更無縫和高效的體驗。 結論 Agent S代表了AI與Web3結合的一次大膽飛躍,具有重新定義我們與技術互動方式的能力。儘管仍處於早期階段,但其應用的可能性廣泛且引人入勝。通過其全面的框架解決關鍵挑戰,Agent S旨在將自主互動帶到數字體驗的最前沿。隨著我們深入加密貨幣和去中心化的領域,像Agent S這樣的項目無疑將在塑造技術和人機協作的未來中發揮關鍵作用。

860 人學過發佈於 2025.01.14更新於 2025.01.14

什麼是 AGENT S

如何購買S

歡迎來到HTX.com!在這裡,購買Sonic (S)變得簡單而便捷。跟隨我們的逐步指南,放心開始您的加密貨幣之旅。第一步:創建您的HTX帳戶使用您的 Email、手機號碼在HTX註冊一個免費帳戶。體驗無憂的註冊過程並解鎖所有平台功能。立即註冊第二步:前往買幣頁面,選擇您的支付方式信用卡/金融卡購買:使用您的Visa或Mastercard即時購買Sonic (S)。餘額購買:使用您HTX帳戶餘額中的資金進行無縫交易。第三方購買:探索諸如Google Pay或Apple Pay等流行支付方式以增加便利性。C2C購買:在HTX平台上直接與其他用戶交易。HTX 場外交易 (OTC) 購買:為大量交易者提供個性化服務和競爭性匯率。第三步:存儲您的Sonic (S)購買Sonic (S)後,將其存儲在您的HTX帳戶中。您也可以透過區塊鏈轉帳將其發送到其他地址或者用於交易其他加密貨幣。第四步:交易Sonic (S)在HTX的現貨市場輕鬆交易Sonic (S)。前往您的帳戶,選擇交易對,執行交易,並即時監控。HTX為初學者和經驗豐富的交易者提供了友好的用戶體驗。

1.8k 人學過發佈於 2025.01.15更新於 2026.06.02

如何購買S

相關討論

歡迎來到 HTX 社群。在這裡,您可以了解最新的平台發展動態並獲得專業的市場意見。 以下是用戶對 S (S)幣價的意見。

活动图片