Stop Staring at GPUs, Intel Unleashes a Major Move—Can It End Nvidia's Computing Power Monopoly?

marsbitОпубліковано о 2026-06-03Востаннє оновлено о 2026-06-03

Over the past two years, AI hardware has essentially had one core focus: the GPU.

From large model training to inference clusters, and from edge to cloud computing power, the entire industry has been discussing who can secure more GPUs and who can pack more compute cards into data centers. It's fair to say the entire AI industry has been revolving around GPUs, which has also driven Nvidia's stock price to record highs.

However, at COMPUTEX 2026, Intel presented a different perspective: AI's next stage should not focus solely on GPUs. The core of this argument is the keyword repeatedly emphasized by CEO Pat Gelsinger in his keynote speech: Agentic AI, which we commonly refer to as agents.

Image Source: Intel

Agents Are Changing the Computing Ecosystem

The difference between agents and traditional AI is actually quite significant. Traditional AI operates like a turn-based Q&A machine, while agents are meant to integrate into real-world workflows, proactively completing cycles of "thinking, planning, acting, and reflecting." In other words, they must learn to read data, call tools, execute tasks, check results, and continuously adjust their next steps based on feedback.

This means AI inference is no longer a "one-off deal" but becomes a continuously running system of self-decision-making and self-reasoning, fundamentally changing how computing power is utilized. Therefore, Intel's core message this time is: Agentic AI will reshape the compute power ratio within data centers.

Currently, in the cutting-edge model training phase, the CPU-to-GPU ratio can approach 1:8, with GPUs bearing the vast majority of the computational load. However, upon entering an agentic inference mode, CPUs need to handle task orchestration, tool invocation, data migration, and system coordination. In this scenario, the CPU-to-GPU ratio will gradually move towards 1:1, or may even require higher CPU density to rapidly decompose tasks.

In fact, when an agent not only generates an answer but also needs to continuously invoke models, tools, and external systems, its operational state is completely different from that of traditional AI. Intel mentioned a statistic in the presentation: compared to single-turn inference, an agent's Token consumption can increase by up to 1000 times.

Image Source: Intel

In other words, agents don't bring simple growth in inference volume, but rather more complex, higher-frequency, and more fragmented system loads. Throwing all these loads at GPUs for resolution would be inefficient and expensive.

The Xeon 6+ processor launched by Intel is built on the Intel 18A process, featuring up to 288 efficiency cores and equipped with up to 576MB of L3 cache. Targeting cloud-native, Agentic AI, and network-intensive workloads, it promises higher energy efficiency and more stable sustained performance.

In Intel's proposed solution, a single liquid-cooled rack occupying 32U of compute space can provide 36,864 cores; the rack power consumption is only about 100kW, sufficient to support high-density agent deployment. While 100kW may sound daunting, compared to previous server racks with equivalent performance, power consumption has already been significantly reduced.

Beyond Xeon 6+, there's something even more noteworthy: Intel's restructuring of the inference architecture.

In the presentation, Intel announced a partnership with SambaNova, Vista Equity Partners, Cambium Capital, and others to officially launch a new, fully disaggregated inference solution. This solution runs on the Vector Core Compute Agent Cloud, where Intel Xeon 6 processors handle orchestration and execution, SambaNova SN40 RDUs are responsible for decoding, and finally, NVIDIA Blackwell GPUs handle pre-filling.

Image Source: Intel

This new architecture is specifically designed for agentic workloads. Unlike many past AI systems that tended to offload most of the work in the inference pipeline to GPUs, in this system, CPUs, RDUs, and GPUs will each have their specific roles—handling system scheduling, decoding, pre-filling, and other different stages respectively—ensuring each inference phase runs on the most suitable hardware to maximize efficiency.

Following the introduction of Xeon 6+, the recently launched 3rd Gen Core Ultra processors also made another appearance. They represent another link in Intel's AI ecosystem—the core of edge-side AI. In the presentation, the hybrid local server demonstrated by Intel and Perplexity was precisely built on the 3rd Gen Core Ultra and Xeon 6+ cloud servers.

Image Source: Intel

It can dynamically allocate workloads between the local device and the cloud based on device capability and functional requirements, further reducing reliance on cloud computing power. This is also the ideal form for future AI PCs: by dynamically distributing performance, it lowers Token costs while ensuring task immediacy and data privacy.

Beyond PCs, Intel is extending the 3rd Gen Core Ultra to gaming handhelds and edge computing. The newly announced Arc G3 series of processors are optimized for handheld gaming devices based on the same architecture and will be available later this month (the integrated graphics card most anticipated by handheld gamers is coming).

From General-Purpose to Custom, Intel Aims to Be 'Everywhere'

Beyond general-purpose processors, Intel also emphasized custom chips this time, a business segment CEO Pat Gelsinger has been championing since taking the helm.

Intel believes the custom chip market will be vast in the future because as AI penetrates various industries, customers will become increasingly dissatisfied with general-purpose compute power. In pursuit of higher efficiency and performance, they will gradually lean towards custom chips to maintain their competitiveness.

In the presentation, Intel mentioned collaborations, such as with Google to launch IPUs—chips crucial for cloud service providers to enhance infrastructure performance. Intel is also partnering with telecom clients like Ericsson to provide advanced wireless infrastructure chips globally.

This actually reveals another theme of Gelsinger's speech: Intel is no longer relying on a single, general-purpose chip to win the market. Instead, it's packaging chips, systems, software, and industry partnerships into a complete set of solutions that can be freely customized according to the needs of different enterprises, thereby maximizing Intel's advantages.

Image Source: Intel

From the perspective of Lei Technology, Intel is essentially redefining its position in the ecosystem: data centers need CPUs for agent orchestration; inference systems require heterogeneous disaggregation to reduce costs; PCs need local AI to handle privacy and compliance; edge and embodied intelligence require high-efficiency chips; and industry clients need customized chips.

By meeting the needs of enterprises across different fields and various points in the value chain, Intel aims to become even more "everywhere" than Nvidia.

Of course, the pressure on Intel remains immense. Nvidia's advantages in AI accelerators and software ecosystems are still evident, and AMD continues its offensive in server CPUs and AI chips. For Intel to successfully navigate this path, it ultimately depends on the mass production speed of the 18A process, whether the Xeon 6+ rack-level solutions can be deployed quickly, and whether customers can truly see significant benefits from this new architecture.

But at least this time, Intel's direction is clearer than before.

It can be said that as AI enters the era of agents, competition is no longer just about comparing the peak performance of a single chip. Instead, it involves the collaborative efficiency optimization of the entire computing system. GPUs remain important, but CPUs, edge devices, local AI, and custom chips are also regaining critical importance.

And what Intel aims to seize is precisely this window of opportunity where AI infrastructure is undergoing a re-division of labor.

Пов'язані матеріали

When Google Also 'Prints Stocks' to Build AI, Whose Narrative is Shattering the High Valuations of Neocloud?

Google has announced its first equity financing since 2005, a series of moves totaling $80 billion that signal a strategic challenge to Nvidia's GPU dominance in the AI compute market. This impacts "Neocloud" companies like CoreWeave, Nebius, and IREN, whose valuations are heavily tied to Nvidia's perceived uniqueness. Google's three-part strategy involves: launching new TPU chips (TPU 8t/8i) and selling them to third parties for the first time; forming a $25 billion compute-as-a-service joint venture with Blackstone; and raising ~$50 billion in new equity (part of an $80B package) to fund AI infrastructure, underscoring the massive capital demands even for tech giants. This marks a divergence from Microsoft's path. Microsoft, lacking a mature in-house AI chip, relies heavily on outsourcing to Neocloud providers using Nvidia GPUs. Google, with its proprietary TPU, is pursuing vertical integration—building its own data centers, selling chips, and competing directly with Neocloud services. While Neocloud firms have strong near-term revenue from locked-in Nvidia GPU contracts (e.g., CoreWeave's ~$100B backlog), Google's moves undermine their long-term valuation narrative based on Nvidia's sole supremacy and perpetual supply shortage. TPU performance claims and adoption by firms like Anthropic add credibility to Google's alternative. The AI compute market is transitioning from a uniform seller's market to a layered one: top AI labs are diversifying their hardware stacks; hyperscalers are pursuing different chip strategies; and financing costs will become a critical differentiator, favoring players like Google with lower capital costs. Key metrics to watch include the progress of the Google-Blackstone JV, expansion of the TPU customer base beyond Anthropic, and potential shifts in Microsoft's sourcing strategy. If Google succeeds on these fronts, the Neocloud investment thesis will require significant reassessment.

marsbit47 хв тому

When Google Also 'Prints Stocks' to Build AI, Whose Narrative is Shattering the High Valuations of Neocloud?

marsbit47 хв тому

Торгівля

Спот
Ф'ючерси

Популярні статті

Що таке $S$

Розуміння SPERO: Комплексний огляд Вступ до SPERO Оскільки ландшафт інновацій продовжує еволюціонувати, виникнення технологій web3 та криптовалютних проектів відіграє ключову роль у формуванні цифрового майбутнього. Один з проектів, який привернув увагу в цій динамічній сфері, — це SPERO, позначений як SPERO,$$s$. Ця стаття має на меті зібрати та представити детальну інформацію про SPERO, щоб допомогти ентузіастам та інвесторам зрозуміти його основи, цілі та інновації в рамках web3 та крипто-сектору. Що таке SPERO,$$s$? SPERO,$$s$ — це унікальний проект у криптопросторі, який прагне використати принципи децентралізації та технології блокчейн для створення екосистеми, що сприяє залученню, корисності та фінансовій інклюзії. Проект розроблений для полегшення взаємодії між користувачами новими способами, надаючи їм інноваційні фінансові рішення та послуги. У своїй основі SPERO,$$s$ прагне надати можливості індивідам, забезпечуючи інструменти та платформи, які покращують користувацький досвід у криптовалютному просторі. Це включає в себе можливість більш гнучких методів транзакцій, сприяння ініціативам, що підтримуються спільнотою, та створення шляхів для фінансових можливостей через децентралізовані додатки (dApps). Основна концепція SPERO,$$s$ обертається навколо інклюзивності, прагнучи зменшити розриви в традиційній фінансовій системі, використовуючи переваги технології блокчейн. Хто є творцем SPERO,$$s$? Особистість творця SPERO,$$s$ залишається дещо невідомою, оскільки є обмежені публічно доступні ресурси, що надають детальну інформацію про його засновників. Ця відсутність прозорості може бути наслідком зобов'язання проекту до децентралізації — етики, яку багато проектів web3 поділяють, ставлячи колективні внески вище за індивідуальне визнання. Зосереджуючи обговорення навколо спільноти та її колективних цілей, SPERO,$$s$ втілює суть наділення без виділення конкретних осіб. Таким чином, розуміння етики та місії SPERO є більш важливим, ніж ідентифікація єдиного творця. Хто є інвесторами SPERO,$$s$? SPERO,$$s$ підтримується різноманітними інвесторами, починаючи від венчурних капіталістів до ангельських інвесторів, які прагнуть сприяти інноваціям у крипто-секторі. Зосередження цих інвесторів зазвичай узгоджується з місією SPERO — пріоритет надається проектам, які обіцяють технологічний прогрес у суспільстві, фінансову інклюзію та децентралізоване управління. Ці інвесторські фонди зазвичай зацікавлені в проектах, які не лише пропонують інноваційні продукти, але й позитивно впливають на спільноту блокчейн та її екосистеми. Підтримка з боку цих інвесторів підкріплює SPERO,$$s$ як значного конкурента в швидко змінюваній сфері крипто-проектів. Як працює SPERO,$$s$? SPERO,$$s$ використовує багатогранну структуру, яка відрізняє його від традиційних криптовалютних проектів. Ось деякі ключові особливості, які підкреслюють його унікальність та інноваційність: Децентралізоване управління: SPERO,$$s$ інтегрує моделі децентралізованого управління, надаючи користувачам можливість активно брати участь у процесах прийняття рішень щодо майбутнього проекту. Цей підхід сприяє відчуттю власності та відповідальності серед членів спільноти. Корисність токена: SPERO,$$s$ використовує свій власний криптовалютний токен, розроблений для виконання різних функцій в екосистемі. Ці токени дозволяють здійснювати транзакції, отримувати винагороди та полегшувати послуги, що пропонуються на платформі, підвищуючи загальну залученість та корисність. Шарова архітектура: Технічна архітектура SPERO,$$s$ підтримує модульність та масштабованість, що дозволяє безперешкодно інтегрувати додаткові функції та додатки в міру розвитку проекту. Ця адаптивність є надзвичайно важливою для збереження актуальності в постійно змінюваному крипто-ландшафті. Залучення спільноти: Проект підкреслює ініціативи, що підтримуються спільнотою, використовуючи механізми, які стимулюють співпрацю та зворотний зв'язок. Підтримуючи сильну спільноту, SPERO,$$s$ може краще задовольняти потреби користувачів та адаптуватися до ринкових тенденцій. Фокус на інклюзію: Пропонуючи низькі комісії за транзакції та зручні інтерфейси, SPERO,$$s$ прагне залучити різноманітну базу користувачів, включаючи осіб, які раніше не брали участі в крипто-просторі. Це зобов'язання до інклюзії узгоджується з його загальною місією наділення через доступність. Хронологія SPERO,$$s$ Розуміння історії проекту надає важливі уявлення про його розвиток та етапи. Нижче наведено пропоновану хронологію, що відображає значні події в еволюції SPERO,$$s$: Етап концептуалізації та ідеації: Початкові ідеї, що стали основою SPERO,$$s$, були сформовані, тісно пов'язані з принципами децентралізації та фокусом на спільноті в індустрії блокчейн. Запуск білого паперу проекту: Після концептуального етапу був випущений комплексний білий папір, що детально описує бачення, цілі та технологічну інфраструктуру SPERO,$$s$, щоб залучити інтерес та зворотний зв'язок від спільноти. Створення спільноти та ранні залучення: Активні зусилля були спрямовані на створення спільноти ранніх прихильників та потенційних інвесторів, що полегшило обговорення цілей проекту та отримання підтримки. Подія генерації токенів: SPERO,$$s$ провів подію генерації токенів (TGE) для розподілу своїх рідних токенів серед ранніх прихильників та встановлення початкової ліквідності в екосистемі. Запуск початкового dApp: Перший децентралізований додаток (dApp), пов'язаний з SPERO,$$s$, став доступним, дозволяючи користувачам взаємодіяти з основними функціями платформи. Постійний розвиток та партнерства: Безперервні оновлення та вдосконалення пропозицій проекту, включаючи стратегічні партнерства з іншими учасниками блокчейн-простору, сформували SPERO,$$s$ у конкурентоспроможного та еволюціонуючого гравця на крипто-ринку. Висновок SPERO,$$s$ є свідченням потенціалу web3 та криптовалют для революціонізації фінансових систем та наділення індивідів. Завдяки зобов'язанню до децентралізованого управління, залучення спільноти та інноваційно спроектованих функцій, він прокладає шлях до більш інклюзивного фінансового ландшафту. Як і з будь-якими інвестиціями в швидко змінюваному крипто-просторі, потенційним інвесторам та користувачам рекомендується ретельно досліджувати та обдумано взаємодіяти з поточними подіями в SPERO,$$s$. Проект демонструє інноваційний дух крипто-індустрії, запрошуючи до подальшого дослідження його численних можливостей. Хоча подорож SPERO,$$s$ ще триває, його основні принципи можуть справді вплинути на майбутнє того, як ми взаємодіємо з технологією, фінансами та один з одним у взаємопов'язаних цифрових екосистемах.

73 переглядів усьогоОпубліковано 2024.12.17Оновлено 2024.12.17

Що таке $S$

Що таке AGENT S

Агент S: Майбутнє автономної взаємодії в Web3 Вступ У постійно змінюваному ландшафті Web3 та криптовалюти інновації постійно переосмислюють, як люди взаємодіють з цифровими платформами. Один з таких новаторських проектів, Агент S, обіцяє революціонізувати взаємодію людини з комп'ютером через свою відкриту агентну структуру. Прокладаючи шлях для автономних взаємодій, Агент S прагне спростити складні завдання, пропонуючи трансформаційні застосування в штучному інтелекті (ШІ). Це детальне дослідження заглиблюється в складності проекту, його унікальні особливості та наслідки для сфери криптовалюти. Що таке Агент S? Агент S є революційною відкритою агентною структурою, спеціально розробленою для вирішення трьох основних викликів в автоматизації комп'ютерних завдань: Набуття специфічних знань у галузі: Структура інтелектуально навчається з різних зовнішніх джерел знань та внутрішнього досвіду. Цей подвійний підхід дозволяє їй створити багатий репозиторій специфічних знань у галузі, покращуючи її продуктивність у виконанні завдань. Планування на довгих горизонтах завдань: Агент S використовує планування з підкріпленням досвіду, стратегічний підхід, який полегшує ефективний розподіл та виконання складних завдань. Ця функція значно підвищує її здатність ефективно та результативно управляти кількома підзавданнями. Обробка динамічних, неоднорідних інтерфейсів: Проект представляє Інтерфейс Агент-Комп'ютер (ACI), інноваційне рішення, яке покращує взаємодію між агентами та користувачами. Використовуючи багатомодальні великі мовні моделі (MLLMs), Агент S може безперешкодно орієнтуватися та маніпулювати різноманітними графічними інтерфейсами користувача. Завдяки цим новаторським функціям Агент S надає надійну структуру, яка вирішує складнощі, пов'язані з автоматизацією людської взаємодії з машинами, прокладаючи шлях для численних застосувань у ШІ та за його межами. Хто є творцем Агент S? Хоча концепція Агент S є фундаментально новаторською, конкретна інформація про його творця залишається невідомою. Творець наразі невідомий, що підкреслює або початкову стадію проекту, або стратегічний вибір зберегти засновників у таємниці. Незважаючи на анонімність, акцент залишається на можливостях та потенціалі структури. Хто є інвесторами Агент S? Оскільки Агент S є відносно новим у криптографічній екосистемі, детальна інформація про його інвесторів та фінансових спонсорів не задокументована. Відсутність публічно доступних відомостей про інвестиційні фонди або організації, що підтримують проект, викликає питання щодо його фінансової структури та дорожньої карти розвитку. Розуміння підтримки є критично важливим для оцінки стійкості проекту та потенційного впливу на ринок. Як працює Агент S? В основі Агент S лежить передова технологія, яка дозволяє йому ефективно функціонувати в різних умовах. Його операційна модель побудована навколо кількох ключових функцій: Взаємодія з комп'ютером, подібна до людської: Структура пропонує розширене планування ШІ, прагнучи зробити взаємодії з комп'ютерами більш інтуїтивними. Імітуючи людську поведінку при виконанні завдань, вона обіцяє підвищити досвід користувачів. Наративна пам'ять: Використовується для використання високорівневого досвіду, Агент S використовує наративну пам'ять для відстеження історій завдань, тим самим покращуючи свої процеси прийняття рішень. Епізодична пам'ять: Ця функція надає користувачам покрокові інструкції, дозволяючи структурі пропонувати контекстуальну підтримку в міру виконання завдань. Підтримка OpenACI: Завдяки можливості працювати локально, Агент S дозволяє користувачам зберігати контроль над своїми взаємодіями та робочими процесами, узгоджуючи з децентралізованою етикою Web3. Легка інтеграція з зовнішніми API: Його універсальність і сумісність з різними платформами ШІ забезпечують те, що Агент S може безперешкодно вписатися в існуючі технологічні екосистеми, роблячи його привабливим вибором для розробників та організацій. Ці функціональні можливості колективно сприяють унікальному положенню Агент S у крипто-просторі, оскільки він автоматизує складні, багатоступеневі завдання з мінімальним втручанням людини. У міру розвитку проекту його потенційні застосування в Web3 можуть переосмислити, як відбуваються цифрові взаємодії. Хронологія Агент S Розробка та етапи Агент S можуть бути узагальнені в хронології, яка підкреслює його значні події: 27 вересня 2024 року: Концепція Агент S була представлена в комплексній науковій статті під назвою “Відкрита агентна структура, яка використовує комп'ютери як людина”, що демонструє основи проекту. 10 жовтня 2024 року: Наукова стаття була опублікована на arXiv, пропонуючи детальне дослідження структури та її оцінки продуктивності на основі бенчмарку OSWorld. 12 жовтня 2024 року: Було випущено відеопрезентацію, що надає візуальне уявлення про можливості та особливості Агент S, ще більше залучаючи потенційних користувачів та інвесторів. Ці маркери в хронології не лише ілюструють прогрес Агент S, але й вказують на його прихильність до прозорості та залучення громади. Ключові моменти про Агент S У міру розвитку структури Агент S кілька ключових характеристик виділяються, підкреслюючи її новаторський характер та потенціал: Інноваційна структура: Розроблена для забезпечення інтуїтивного використання комп'ютерів, подібного до людської взаємодії, Агент S пропонує новий підхід до автоматизації завдань. Автономна взаємодія: Здатність автономно взаємодіяти з комп'ютерами через GUI означає стрибок до більш інтелектуальних та ефективних обчислювальних рішень. Автоматизація складних завдань: Завдяки своїй надійній методології він може автоматизувати складні, багатоступеневі завдання, роблячи процеси швидшими та менш схильними до помилок. Безперервне вдосконалення: Механізми навчання дозволяють Агенту S покращуватися на основі минулого досвіду, постійно підвищуючи свою продуктивність та ефективність. Універсальність: Його адаптивність до різних операційних середовищ, таких як OSWorld та WindowsAgentArena, забезпечує його здатність служити широкому спектру застосувань. Оскільки Агент S займає своє місце в ландшафті Web3 та криптовалюти, його потенціал покращити можливості взаємодії та автоматизувати процеси означає значний прогрес у технологіях ШІ. Завдяки своїй інноваційній структурі Агент S є прикладом майбутнього цифрових взаємодій, обіцяючи більш безперешкодний та ефективний досвід для користувачів у різних галузях. Висновок Агент S представляє собою сміливий крок вперед у поєднанні ШІ та Web3, з можливістю переосмислити, як ми взаємодіємо з технологією. Хоча проект все ще на ранніх стадіях, можливості для його застосування є величезними та переконливими. Завдяки своїй комплексній структурі, що вирішує критичні виклики, Агент S прагне вивести автономні взаємодії на передній план цифрового досвіду. У міру того, як ми заглиблюємося в сфери криптовалюти та децентралізації, проекти, подібні до Агент S, безсумнівно, відіграватимуть ключову роль у формуванні майбутнього технологій та співпраці людини з комп'ютером.

672 переглядів усьогоОпубліковано 2025.01.14Оновлено 2025.01.14

Що таке AGENT S

Як купити S

Ласкаво просимо до HTX.com! Ми зробили покупку Sonic (S) простою та зручною. Дотримуйтесь нашої покрокової інструкції, щоб розпочати свою криптовалютну подорож.Крок 1: Створіть обліковий запис на HTXВикористовуйте свою електронну пошту або номер телефону, щоб зареєструвати обліковий запис на HTX безплатно. Пройдіть безпроблемну реєстрацію й отримайте доступ до всіх функцій.ЗареєструватисьКрок 2: Перейдіть до розділу Купити крипту і виберіть спосіб оплатиКредитна/дебетова картка: використовуйте вашу картку Visa або Mastercard, щоб миттєво купити Sonic (S).Баланс: використовуйте кошти з балансу вашого рахунку HTX для безперешкодної торгівлі.Треті особи: ми додали популярні способи оплати, такі як Google Pay та Apple Pay, щоб підвищити зручність.P2P: Торгуйте безпосередньо з іншими користувачами на HTX.Позабіржова торгівля (OTC): ми пропонуємо індивідуальні послуги та конкурентні обмінні курси для трейдерів.Крок 3: Зберігайте свої Sonic (S)Після придбання Sonic (S) збережіть його у своєму обліковому записі на HTX. Крім того, ви можете відправити його в інше місце за допомогою блокчейн-переказу або використовувати його для торгівлі іншими криптовалютами.Крок 4: Торгівля Sonic (S)Легко торгуйте Sonic (S) на спотовому ринку HTX. Просто увійдіть до свого облікового запису, виберіть торгову пару, укладайте угоди та спостерігайте за ними в режимі реального часу. Ми пропонуємо зручний досвід як для початківців, так і для досвідчених трейдерів.

1.5k переглядів усьогоОпубліковано 2025.01.15Оновлено 2026.06.02

Як купити S

Обговорення

Ласкаво просимо до спільноти HTX. Тут ви можете бути в курсі останніх подій розвитку платформи та отримати доступ до професійної ринкової інформації. Нижче представлені думки користувачів щодо ціни S (S).

活动图片