Ne vous focalisez plus sur les GPU, Intel dévoile une manœuvre majeure, peut-elle mettre fin au monopole de Nvidia sur la puissance de calcul ?

marsbitPublished on 2026-06-03Last updated on 2026-06-03

Abstract

Au cours des deux dernières années, le GPU a été au cœur du matériel informatique pour l'IA. Cependant, lors du COMPUTEX 2026, Intel a présenté une vision différente, axée sur l'Agentic AI (IA agentique). Contrairement aux modèles d'IA traditionnels fonctionnant par « tours » de questions-réponses, l'IA agentique opère dans des flux de travail réels, suivant un cycle continu de réflexion, planification, action et évaluation. Cela transforme fondamentalement l'utilisation du calcul, nécessitant une forte coordination système et un traitement de tâches fragmentées. Intel soutient que cela rééquilibrera la répartition des ressources dans les centres de données. Alors que la phase d'entraînement des modèles avancés repose fortement sur les GPU (avec des ratios CPU/GPU pouvant atteindre 1:8), le déploiement d'agents intelligents nécessitera davantage de puissance CPU pour l'orchestration des tâches, l'appel d'outils et la gestion des données, ramenant le ratio vers 1:1, voire en faveur du CPU. La consommation de tokens peut être multipliée par 1000 par rapport à une inférence simple. Pour répondre à cette nouvelle demande, Intel a dévoilé le processeur Xeon 6+ (fabriqué en technologie 18A), offrant jusqu'à 288 cœurs efficaces et conçu pour une haute densité et une meilleure efficacité énergétique. Parallèlement, Intel a présenté une nouvelle architecture d'inférence découplée, développée avec des partenaires comme SambaNova. Cette solution répartit les différentes étapes de l'in...

Au cours des deux dernières années, le cœur du matériel d'IA s'est presque résumé à une seule chose : le GPU.

De l'entraînement des grands modèles aux grappes d'inférence, en passant par la puissance de calcul entre périphériques et cloud, toute l'industrie a discuté de qui pourrait obtenir plus de GPU, qui pourrait enfoncer plus de cartes de calcul dans les centres de données. On peut dire que toute l'industrie de l'IA tourne autour des GPU, ce qui a également propulsé le cours de l'action de Nvidia à des sommets.

Mais lors du COMPUTEX 2026, Intel a présenté une analyse différente : La prochaine étape de l'IA ne peut pas se contenter de regarder les GPU. Le cœur de cette analyse est le mot-clé que Pat Gelsinger a répété dans son discours principal : Agentic AI, c'est-à-dire ce que nous appelons communément les agents intelligents.

Source : Intel

Les agents intelligents sont en train de changer l'écosystème du calcul

La différence entre les agents intelligents et l'IA traditionnelle est en réalité très grande. L'utilisation de l'IA traditionnelle ressemble à une machine de questions-réponses en « tours par tour », tandis que les agents intelligents doivent s'intégrer dans de véritables flux de travail, achevant activement le cycle « réflexion, planification, action, rétrospective ». En d'autres termes, ils doivent apprendre à lire des données, à utiliser des outils, à exécuter des tâches et à vérifier les résultats, puis à ajuster continuellement l'étape suivante en fonction des retours.

Cela signifie que l'inférence IA n'est plus une « transaction unique », mais devient un système d'auto-décision et d'auto-raisonnement en fonctionnement continu, ce qui change également complètement la manière dont la puissance de calcul est utilisée. Ainsi, le point de vue le plus central d'Intel cette fois est le suivant : L'Agentic AI va remodeler la répartition de la puissance de calcul dans les centres de données.

Actuellement, lors de la phase d'entraînement des modèles de pointe, le ratio CPU/GPU peut approcher 1:8, le GPU supportant la grande majorité de la pression de calcul. Cependant, en entrant dans le mode d'inférence des agents intelligents, le CPU doit être responsable de l'orchestration des tâches, de l'appel d'outils, de la migration des données et de la coordination du système. À ce moment-là, le ratio CPU/GPU tendra progressivement vers 1:1, voire nécessitera une densité de CPU plus élevée pour décomposer rapidement les tâches.

En effet, lorsqu'un agent intelligent ne génère pas seulement une réponse, mais doit continuellement appeler des modèles, des outils et des systèmes externes, son état de fonctionnement est complètement différent de celui de l'IA traditionnelle. Intel a mentionné dans son discours une donnée : par rapport à l'inférence en un seul tour, la consommation de tokens d'un agent intelligent peut augmenter jusqu'à 1000 fois.

Source : Intel

Autrement dit, ce que les agents intelligents apportent n'est pas une simple augmentation du volume d'inférence, mais une charge système plus complexe, plus fréquente et plus fragmentée. Si on jette à nouveau toutes ces charges sur le GPU, c'est à la fois inefficace et coûteux.

Et le processeur Xeon 6+ lancé cette fois par Intel est fabriqué sur le procédé 18A d'Intel, embarquant jusqu'à 288 cœurs efficaces, et équipé d'un cache L3 maximum de 576 Mo. Pour les charges de travail exigeantes en matière de cloud natif, d'Agentic AI et d'intensité réseau, il peut offrir une meilleure efficacité énergétique et des performances continues plus stables.

Dans la solution présentée par Intel, un châssis refroidi par liquide occupant un espace de calcul de 32U peut fournir 36864 cœurs ; la consommation du châssis n'est que d'environ 100kW, suffisant pour supporter un déploiement d'agents intelligents à haute densité. Bien que 100kW puissent sembler impressionnants, comparé aux châssis serveurs de performances équivalentes du passé, la consommation a déjà été considérablement réduite.

En dehors du Xeon 6+, il y a quelque chose de plus intéressant : la redécoupe par Intel de l'architecture d'inférence.

Dans son discours, Intel a annoncé, en partenariat avec SambaNova, Vista Equity Partners, Cambium Capital et d'autres, le lancement officiel d'une toute nouvelle solution d'inférence totalement découplée. Cette solution fonctionne sur le cloud d'agents Vector Core Compute, où les processeurs Intel Xeon 6 sont responsables de l'orchestration et de l'exécution, puis le SambaNova SN40 RDU se charge du décodage, et enfin le GPU NVIDIA Blackwell est responsable du pré-remplissage.

Source : Intel

Ce nouveau système est spécialement conçu pour les charges de travail des agents intelligents. Contrairement à de nombreux systèmes d'IA passés qui avaient l'habitude de confier la majeure partie du travail de la chaîne d'inférence au GPU, dans cette architecture, le CPU, le RDU et le GPU vont assumer leurs responsabilités respectives, se chargeant de différentes étapes telles que la planification du système, le décodage, le pré-remplissage, etc., permettant à chaque phase d'inférence de s'exécuter sur le matériel le plus adapté, maximisant ainsi l'efficacité.

Et après la présentation du Xeon 6+, le processeur Core Ultra de troisième génération, lancé il y a quelque temps, est également réapparu. Il constitue un autre maillon de l'écosystème AI d'Intel - le cœur de l'IA côté périphérique. Dans le discours, le serveur hybride local présenté par Intel et Perplexity était justement construit sur la base du serveur cloud Core Ultra de troisième génération et du serveur Xeon 6+.

Source : Intel

Il peut répartir dynamiquement la charge de travail entre le local et le cloud en fonction des capacités et des caractéristiques fonctionnelles des appareils, réduisant ainsi davantage la dépendance à la puissance de calcul cloud. C'est également la forme idéale future du PC AI : en répartissant dynamiquement les performances, tout en réduisant les coûts de tokens, garantir l'immédiateté des tâches et la protection de la confidentialité des données.

Outre les PC, Intel continue d'étendre le Core Ultra de troisième génération aux consoles de jeu portables et au calcul en périphérie du réseau (edge computing). Le nouveau processeur Arc G3 Series, optimisé sur la base de la même architecture, est destiné aux appareils de jeu portables et sera commercialisé plus tard ce mois-ci (la carte graphique intégrée tant attendue par les utilisateurs de consoles portables arrive enfin).

Du général au sur-mesure, Intel veut aussi être « omniprésent »

Au-delà des processeurs généralistes, Intel a également mis en avant cette fois-ci les puces sur mesure, une activité que Pat Gelsinger, PDG d'Intel, ne cesse de promouvoir depuis son arrivée.

Intel estime que les puces sur mesure auront un marché énorme à l'avenir, car avec la pénétration de l'IA dans différents secteurs, les clients seront de moins en moins satisfaits de la puissance de calcul généraliste. Pour rechercher une efficacité et des performances plus élevées, ils auront tendance à se tourner progressivement vers des puces sur mesure pour maintenir leur compétitivité.

Dans son discours, Intel a mentionné qu'il collaborait avec Google pour lancer une IPU, un type de puce très important pour les fournisseurs de services cloud afin d'améliorer les performances de leur infrastructure. Parallèlement, Intel collabore également avec des clients télécoms comme Ericsson pour fournir des puces d'infrastructure sans fil avancée à l'échelle mondiale.

C'est en fait un autre thème du discours de Pat Gelsinger : Intel ne compte plus sur une seule puce généraliste pour gagner le marché, mais regroupe les puces, les systèmes, les logiciels et les collaborations sectorielles en un ensemble complet de solutions, qui peut être librement personnalisé en fonction des besoins des différentes entreprises, maximisant ainsi les avantages d'Intel.

Source : Intel

De l'avis de Leikeji (Note : probablement "雷科技" translittéré), Intel redéfinit en réalité sa position dans l'écosystème : les centres de données ont besoin de CPU pour orchestrer les agents intelligents, les systèmes d'inférence nécessitent un découplage hétérogène pour réduire les coûts, les PC ont besoin d'un traitement IA local pour les problèmes de confidentialité et de conformité, la périphérie du réseau et l'intelligence incarnée (embodied AI) ont besoin de puces à haute efficacité énergétique, et les clients sectoriels nécessitent des puces sur mesure.

En répondant aux besoins des entreprises dans différents domaines et sur différentes parties de la chaîne, Intel deviendra encore plus « omniprésent » que Nvidia.

Bien sûr, la pression devant Intel reste énorme. Les avantages de NVIDIA en matière d'accélérateurs d'IA et d'écosystème logiciel sont toujours évidents, et AMD continue d'attaquer sur les CPU serveurs et les puces d'IA. Pour qu'Intel parvienne à suivre cette voie, tout dépendra finalement de la vitesse de production en masse du procédé 18A, de la capacité de la solution au niveau châssis du Xeon 6+ à se déployer rapidement, et de savoir si les clients peuvent réellement tirer des bénéfices significatifs de ce nouveau système.

Mais au moins cette fois, la direction d'Intel est plus claire que par le passé.

On peut dire qu'avec l'entrée de l'IA dans l'ère des agents intelligents, la concurrence n'est plus depuis longtemps une simple comparaison des performances de pointe d'une seule puce, mais implique l'optimisation de l'efficacité de collaboration de l'ensemble du système de calcul. Le GPU reste important, mais le CPU, les périphériques en périphérie du réseau (edge), l'IA locale et les puces sur mesure redeviendront également cruciaux.

Et ce qu'Intel souhaite saisir, c'est précisément cette période de fenêtre où l'infrastructure de l'IA se redéfinit.

XRP Ledger Launches XRPLd Rebrand With Version 3.2.0 Upgrade

XRP Ledger has launched version 3.2.0, rebranding its core server software from "rippled" to "xrpld." This release focuses on back-end upgrades, including major memory optimizations that can reduce server memory usage by up to 40% and architectural improvements for future scaling. Key updates enhance security for features like vaults, lending, and decentralized exchanges, and introduce new invariant checks for ledger consistency. The upgrade also adds the capability for applications to retrieve protocol information without connecting to a server, aiding wallet and API development. Additional changes aim to improve enterprise connectivity and performance, featuring configurable block sizes and an updated default peering port, along with various fixes for core network functions.

TheNewsCrypto32m ago

XRP Ledger Launches XRPLd Rebrand With Version 3.2.0 Upgrade

TheNewsCrypto32m ago

AGI is Not the End, DeepMind's New Paper: Moving Towards ASI, the Real AI Progress Has Just Begun

In a new report, Google DeepMind researchers argue that achieving Artificial General Intelligence (AGI) is not the end goal, but rather a step toward Artificial Superintelligence (ASI). They outline four potential pathways for this transition: 1) continued scaling of compute, models, and data; 2) algorithmic evolution and potential paradigm shifts; 3) recursive self-improvement; and 4) multi-agent coordination and collective intelligence. The report also identifies six key bottlenecks that could hinder progress: data limitations (the "data wall"), economic and resource pressures, limitations of current neural network paradigms, increasing research difficulty, "abstraction barriers" in forming new concepts, and regulatory and societal pushback. Looking ahead, the authors emphasize the need for new evaluation methods once AI surpasses human benchmarks. They call for a large-scale, interdisciplinary effort to prepare for a future where AI-driven advancements could trigger transformative changes across multiple fields. The path and speed of progress remain uncertain, constrained by physical laws, computational complexity, and real-world feedback loops.

marsbit1h ago

AGI is Not the End, DeepMind's New Paper: Moving Towards ASI, the Real AI Progress Has Just Begun

marsbit1h ago

Kraken Launches Pre-IPO Perps For OpenAI And Anthropic With Up To 5x Leverage

Kraken has launched pre-IPO perpetual futures contracts for private AI giants OpenAI and Anthropic, offering eligible traders up to 5x leverage. These derivatives provide synthetic exposure to the companies' valuations ahead of any public listing, tapping into high investor demand for AI themes. However, the product carries unique risks compared to standard crypto perpetuals, as private company valuations lack transparent, continuous pricing and depend on funding rounds, secondary transactions, and IPO timelines. This move signals crypto exchanges' expansion into alternative speculative markets beyond digital assets, though it raises questions about risk management, liquidity, and investor understanding, especially when using leverage.

bitcoinist1h ago

Kraken Launches Pre-IPO Perps For OpenAI And Anthropic With Up To 5x Leverage

bitcoinist1h ago

Pricing OpenAI Pre-IPO: A New, Life-or-Death Business on Hyperliquid Lasting Half a Year

Pricing OpenAI Pre-IPO: Hyperliquid's High-Stakes, Six-Month Business Venture The article analyzes the nascent market for pre-IPO perpetual contracts on the Hyperliquid blockchain, exemplified by two contrasting teams: Trade.xyz and Ventuals. Trade.xyz, an anonymous team, successfully built the largest pre-market on Hyperliquid. Its strategy focused on near-term events, like the SpaceX IPO. By listing a SpaceX contract with a known launch date and price, the market had a tangible "anchor" (the eventual Nasdaq opening price) to converge upon, which kept speculation in check. This approach fueled significant growth. In stark contrast, Ventuals, backed by Paradigm, failed despite holding coveted contracts for OpenAI and Anthropic. Its critical flaw was its pricing mechanism for these companies, which have no imminent IPO. Ventuals' oracle price was half-derived from infrequent private market transactions and half from its own contract's moving average. This created a self-reinforcing loop where buying pressure artificially inflated the price, disconnecting it from real supply and demand. The market became illiquid and structurally skewed. Ventuals shut down nine months after launch, reportedly through an acquisition. Its final settlement prices—OpenAI at ~$1,341 and Anthropic at ~$1,618—were thus partially products of its flawed model. Ironically, some company employees and late-stage VCs reportedly used these prices for valuation reference, highlighting the desperate demand for price discovery in opaque private markets. The failure of Ventuals exposes the core challenge of this business: price for illiquid, non-public assets requires a robust, self-correcting market, which is absent without a definitive public listing event. Nevertheless, demand is driving major players like Coinbase and traditional finance (e.g., Citi) to enter the space, aiming to provide 24/7 trading for coveted private company shares. The venture's ultimate viability, however, hinges on solving the fundamental pricing problem Ventuals could not.

marsbit1h ago

Pricing OpenAI Pre-IPO: A New, Life-or-Death Business on Hyperliquid Lasting Half a Year

marsbit1h ago

Are the "Magnificent Seven" No Longer Enough? SpaceX IPO Attracts Retail Frenzy, Wall Street Serves Up the "AI Tech Ten"

The article discusses a potential shift in Wall Street's categorization of major tech stocks, driven by SpaceX's highly successful IPO. On its first day of trading, SpaceX attracted $117 million in net purchases from retail investors, accounting for 56% of all U.S. retail stock buys that day. This surge has prompted research firm Vanda to propose a new group called the "FAB 10" (Frontier AI & Big Tech 10). This concept suggests replacing the long-standing "Magnificent Seven" with ten companies believed to define the next decade of AI and technology. The proposed FAB 10 would include the original seven giants plus SpaceX and the yet-to-be-public AI firms OpenAI and Anthropic, both anticipated to go public later this year with valuations potentially reaching trillions. This contrasts with another proposed grouping, Bank of America's "AI Big 10," which adds semiconductor companies like Broadcom, AMD, and Micron to the core seven, focusing more on hardware. The divergence highlights different bets on the future drivers of tech growth. Analysts note that the massive influx of retail money into new listings like SpaceX might divert capital from other hot sectors, such as chip stocks, and warn that high valuations across the tech sector may indicate bubble risks.

marsbit2h ago

Are the "Magnificent Seven" No Longer Enough? SpaceX IPO Attracts Retail Frenzy, Wall Street Serves Up the "AI Tech Ten"

marsbit2h ago

Trading

Spot

Futures

Hot Articles

Hot Tokens Learning Week 7: Privacy Coins Rally in Rotation, with RIVER Standing Out as 2026’s Surprise Performer

The privacy + payments narrative has been the primary catalyst driving rotation and substantial price gains in privacy coins such as DASH and XMR.

16.6k Total ViewsPublished 2026.01.20Updated 2026.01.20

Hot Tokens Learning Week 7: Privacy Coins Rally in Rotation, with RIVER Standing Out as 2026’s Surprise Performer

Hot Tokens Learning Week 8: ADA's Ouroboros Leios Mainnet Expected to Launch in 2026

ADA's Ouroboros Leios mainnet is expected to launch in 2026, and the hard fork to Protocol Version 11 is planned for Q1 2026.

40.5k Total ViewsPublished 2026.02.10Updated 2026.02.12

Hot Tokens Learning Week 8: ADA's Ouroboros Leios Mainnet Expected to Launch in 2026

Hot Tokens Learning Week 14: Glamsterdam Set to Be Ethereum's Most Closely Watched Upgrade in 2026

Ordinals/Runes continue to drive block fee revenue and developer activity, and are seen as the starting point for Bitcoin's "native asset issuance".

26.8k Total ViewsPublished 2026.04.29Updated 2026.04.29

Hot Tokens Learning Week 14: Glamsterdam Set to Be Ethereum's Most Closely Watched Upgrade in 2026

Discussions

Welcome to the HTX Community. Here, you can stay informed about the latest platform developments and gain access to professional market insights. Users' opinions on the price of S (S) are presented below.

Ne vous focalisez plus sur les GPU, Intel dévoile une manœuvre majeure, peut-elle mettre fin au monopole de Nvidia sur la puissance de calcul ?

Abstract

Les agents intelligents sont en train de changer l'écosystème du calcul

Du général au sur-mesure, Intel veut aussi être « omniprésent »

Related Reads

XRP Ledger Launches XRPLd Rebrand With Version 3.2.0 Upgrade

AGI is Not the End, DeepMind's New Paper: Moving Towards ASI, the Real AI Progress Has Just Begun

Kraken Launches Pre-IPO Perps For OpenAI And Anthropic With Up To 5x Leverage

Pricing OpenAI Pre-IPO: A New, Life-or-Death Business on Hyperliquid Lasting Half a Year

Are the "Magnificent Seven" No Longer Enough? SpaceX IPO Attracts Retail Frenzy, Wall Street Serves Up the "AI Tech Ten"

Trading

Hot Articles

Hot Tokens Learning Week 7: Privacy Coins Rally in Rotation, with RIVER Standing Out as 2026’s Surprise Performer

Hot Tokens Learning Week 8: ADA's Ouroboros Leios Mainnet Expected to Launch in 2026

Hot Tokens Learning Week 14: Glamsterdam Set to Be Ethereum's Most Closely Watched Upgrade in 2026

Discussions

Top Questions

Hot Categories

Hot Tags