Ces deux dernières années, les fabricants de PC ont répété un paramètre en vantant les « AI PC » : la puissance de calcul du NPU. Mais que ce soit les 45 TOPS du Lunar Lake d’Intel ou les 50 TOPS du Strix Point d’AMD, ces chiffres sont restés à un niveau relativement modéré. Ils permettent de faire de la mise au point arrière-plan, de la réduction de bruit vocal, d’exécuter de petits modèles en périphérie, mais c’est à peu près tout.
Le 31 mai, lors de la conférence GTC 2026, Nvidia a dévoilé le super-puce RTX Spark, portant ce chiffre à 1 pétaflop, soit 1000 TOPS. Ce n’est pas une augmentation de 30% ou 50%, c’est un bond d’un ordre de grandeur.
Plusieurs autres annonces ont accompagné celle-ci : Microsoft a mis à niveau le mécanisme de sécurité natif de Windows pour l’adapter au RTX Spark et a intégré le runtime sandbox open-source d’Nvidia, OpenShell, à la plateforme Windows ; Adobe a annoncé une refonte en profondeur de Photoshop et Première Pro pour les adapter spécifiquement à l’architecture mémoire unifiée du RTX Spark ; six constructeurs OEM ont confirmé le lancement à l’automne d’ordinateurs portables fins et de PC compacts équipés de cette puce.
Ce qu’Nvidia a fait lors de cette GTC, ce n’est pas seulement présenter une nouvelle puce. Elle tente d’établir une nouvelle norme matérielle pour la catégorie de « l’ordinateur personnel IA ».
Quand le GPU devient le protagoniste du PC
Examinons d’abord la puce elle-même. Selon les données présentées par Nvidia lors du GTC, le RTX Spark intègre un GPU d’architecture Blackwell avec 6144 cœurs CUDA, associé à un CPU Grace Arm 20 cœurs conçu conjointement avec MediaTek, fabriqué en technologie 3nm de TSMC. Le changement clé réside dans l’architecture mémoire : jusqu’à 128 Go de mémoire unifiée, où CPU et GPU partagent le même pool de mémoire, évitant ainsi les transferts de données incessants entre les deux.
C’est le contraire de la logique architecturale traditionnelle du PC.
La structure de base d’un PC traditionnel est la suivante : « le CPU x86 est le processeur principal, le GPU dédié est un composant optionnel ». Même avec le concept récent d’AI PC, l’approche d’Intel et AMD consiste à intégrer un NPU dans le CPU, comme module additionnel d’accélération IA, avec une puissance généralement autour de 40-50 TOPS. Le GPU reste « externe ».
Le RTX Spark redistribue les rôles. Ce SoC fait du GPU le protagoniste et rétrograde le CPU au rôle de second plan. La puissance de calcul IA annoncée par Nvidia est de 1 pétaflop FP4, soit 1000 TOPS, plus de 20 fois supérieure à celle du NPU intégré des AI PC de la génération précédente. Ce n’est pas une accélération sur la même piste, c’est le départ sur une autre piste.
La rapidité d’adoption des constructeurs OEM confirme ce constat. Selon l’annonce officielle d’Nvidia et les informations ultérieures de DIGITIMES, Asus, Dell, HP, Lenovo, Microsoft Surface et MSI lanceront à l’automne des ordinateurs portables fins et des PC compacts équipés du RTX Spark, suivis par des modèles d’Acer et Gigabyte. Pratiquement toutes les grandes marques de PC Windows sont dans la course.
Le RTX Spark n’est pas né de rien. Début 2025, une puce avec les mêmes cœurs Blackwell et Grace était apparue sous les noms Project DIGITS et DGX Spark, mais elle était alors positionnée comme un supercalculateur de bureau Linux pour développeurs, d’un volume proche d’un petit PC de bureau. Un an plus tard, cette architecture a été compressée dans l’espace thermique d’un ultraportable, le système d’exploitation est passé de Linux à Windows, et les utilisateurs cibles se sont élargis des développeurs IA aux consommateurs grand public et aux entreprises. C’est là le changement le plus notable des annonces grand public du GTC 2026 : Nvidia ne présente pas un jouet pour développeurs, mais ouvre la porte au marché des consommateurs.
Exécuter localement un modèle de 120B, est-ce suffisant ?
Les chiffres de puissance et de mémoire doivent répondre à une question : que peut-on faire avec ?
La réponse donnée par Nvidia lors de la présentation est que le RTX Spark permet d’exécuter localement un grand modèle de 120 milliards de paramètres (120B), avec une fenêtre de contexte pouvant atteindre un million de tokens. Que représente 120B ? À titre de comparaison, la pratique courante sur le matériel grand public est qu’une RTX 4090 avec 24 Go de mémoire vidéo peut exécuter, grâce à la compression par quantification, des modèles de l’ordre de 30 à 40 milliards de paramètres. Les modèles plus légers exécutables rapidement sur des cartes grand public sont souvent des modèles de 9B. Le saut de 9B à 120B redéfinit le standard du « suffisant » pour l’IA en périphérie.
Les 128 Go de mémoire unifiée en sont le prérequis. Dans l’architecture PC traditionnelle, le CPU a sa mémoire système et le GPU sa mémoire vidéo, avec une frontière physique entre les deux. Un grand modèle dépassant la capacité de la mémoire vidéo ne peut soit pas du tout fonctionner, soit nécessite une division complexe du modèle et des échanges mémoire, ce qui réduit considérablement la vitesse. L’architecture à mémoire unifiée élimine ce goulot d’étranglement ; les données du modèle sont placées directement dans le pool partagé de 128 Go, accessible à la fois par le CPU et le GPU. Apple a été le premier à prouver la faisabilité grand public de cette approche technique avec l’Apple Silicon, maintenant Nvidia l’apporte au camp Windows.
Outre l’inférence des grands modèles, les cas d’utilisation listés par Nvidia incluent l’édition vidéo 12K, le rendu de scènes 3D de plus de 90 Go, et le jeu avec lancer de rayons à plus de 100 ips en résolution 1440p. Ces scénarios partagent la caractéristique de traiter des volumes de données extrêmement importants en une seule fois, ce qui sur un PC traditionnel entraîne soit des temps d’attente multiples du temps de traitement, soit tout simplement l’impossibilité de fonctionner.
Il reste un écart entre « supporter l’exécution » et « être utilisable avec fluidité ». Nvidia n’a pas dévoilé la vitesse d’inférence réelle d’un modèle 120B sur le RTX Spark, ni les données de latence du premier token dans des scénarios à fenêtre de contexte d’un million de tokens. L’indicateur clé déterminant la vitesse d’inférence avec un long contexte est la bande passante mémoire. À titre de référence, le DGX Spark, utilisant également le cœur GB10, atteint une bande passante mémoire mesurée d’environ 301 Go/s. Ce niveau de bande passante permet d’exécuter un modèle 120B, mais pour traiter une fenêtre de contexte d’un million de tokens, l’utilisateur pourrait devoir attendre plusieurs secondes avant de voir le premier token de sortie. La version portable du RTX Spark pourrait voir sa bande passante réelle ajustée à la baisse en raison des contraintes de consommation.
Ajouter une cage de sécurité à l’agent IA
Un autre élément central de l’annonce, au-delà de la puissance de calcul, est la coopération entre Nvidia et Microsoft au niveau système. Cette partie pourrait être la plus facilement négligée de la présentation grand public du GTC 2026, mais potentiellement la plus profonde en termes d’impact sur l’industrie.
Un ordinateur capable d’exécuter un modèle de 120B, s’il est confié à un agent IA capable d’opérer de manière autonome sur le bureau, de cliquer sur des boutons, de lire et écrire des fichiers, le risque pour la sécurité ne se situe plus au niveau de « perdre des données ou non », mais de « savoir si l’agent fera des choses que vous ne souhaitez pas ». Sans résoudre ce problème, aucune entreprise ne pourrait déployer un tel équipement à ses employés.
La solution proposée par Microsoft et Nvidia consiste en deux lignes de défense. Premièrement, Microsoft a amélioré le mécanisme de sécurité natif de Windows, offrant une surveillance et des contraintes au niveau du système d’exploitation pour les actions des agents IA. Deuxièmement, Nvidia a officiellement introduit le runtime OpenShell sur la plateforme Windows. Selon la documentation officielle d’Nvidia, OpenShell est un runtime sandbox open-source offrant une isolation au niveau du noyau. Il délimite un périmètre d’action contrôlé pour l’agent IA ; l’agent peut y exécuter des tâches de manière autonome, mais ses autorisations sont strictement limitées : il ne peut pas accéder aux fichiers système essentiels, aux connexions réseau ou aux données sensibles de l’utilisateur.
Cette combinaison a une signification claire pour les achats en entreprise. Auparavant, le concept d’« agent IA local » en restait au stade de la démonstration technique. Le matériel était capable, mais le cadre de sécurité était inexistant. Aucun service informatique d’entreprise n’aurait osé inclure un équipement dans cet état dans sa liste d’achats. En insérant une couche d’isolation standardisée entre le matériel et l’application, Nvidia et Microsoft transforment le « utilisable » en « gérable ».
La surcharge de performance d’OpenShell elle-même est une variable à observer. L’isolation en sandbox entraîne généralement une certaine perte de performances ; son impact réel sur la vitesse d’inférence ou la réactivité du système n’est pas encore documenté par Nvidia. La complexité de déploiement côté gestion informatique, la compatibilité avec les politiques de sécurité existantes, ces problèmes pratiques devront être validés après la mise sur le marché des équipements OEM.
Pourquoi Adobe accepte-t-elle une « refonte en profondeur » ?
Le degré de coopération des éditeurs de logiciels est généralement un indicateur de la capacité d’une nouvelle plateforme matérielle à s’imposer.
Les annonces d’Adobe lors du GTC constituent le signal logiciel le plus fort de cette série de lancements. Selon le blog officiel d’Nvidia et les confirmations de responsables d’Adobe, Adobe a entamé une refonte en profondeur de Photoshop et Première Pro pour les adapter spécifiquement à l’architecture mémoire unifiée du RTX Spark, promettant des gains de performance pour le traitement IA et graphique allant jusqu’à 2 fois.
Une « refonte en profondeur », ce n’est pas ajouter un plug-in ou créer une couche d’adaptation. Sur un PC traditionnel, le CPU et le GPU ayant chacun leur espace mémoire, lors du traitement d’un fichier PSD très volumineux ou d’une timeline vidéo 8K, les données doivent être transférées à plusieurs reprises entre les deux mémoires, ce qui est une source majeure de gaspillage de performance. La mémoire unifiée du RTX Spark permet au CPU et au GPU de partager directement le même espace de 128 Go ; ce changement structurel a une valeur pratique pour le flux de travail des créateurs professionnels. Qu’Adobe modifie son code en profondeur pour cela montre qu’elle considère que cette direction architecturale n’est pas un coup marketing ponctuel.
Cependant, la base de comparaison de cette « accélération de 2 fois » n’a été communiquée ni par Nvidia ni par Adobe. Est-ce par rapport à un processeur x86 de même génération avec une carte graphique dédiée, ou par rapport à la solution NPU des AI PC de la génération précédente ? Les implications sont totalement différentes. Tant que les conditions de référence des benchmarks ne sont pas publiques, la valeur de ce chiffre reste à évaluer.
Le soutien a également été annoncé par Blackmagic Design, ComfyUI, llama.cpp, OTOY ainsi que plusieurs éditeurs de jeux. Le suivi de ComfyUI et llama.cpp est notable, car ce sont actuellement les outils open-source les plus actifs dans les flux de travail IA locaux. Le soutien précoce de la communauté des développeurs reflète souvent plus fidèlement le potentiel d’une plateforme que les promesses des grands éditeurs.
Nvidia est en train de construire, dans le camp Windows, une expérience d’intégration logicielle-matérielle similaire à celle d’Apple, en s’appuyant sur l’écosystème CUDA et l’architecture mémoire unifiée. La différence est que le mur d’Apple est bâti par Apple seule, tandis que Nvidia doit convaincre Microsoft et les éditeurs de logiciels indépendants (ISV) de construire le mur ensemble. Qu’Adobe accepte de modifier son code en profondeur montre au moins que la première brique de ce mur est posée.
Au-delà des spécifications sur le papier
Revenons à une question très pratique : ces équipements seront-ils réellement disponibles à l’achat, et quelle sera l’expérience une fois en main ?
Selon les informations fournies par Nvidia, les premiers équipements RTX Spark seront lancés à l’automne, couvrant les ultraportables et PC compacts d’Asus, Dell, HP, Lenovo, Microsoft Surface et MSI. Les modèles d’Acer et Gigabyte suivront. Les prix spécifiques et les dates de lancement exactes des différents OEM n’ont pas été communiqués.
Plus critiques que les prix sont plusieurs inconnues au niveau physique. Comment équilibrer consommation électrique et dissipation thermique en insérant une puce d’une puissance de 1 pétaflop dans un ultraportable ? Quelle sera la performance quotidienne (bureautique) et l’autonomie du RTX Spark dans des scénarios non-IA ? La bande passante réelle des 128 Go de mémoire unifiée dans un format portable ne risque-t-elle pas d’être significativement réduite à cause des contraintes de consommation ?
Ces questions représentent le véritable test de l’industrialisation. La puissance de calcul maximale d’une puce sur un prototype d’ingénierie et ses performances réelles sur 8 heures par jour entre les mains d’un consommateur sont souvent deux choses différentes. Nvidia a mis en avant le rapport performance/consommation du RTX Spark lors de la présentation, mais n’a pas fourni de valeurs spécifiques de TDP ou de données d’autonomie.
Du point de vue de la structure de l’industrie du PC, l’apparition du RTX Spark marque l’émergence d’un nouveau modèle de division du travail. Au cours des trente dernières années, le pouvoir sur les puces cœur du PC était détenu par les fabricants de processeurs x86. Les fabricants de GPU, bien que de plus en plus importants, restaient des « composants optionnels insérés sur la carte mère ». Ce que Nvidia présente cette fois est un SoC complet, intégrant tout du CPU au GPU en passant par le contrôleur mémoire, la partie CPU Arm étant conçue par MediaTek. La structure de pouvoir de la chaîne d’approvisionnement du PC est en train de passer de « CPU x86 plus GPU optionnel » à « plateforme SoC centrée sur le GPU ».
Ce virage ne se fera pas en un jour. La stratégie de tarification des OEM, les performances réelles en matière d’efficacité énergétique des produits, la progression de l’adaptation des logiciels ISV, le cycle de validation des achats par les clients entreprises, chaque étape déterminera si le RTX Spark devient le nouveau point de référence de l’industrie du PC, ou une autre démonstration technique au départ prometteuse mais au succès limité. La réponse devra attendre au moins cet automne.








