Organisation et compilation : Deep TechFlow
Invite: Jensen Huang, PDG de NVIDIA
Source du podcast: Bonnie Blockchain
Titre original: Les 7 points clés du discours de Jensen Huang à la GTC Taipei 2026, le guide rapide des derniers développements de NVIDIA! 【Bonnie Blockchain】
Date de diffusion: 2 juin 2026
Résumé des points clés
Lors de son discours à la GTC Taipei 2026, Jensen Huang a centré la stratégie de la prochaine phase de NVIDIA sur un constat central : l'IA est passée de la génération de contenu à l'ère des agents capables de travailler, le Token n'est plus seulement un indicateur technique, mais une unité de production de revenus, de profits et de PIB. Autour de ce changement, NVIDIA lance Vera Rubin, le CPU Vera, une boîte à outils d'agents de niveau entreprise, une nouvelle génération de PC en collaboration avec Microsoft, ainsi que Cosmos 3, Alpamayo 2 et Isaac GR00T pour l'IA physique. Jensen Huang a souligné que le modèle de calcul de la prochaine décennie sera constitué de modèles, de cadres d'agents, d'outils et de compétences, et d'environnements d'exécution, et qu'il se diffusera du cloud, des entreprises et des PC locaux aux robots, usines, satellites et appareils périphériques. Pour la chaîne d'approvisionnement taïwanaise, cela signifie que les usines d'IA, l'efficacité énergétique, la vitesse de livraison des infrastructures et la capacité de synergie en pile complète deviendront les clés de la prochaine vague de croissance industrielle.
Extraits des points de vue marquants
L'arrivée de l'ère des agents IA
- "L'IA utile est arrivée, l'IA est maintenant un générateur de profits, et aussi un générateur de PIB. Derrière elle, il n'y a pas seulement un grand modèle de langage, mais un tout nouveau modèle de calcul : l'agent."
- "Un agent est constitué d'un grand modèle de langage et d'un cadre d'agent, le cadre fonctionne comme un système d'exploitation qui connecte la mémoire, les outils, le raisonnement, la planification et l'action."
- "La percée des systèmes d'agents provient du fait que les grands modèles de langage peuvent maintenant penser, raisonner, planifier et utiliser des outils, et aussi du fait que les cadres d'agents peuvent gérer la mémoire, coordonner les flux de travail et dispatcher les outils."
- "Chaque entreprise deviendra une entreprise d'agents, chaque entreprise fera fonctionner des agents en interne, et chaque entreprise aura besoin de son propre système d'exploitation pour agents."
Tokens, usines d'IA et économie des infrastructures
- "Le Token est maintenant une unité de revenus rentable. Les entreprises d'IA qui veulent produire plus de Tokens construiront plus d'usines d'IA, c'est précisément la raison de l'explosion de la demande de calcul à Taïwan."
- "Le calcul, c'est des revenus, le calcul, c'est des profits. Sans revenus ni profits, c'est une perte."
- "Si une usine d'IA ne dispose que de 1 gigawatt d'électricité, la limite de puissance est de 1 GW ; dans cette limite, le débit par watt est le revenu, car chaque Token a une valeur."
- "Choisir une mauvaise architecture simplement parce que les puces sont moins chères ne se traduira pas en bénéfices réels, vous devez vous assurer du revenu par watt. Plus vous en achetez, plus vous gagnez."
Vera Rubin et la transformation des infrastructures de NVIDIA
- "Vera Rubin n'est pas une puce, ni seulement un GPU, c'est un système complet construit de bout en bout."
- "NVIDIA était une entreprise de GPU, puis elle est devenue une entreprise de systèmes, et maintenant elle évolue encore pour devenir une entreprise d'infrastructures, aidant les clients à construire des usines d'IA."
- "Vera Rubin est le projet d'ingénierie le plus ambitieux de l'histoire de NVIDIA, tous les 40 000 ingénieurs de l'entreprise y ont participé, et la chaîne d'approvisionnement taïwanaise a également participé à la création de ce système."
- "Grace Blackwell est conçue pour traiter l'IA, en particulier l'inférence ; Vera Rubin est conçue pour exécuter des agents."
Le CPU Vera et les besoins en calcul des agents
- "Tous les CPU jusqu'à présent ont été conçus pour les humains, ce CPU est conçu pour les agents."
- "Les agents n'ont pas de patience. Leur monde ne fonctionne pas en secondes, mais en nanosecondes. Lorsqu'un agent utilise un outil, il veut une réponse aussi rapide que possible ; lorsqu'il accède à une base de données, il veut le résultat immédiatement."
- "Le CPU Vera est un CPU conçu pour les agents, il met l'accent sur les performances mono-thread, les instructions par cycle, la bande passante par cœur et la bande passante totale du système."
- "Ce marché sera certainement plus grand que le précédent, car le nombre d'agents dépassera de loin celui des humains, et les agents sont très impatients. Voici le NVIDIA Vera CPU."
La prochaine génération d'ordinateurs personnels
- "Le futur modèle de calcul des agents fonctionnera dans le cloud IA, au sein des entreprises, et aussi sur votre PC."
- "Le nouveau système d'exploitation sera l'ancien système d'exploitation plus un grand modèle de langage ; à bien des égards, le grand modèle de langage est la version moderne de DirectX, une extension intelligente de l'ordinateur."
- "Les applications seront remplacées par un environnement d'exécution d'agents, l'application moderne deviendra un agent."
- "NVIDIA et Microsoft réinventent le PC et lancent une nouvelle génération de machines Windows couvrant les ordinateurs de bureau, les portables et les stations de travail."
IA physique, conduite autonome et robotique
- "Les modèles de langage sont entraînés sur des données du point de vue humain, mais les robots doivent comprendre le monde depuis leur propre perspective. Le plus grand problème de l'IA physique, c'est les données."
- "Cosmos 3 est le modèle de base de pointe pour l'IA physique, il peut comprendre, raisonner, générer, simuler en boucle fermée, et même devenir la stratégie elle-même."
- "Avec l'IA, le calcul lui-même deviendra aussi des données ; on peut utiliser Cosmos 3 pour entraîner plus de modèles d'IA, et l'enrichir pour en faire son modèle propriétaire."
- "Que ce soit un agent cloud, un agent PC, un système de conduite autonome ou un robot humanoïde, le modèle de calcul sous-jacent est le même : modèle, cadre, outils/compétences et environnement d'exécution."
Les collations taïwanaises citées par Jensen Huang deviennent la chaîne d'approvisionnement de l'IA
Jensen Huang:
L'écosystème de Taïwan a atteint une échelle vraiment incroyable aujourd'hui. La plupart des gens, lorsqu'ils parlent d'écosystème, pensent d'abord à notre pile logicielle, à l'écosystème de développeurs au-dessus des systèmes de calcul NVIDIA. Mais l'écosystème de NVIDIA ne s'arrête pas là, il s'étend vers le haut jusqu'à la chaîne d'approvisionnement taïwanaise, là où tout a commencé ; et il s'étend vers le bas jusqu'au centre de données, pour finalement atteindre l'utilisateur final.
Aujourd'hui, nous parlerons de presque tous les maillons de cet écosystème. Il y a tellement de personnes à remercier. J'adore cet écosystème ici, il y a beaucoup d'entreprises, et de nombreux partenaires que je préfère. Taïwan possède un écosystème extrêmement riche, c'est le meilleur écosystème de chaîne d'approvisionnement au monde.
L'ère des agents IA arrive
Jensen Huang:
Lorsque je suis venu ici il y a deux ans, j'ai commencé à parler de la façon dont l'IA passait de l'IA générative à la prochaine vague, la prochaine IA est l'IA agentielle. Aujourd'hui, nous pouvons dire que l'IA agentielle est arrivée, l'IA utile est arrivée.
D'un point de vue industriel, cela signifie que la demande de Tokens devient extrêmement forte. Parce que si l'IA peut vraiment faire des choses, les gens voudront produire plus de cette capacité. Le Token est maintenant une unité rentable, une unité capable de générer des revenus. Puisqu'il peut générer de l'argent, les entreprises d'IA voudront construire plus de Tokens, en générer plus, construire plus d'usines d'IA, c'est aussi la raison de l'explosion de la demande de calcul à Taïwan.
C'est précisément la raison pour laquelle vous êtes si occupés et que vos activités sont si bonnes. En fait, cela semble aussi se refléter dans le cours de bourse de certaines de vos entreprises. Le modèle de calcul a changé, tout a changé.
Premier point clé : l'IA utile est arrivée, l'IA est maintenant un générateur de profits, et aussi un générateur de PIB. Derrière elle, il y a un tout nouveau modèle de calcul. Ce n'est pas seulement un grand modèle de langage, c'est un agent. Aujourd'hui, presque tout ce que nous faisons sera basé sur ce fondement.
Laissez-moi prendre un moment pour expliquer ce dont je parle. À l'intérieur, il y a un agent, une application agentielle. Autrefois, ce serait une application, du code, un système d'exploitation, c'est-à-dire le code de l'application exécuté sur le système d'exploitation. Aujourd'hui, c'est un agent, composé d'un ou plusieurs grands modèles de langage, placé dans un cadre d'agent. Ce cadre l'aidera à coordonner son travail, lui permettant d'accomplir réellement des tâches productives.
Lorsqu'une entrée entre dans le système, l'agent doit comprendre, observer, raisonner, agir et utiliser des outils. Les outils peuvent être un tableur, un navigateur web, un moteur de traitement de données, ou un moteur de base de données. Chaque fois qu'une information circule, qu'il s'agisse de traiter le contexte, de comprendre ce qui se passe, de raisonner sur la prochaine action, ou de former un plan exécutable, cela doit être coordonné par un logiciel.
Ainsi, la nature d'un agent est un tel système. Il traite la mémoire à court terme, c'est-à-dire la mémoire de travail, et aussi la mémoire à long terme, comme les humains. Le système de gestion de la mémoire devient donc extrêmement important. L'ensemble du système s'appelle un agent. Le grand modèle de langage est responsable de la réflexion, le cadre d'agent connecte tous les éléments, comme un système d'exploitation.
C'est le nouveau modèle de calcul, et c'est pourquoi les agents peuvent accomplir des tâches étonnantes. C'est une percée majeure : les grands modèles de langage peuvent déjà bien penser, raisonner, planifier et utiliser des outils ; en même temps, nous avons également des cadres d'agents capables de gérer la mémoire, de coordonner les processus et d'appeler des outils. Par conséquent, nous pouvons maintenant faire beaucoup de choses qui étaient auparavant impossibles.
Qu'est-ce que le Token d'une usine d'IA ?
Jensen Huang:
Token, DSX, GPU, CPU, Vera... Nous avons créé le prochain système, Vera Rubin. Vera Rubin n'est pas une puce, ni seulement un GPU. Il commence par le GPU, mais va bien au-delà. C'est l'ensemble du système de bout en bout qui est Vera Rubin.
Il contient le GPU, le NVLink 72 Vera Rubin, coordonné par le CPU Vera que je présenterai plus tard. Il comprend également le système de stockage révolutionnaire Vera, le CX9, notre pile logicielle DOCA, et le processeur de sécurité intégré. Toutes les données dans le système, qu'elles soient stockées statiquement, en transit ou en cours d'utilisation, seront chiffrées. L'ensemble du système est sécurisé, car les modèles d'IA sont extrêmement précieux. C'est pourquoi tout le système suit le calcul confidentiel.
Chacun de ces systèmes, pris individuellement, pourrait constituer à lui seul une révolution complète. Vera Rubin est le projet d'ingénierie le plus ambitieux de l'histoire de NVIDIA. Les 40 000 ingénieurs de l'entreprise ont participé au travail sur Vera Rubin, sans parler de vous tous ici présents qui avez également participé à la création de l'ensemble du système. Vera Rubin est vraiment un miracle, ce n'est pas seulement une puce, mais un système composé de nombreux composants.
Et ce n'est même pas tout. Il y a longtemps, NVIDIA était une entreprise de GPU ; au fil des années, nous avons progressivement évolué pour devenir une entreprise de systèmes. Ce que vous voyez maintenant est le système le plus complexe que nous ayons conçu à partir de zéro. Mais en fin de compte, nos clients et partenaires ne veulent pas acheter un ordinateur, ils veulent construire des usines d'IA.
C'est pourquoi NVIDIA entame à nouveau une transformation. Vous pouvez voir que beaucoup de nos technologies se sont étendues à l'échelle complète des infrastructures. Nos partenaires opèrent également à l'échelle des infrastructures : les centrales électriques, les systèmes de refroidissement, les fournisseurs de réseaux électriques, ainsi que de nombreuses entreprises industrielles, font maintenant partie de notre écosystème. En fin de compte, nous devons construire une pile technologique complète, tout comme nous avons construit le GPU, Grace Blackwell, NVLink 72 ; maintenant, nous allons construire un système en pile complète permettant aux clients de créer des infrastructures d'IA exceptionnelles.
Bien faire cela, aider les clients à construire et déployer des usines d'IA, devient extrêmement important. La raison est simple : le calcul, c'est des revenus, le calcul, c'est des profits. Sans revenus ni profits, c'est une perte.
Il faut comprendre une chose : lorsqu'une infrastructure d'IA est mise en ligne, elle peut être mise en ligne rapidement, ou prendre beaucoup de temps ; son débit peut être élevé, ou faible ; sa flexibilité et sa fiabilité peuvent être bonnes, ou mauvaises ; sa durée de vie utile effective peut être longue, ou courte. Parce que cela représente un investissement de 50, 60, voire 100 milliards de dollars, cette courbe est extrêmement importante.
C'est pourquoi NVIDIA est un excellent partenaire. Nous avons une capacité d'intégration complète, nous n'avons pas seulement fait une présentation, mais avons réellement créé toute l'infrastructure, connecté tous les éléments, et l'avons construite à grande échelle nous-mêmes, assurant que le système fonctionne bien. Par conséquent, notre premier temps de Token, notre premier temps d'inférence, notre temps de démarrage de l'entraînement, sont tous plus rapides.
Deuxièmement, notre débit par watt, notre nombre de Tokens par watt, sont de classe mondiale. La raison en est que nous intégrons tout, concevons tout à partir de zéro, simulons l'ensemble du système et adoptons une co-conception extrême. Comme l'armoire Vera Rubin présentée tout à l'heure, tout est conçu pour atteindre un débit incroyable.
Si votre centre de données, votre usine, dispose de 1 gigawatt d'électricité, elle n'en aura pas plus, c'est toute la puissance de génération que vous pouvez obtenir. Avec 1 GW d'électricité, le débit par watt est votre revenu, car chaque Token peut générer un profit, chaque Token est un revenu.
C'est l'avenir. Le calcul, c'est des revenus, les performances par watt sont vos revenus. Choisir une mauvaise architecture simplement parce que les puces sont moins chères ne se traduira pas en bénéfices réels, vous devez vous assurer du revenu par watt. Plus vous en achetez, plus vous gagnez.
Je suis devant vous aujourd'hui, et je peux vous le dire : Vera Rubin est en pleine production. L'échelle de la chaîne d'approvisionnement que nous avons construite pour Vera Rubin est le double de celle de Grace Blackwell. L'assemblage d'une armoire Grace Blackwell prenait deux heures, maintenant cela prend cinq minutes. Donc non seulement la capacité de production est plus élevée, mais le débit de production est beaucoup plus rapide, et nous avons besoin de tout cela pour répondre à la demande.
Cet écosystème est extraordinaire. Pour soutenir Grace Blackwell et préparer la montée en puissance de Vera Rubin, des millions de pieds carrés de capacité de production ont déjà été mis en ligne. Je tiens à vous remercier. Vera Rubin est en pleine production. Merci à tous.
Présentation du système Vera Rubin
Jensen Huang:
Vera Rubin n'est pas construit seulement pour l'IA. Vera Rubin n'est pas construit seulement pour exécuter l'IA, il est construit pour exécuter des agents. C'est un système agentiel. Imaginez la complexité. Et c'est précisément pour cette raison que l'agent est la dernière percée en informatique. Il a fallu tant d'années pour qu'il réalise enfin son potentiel et devienne utile. L'ordinateur capable de l'exécuter devrait donc être le plus avancé au monde.
C'est Vera Rubin. Jetons un coup d'œil. Apportez Vera Rubin, s'il vous plaît.
Voici Vera Rubin, Vera Rubin NVLink 72. C'est une partie du système de prochaine génération, lors du prochain GTC, j'en parlerai davantage ; aujourd'hui, nous avons encore beaucoup de choses à dire. Voici l'armoire du CPU Vera, 256 CPU, tous refroidis par liquide. Je présenterai Vera plus tard. Voici le système de traitement et de stockage Vera BlueField, aussi le système de sécurité. Et bien sûr, notre réseau Mellanox, le premier CPO au monde. Voilà Vera Rubin, une combinaison étonnante de technologies.
Lorsque nous avons créé Hopper, c'était pour le pré-entraînement. Le pré-entraînement était l'application la plus importante à l'époque, et la charge de travail la plus importante que nous devions affronter. Ensuite, lors de la création de Grace Blackwell, les gens disaient : "Jensen, NVIDIA est très bon en pré-entraînement, l'inférence est simple." Vous vous souvenez ? Beaucoup de gens disaient : "L'inférence est simple, nous pouvons aussi le faire."
Mais vous savez, l'inférence, c'est de l'argent. Les modèles sont très complexes, il est très difficile d'exceller simultanément en vitesse de réponse élevée, en interaction rapide et en débit élevé. C'est pourquoi nous avons créé NVLink 72.
Aujourd'hui, le coût du Token de NVIDIA est le plus bas au monde. Ce n'est pas 10 % de moins, mais plusieurs fois moins, voire un ordre de grandeur d'écart. Tout cela parce que nous avons fait une co-conception extrême, parce que nous comprenons le modèle et le mode de calcul de l'inférence, et avons créé NVLink 72.
Avec Vera Rubin, cela va au-delà de l'inférence. Maintenant, c'est l'inférence dans un système agentiel. Voilà Vera Rubin. Pas de câbles, pas de tuyaux, pas de ventilateurs. La dernière fois que je vous l'ai montré, il y avait des câbles partout.
CPU VERA : Le CPU des agents IA
Jensen Huang:
Le CPU Vera est conçu pour l'ère de l'IA. Jusqu'à présent, tous les CPU ont été conçus pour les humains. Nous étions les utilisateurs, les locataires. La façon dont les humains utilisent le CPU est de vivre dans un monde mesuré en secondes. Nous louons des CPU dans le cloud, plus il y a de cœurs, plus il y a de ressources à louer. Le cas d'utilisation et l'économie de l'ancien CPU sont complètement différents de ceux des agents.
Les agents n'ont pas de patience. Leur monde ne fonctionne pas en secondes, mais en nanosecondes. Lorsqu'un agent utilise un outil, il veut une réponse aussi rapide que possible ; lorsqu'il accède à une base de données, il veut le résultat immédiatement. À chaque instant d'attente, l'agent est empêché de passer à l'étape suivante, et à la suivante, et à la suivante. Par conséquent, nous devons rendre le CPU à latence la plus faible possible, aussi interactif que possible.
C'est pourquoi nous avons créé le CPU Vera pour l'ère de l'IA. Dans notre système, il a trois usages. Le premier, bien sûr, est la réflexion dans Vera Rubin. Dans l'armoire Vera Rubin, il y a déjà deux CPU. Vous savez, nous fabriquons et vendons des millions de Vera Rubin, et nous avons déjà vendu des millions de Grace Blackwell. NVIDIA est déjà l'un des plus grands fabricants de CPU au monde.
Les deux CPU dans l'armoire Vera Rubin, l'un d'eux est utilisé pour coordonner et gérer les GPU, gérer le cache KV, et traiter les différents logiciels exécutés dans l'armoire. Nous avons également Grace BlueField, pour la sécurité et l'isolation. La partie calcul de Vera est utilisée pour le cadre d'agent, responsable de la coordination des modèles d'IA, de l'utilisation des outils et de l'accès aux bases de données.
Le serveur de données ici est Vera BlueField, c'est le serveur et le système de stockage les plus rapides au monde. Il est crucial parce que les agents accèdent à la mémoire à une vitesse extrêmement élevée. Le serveur de stockage et le CPU se trouvent maintenant sur le chemin critique de la partie la plus coûteuse du centre de données.
Il y a une bonne raison pour laquelle c'est la partie la plus coûteuse. Le cœur économique d'une usine d'IA est le Token, et le Token est créé ici. Donc, bien sûr, vous voulez fabriquer et générer autant de Tokens que possible. La valeur économique est concentrée ici, et le CPU et le système de stockage ne doivent pas être un goulot d'étranglement.
Par conséquent, le CPU Vera met beaucoup de pression sur l'architecture du CPU, c'est pourquoi nous avons créé une toute nouvelle architecture à partir de zéro. C'est un CPU que le monde n'a jamais vu, nous l'appelons Vera. C'est un CPU conçu pour les agents. Tous les CPU jusqu'à présent ont été conçus pour les humains, ce CPU est conçu pour les agents.
Premièrement, le nombre d'instructions par cycle de Vera doit être extrêmement fort, car nous devons réduire la latence, réduire le temps de traitement. Nous voulons des performances mono-thread, pas seulement du débit. Les performances mono-thread doivent être de classe mondiale, les meilleures. Ainsi, l'IPC de Vera est extrêmement élevé, au plus haut niveau mondial : il peut capturer, décoder et exécuter 10 instructions par cycle d'horloge.
Deuxièmement, la bande passante nécessaire pour que le CPU entre et sorte des données doit être de classe mondiale. Cela inclut à la fois la bande passante par cœur et la bande passante totale. Comme je l'ai dit précédemment, un système agentiel est par nature découplé et distribué. Lorsque le calcul est découplé et déployé de manière distribuée, le réseau devient un problème. Par conséquent, nous devons déplacer les données aussi rapidement que possible entre les cœurs du CPU, entre le CPU et le stockage, entre le CPU et le GPU.
La bande passante autour du système et à l'intérieur des cœurs du CPU doit être de classe mondiale, car les cœurs du CPU communiquent entre eux à une bande passante très élevée. Ils ne sont pas loués un par un, mais travaillent tous ensemble. La bande passante en coupe transversale de Vera est incroyable. C'est le premier système à prendre en charge PCI Express Gen 6, et il est également le premier à être équipé de LPDDR5, avec une bande passante de 1,2 à 2 To par seconde, soit 2 à 3 fois celle des CPU les plus performants.
C'est un CPU conçu pour les agents. Ce marché sera certainement plus grand que le précédent, car le nombre d'agents dépassera de loin celui des humains, et les agents sont très impatients. Voici le CPU NVIDIA Vera.
Le modèle de calcul le plus important de la prochaine décennie
Jensen Huang:
C'est vraiment la page la plus importante. La conclusion centrale ici est : c'est le modèle d'application de la prochaine décennie, et c'est aussi le modèle de calcul de la prochaine décennie. L'agent, le cadre d'agent et le grand modèle de langage coordonné par le cadre, chaque entreprise l'exécutera. Chaque entreprise deviendra une entreprise d'agents, chaque entreprise fera fonctionner des agents en interne, chaque entreprise découvrira que les agents ont besoin de leur propre système d'exploitation.
Chaque entreprise nous demande : comment exécuter des agents de manière sécurisée ? Comment construire des agents pour notre charge de travail ? Nous avons donc la boîte à outils d'agents IA d'entreprise NVIDIA. En réalité, vous m'avez vu la construire étape par étape en public.
Presque tout ce que fait NVIDIA, vous le savez, si vous regardez mes discours au GTC d'il y a 5 ou 10 ans, vous verrez que j'ai parlé de ces choses depuis des années, parce que nous nous préparons depuis longtemps pour ce moment.
Pour qu'une entreprise construise des agents en tant que service, ou des agents pour les opérations, il faut quatre choses. Premièrement, un modèle. Bien sûr, plus le grand modèle de langage est intelligent, moins cher et rapide, mieux c'est. Deuxièmement, un cadre pour coordonner l'ensemble du système. Troisièmement, ces modèles veulent utiliser des outils, et ces outils ont des compétences. Je viens de montrer les bibliothèques CUDA-X, elles deviendront des outils puissants pour les agents. Quatrièmement, un environnement d'exécution, c'est-à-dire un système d'exploitation qui connecte tout.
Voici la boîte à outils d'agents NVIDIA. Elle comprend des modèles modifiables, c'est-à-dire les modèles open source de classe mondiale de NVIDIA. J'aimerais en montrer plus. Vous pouvez exécuter des agents de n'importe où, vous pouvez exécuter des agents puissants comme Claude Code, ou comme Codex. Vous pouvez les placer dans un cadre appelé Open Shell, pour une exécution hautement sécurisée à l'intérieur de l'entreprise.
Ce Shell protège l'agent, le maintenant toujours soumis à des politiques de sécurité. La confidentialité est protégée, les permissions et privilèges sont explicitement attribués, l'identité est protégée. Par conséquent, Open Shell est adopté à l'échelle mondiale. NVIDIA Open Shell est open source, vous verrez beaucoup d'entreprises l'adopter, dont Red Hat, Canonical et Microsoft. Il sera adopté partout.
C'est un environnement d'exécution important, et cet environnement d'exécution est entièrement optimisé pour la plateforme IA NVIDIA omniprésente. Vous pouvez exécuter Open Shell sur n'importe quel cloud, en local, ou même sur l'appareil. Maintenant, vous avez des outils et des bibliothèques que les agents peuvent utiliser, des modèles que vous pouvez modifier ou utiliser directement, et des cadres d'agents. Ces cadres d'agents peuvent maintenant s'exécuter localement ou ailleurs.
L'un de mes cas d'utilisation préférés d'agent est celui du concepteur de puces. C'est l'un des travaux les plus importants de NVIDIA. Par conséquent, nous allons bien sûr collaborer avec Cadence pour construire un super agent de conception de puces. Il est coordonné par Codex ou Claude Code, prenant comme entrée du RTL, des schémas d'architecture, des schémas électriques ou des spécifications, vous aidant à corriger ce qui doit l'être. Nous avons créé ensemble quelques super agents, et avons optimisé Nemotron pour l'environnement d'exécution NVIDIA.
NVIDIA s'engage à construire des modèles ouverts pour le monde, pour que vous, nous tous, puissions créer nos propres agents. Aujourd'hui, nous annonçons Nemotron 3 Ultra, notre prochaine génération de modèle ouvert, et il est très intelligent. Les modèles Nemotron ne vous donnent pas seulement le modèle, ils vous donnent également toutes les données que nous avons utilisées pour entraîner le modèle.
Parce que nous avons une alliance de partenaires puissants, vous pouvez voir tous les partenaires listés ici. Nous collaborons, contribuons mutuellement aux données. Grâce à ces excellentes relations de partenariat, du modèle aux scripts d'entraînement, en passant par les données, tout sera entièrement ouvert pour vous. C'est la meilleure forme de politique de système de modèles ouverts, et la meilleure politique de système de modèles ouverts au monde. L'objectif est simple : vous pouvez tout prendre, continuer à l'améliorer, le rendre meilleur, et en faire votre propre modèle.
Nemotron 3 Ultra est 5 fois plus rapide, 30 % moins cher, et entièrement ouvert. Nous y sommes très attachés. Voici Nemotron 3, nous développons également Nemotron 4. C'est cet ensemble complet de modèle, cadre, outils/compétences et environnement d'exécution qui permet à chaque entreprise dans le monde de créer ses propres agents, comme Cadence avec son super agent.
La nouvelle génération d'ordinateurs personnels de NVIDIA
Jensen Huang:
Microsoft et NVIDIA vont réinventer le PC. Cela deviendra le nouveau PC. Demain soir, demain soir ici, je serai avec Satya pour parler davantage du travail que nous avons fait ensemble au cours des trois dernières années. Microsoft et NVIDIA ont passé tellement de temps à repenser complètement le fonctionnement du PC, précisément pour se préparer à ce moment.
Comme je l'ai mentionné plus tôt, ce modèle de calcul des agents fonctionnera dans le cloud IA, au sein des entreprises, et aussi sur votre PC. Que se passe-t-il lorsque le PC possède un agent autonome ? Il vous aide, vous comprend. Vous pouvez lui parler, il peut vous voir. Vous pouvez lui faire lire des documents, faire des recherches pour vous. Il peut faire encore plus, je le montrerai plus tard.
Le nouveau système d'exploitation sera bien sûr l'ancien système d'exploitation plus un grand modèle de langage. À bien des égards, le grand modèle de langage est la version moderne de DirectX. Il a des entrées et des sorties, comprend les invites, comprend la vision par ordinateur, peut générer des vidéos, peut générer des sons. C'est une extension intelligente moderne du PC, de l'ordinateur.
Au-dessus, comme je l'ai dit, les applications seront remplacées par un environnement d'exécution d'agents, et l'application moderne est un agent.
Mesdames et Messieurs, l'ordinateur portable NVIDIA RTX Spark. Merci. J'ai trop de choses dans mes poches. Bon, voici la puce la plus incroyable au monde. C'est le N1X que nous avons créé en collaboration avec MediaTek. Je pense avoir vu Rick tout à l'heure. Voici le N1X, une belle puce. Pour être honnête, c'est une puce qui a nécessité 33 ans de développement.
La raison est que 100 % de la pile logicielle de NVIDIA peut fonctionner ici. Vous voulez faire de la biologie numérique, pas de problème ; du traitement sismique, pas de problème ; de l'astrophysique, pas de problème. Tout ce qui est lié à CUDA, toute la physique, toute la biologie, toute la génomique, toute l'IA, pas de problème. Tous les graphismes informatiques, pas de problème.
Chaque application que NVIDIA a jamais créée, et chaque application que Windows a jamais exécutée, Microsoft et NVIDIA les ont soigneusement optimisées pour que cet ordinateur puisse vraiment exécuter tout ce que le monde a jamais créé. En plus de cela, il peut maintenant exécuter des agents. C'est un ordinateur incroyable, j'en suis très fier.
Cet ordinateur peut posséder localement le modèle Nemotron 3 Ultra, ou le super modèle Nemotron 3 ; il peut également se connecter à Claude Code, Codex, ou d'autres modèles dans le cloud ; il peut également se connecter à des modèles sur le réseau. Il fonctionnera et accomplira des choses étonnantes. RTX Spark est une réinvention de l'ordinateur portable, mais en réalité, Microsoft et NVIDIA réinventent l'ensemble du PC.
Aujourd'hui, nous annonçons une toute nouvelle ligne de produits : trois machines Windows révolutionnaires, couvrant les ordinateurs de bureau, les portables et les stations de travail. Elles sont 100 % compatibles Windows, 100 % compatibles CUDA, 100 % équipées de cœurs Tensor IA NVIDIA. Tout ce que vous pouvez voir fonctionner sur les diverses plates-formes NVIDIA dans le monde, peut fonctionner ici.
Nous avons une feuille de route pour cela. C'est une toute nouvelle famille de produits. Pour chaque génération d'architecture, nous aurons des ordinateurs de bureau, des portables, des stations de travail ; la prochaine génération aura encore des ordinateurs de bureau, des portables, des stations de travail. Je suis très heureux et très honoré que 100 % de l'industrie mondiale du PC se joigne à nous pour réinventer le PC ensemble. C'est une nouvelle ligne de produits, et aussi un nouveau départ.
Cosmos 3 : Le modèle de base de l'IA physique
Jensen Huang:
Dans le cas des modèles de langage, l'anglais et les diverses langues sur lesquelles nous nous sommes entraînés sur Internet sont du point de vue humain. Ils sont écrits par nous, lus par nous. Cependant, si nous voulons créer des données pour un robot IA, elles doivent provenir de la perception et de la perspective du robot. La grande majorité des données vidéo dans le monde sont à la troisième personne, et non à la première personne.
Par conséquent, pour les systèmes agentiels, les systèmes robotiques et l'IA physique, les données sont le problème le plus difficile. Vous avez vu que nous progressons le long de cette échelle. Nous avons commencé par la télé-opération, essentiellement des démonstrations humaines. Ce n'est pas différent de la percée du feedback humain dans l'apprentissage par renforcement. Ensuite, nous utilisons la simulation, c'est là qu'Omniverse joue son rôle. C'est similaire à la récompense vérifiable dans l'apprentissage par renforcement.
Nous utilisons ces systèmes pour amorcer les modèles d'IA, amorcer les modèles d'IA physique. Finalement, nous pouvons apprendre depuis une perspective à la troisième personne, et la reprojeter vers une perspective à la première personne. Grâce à ce processus d'amorçage, nous avons finalement un modèle de base du monde, capable de comprendre le monde physique depuis n'importe quelle perspective que vous souhaitez. Troisième personne, première personne, de l'extérieur vers l'intérieur, de l'intérieur vers l'extérieur, tout est possible. C'est vraiment une percée majeure.
Aujourd'hui, nous annonçons Cosmos 3. Cosmos 3 est à la pointe de l'IA physique. Nous sommes à la pointe sur les modèles de langage, beaucoup de gens travaillent sur les modèles de langage. Mais sur l'IA physique, nous sommes absolument les plus forts au monde. Je suis incroyablement fier que l'équipe ait pu réaliser cela.
C'est votre modèle de base pour tous vos travaux. Que vous vouliez créer un robot, un robot d'usine, ou un robot travaillant dans une usine, dès qu'il s'agit du monde physique, vous avez maintenant un partenaire : Cosmos 3. Il peut comprendre et raisonner, générer, simuler en boucle fermée, et même devenir la stratégie elle-même. Il est en position de leader dans divers classements mondiaux. Je suis très fier de Cosmos. Aujourd'hui, nous annonçons Cosmos 3.
Autrefois, c'était les données plus le calcul qui donnaient l'IA. Maintenant que nous avons l'IA, le calcul deviendra aussi des données. Ainsi, en utilisant Cosmos 3, entraînez une grande quantité de modèles d'IA. Cosmos est un système de modèles ouverts très performant, exactement comme Nemotron. Nous ouvrons le modèle, ouvrons les données, et même les méthodes d'entraînement, afin que vous puissiez l'améliorer pour vous-même et faire de Cosmos votre modèle propriétaire.
Alpamayo 2 : L'inférence pour la conduite autonome
Jensen Huang:
Aujourd'hui, nous annonçons Alpamayo 2, un modèle ouvert pour les véhicules autonomes. Nous collaborons avec des entreprises automobiles du monde entier. Si vous regardez ces marques qui ont rejoint NVIDIA Hyperion, qui construisent des voitures NVIDIA Hyperion, elles représentent environ 80 % des voitures dans le monde. C'est-à-dire que ces fabricants couvrent environ 80 % des voitures mondiales.
À l'avenir, il y aura un grand nombre de systèmes NVIDIA Hyperion, ils pourront exécuter Alpamayo, et également tout autre stack technologique de conduite autonome. Nous nous connectons également aux services de mobilité. Environ 97 % des services de mobilité dans le monde se connectent à nous. Par conséquent, lorsque nous déployons Alpamayo sur l'environnement d'exécution Hyperion et le système d'exploitation Halos, nous pouvons nous connecter à ces services mondiaux.
Isaac GR00T : Le robot humanoïde
Jensen Huang:
NVIDIA Isaac GR00T est notre stack technologique pour les robots humanoïdes, comprenant le modèle, la génération de données, la simulation, l'environnement d'exécution et le système d'exploitation. Il représente la plateforme GR00T, c'est-à-dire la plateforme Isaac GR00T.
Vous pouvez voir que chacun de nos systèmes suit exactement le même modèle : que ce soit un système agentiel cloud, un système agentiel sur PC, un système robotique pour voiture autonome, ou un système robotique pour robot humanoïde, c'est le même modèle.
Bien sûr, dans chaque cas, nous construisons tout complètement. Nous faisons de l'intégration verticale, une intégration totale, adoptons la co-conception et la co-conception extrême, puis l'ouvrons pour que chacun puisse utiliser n'importe quelle partie selon ses besoins. Nous vous aiderons même à modifier ce que vous voulez utiliser.
Mais il manque encore une chose : les systèmes robotiques ont besoin d'une plateforme de référence. Ces systèmes robotiques sont trop complexes, avec de nombreux moteurs et capteurs, et aussi très fragiles. Cependant, nous avons besoin d'un moyen de fournir ces plates-formes de référence. Tout comme nous l'avons fait pour les PC, DGX, le cloud et les voitures autonomes, maintenant nous le faisons aussi pour les robots.
Aujourd'hui, nous annonçons NVIDIA Isaac GR00T, une plateforme de référence pour robots humanoïdes entièrement intégrée. Il a 25 degrés de liberté par main, 31 degrés de liberté pour le corps du robot, mesure 6 pieds de haut, pèse 150 livres. Comme moi, sauf que le premier chiffre est plus petit que le mien, le deuxième plus grand, et le reste est à peu près pareil.
Cette plateforme exécute le nouveau Thor, ainsi que notre stack logiciel complet, le stack de génération de données, le stack de simulation de données et l'environnement d'exécution. Tout est intégré dans une plateforme robotique, pour que tout le monde l'utilise. Nous la construisons pour l'enseignement supérieur et les chercheurs universitaires, car il est trop difficile pour eux de construire une telle plateforme par eux-mêmes.
Résumé et récapitulation
Jensen Huang:
Ces six derniers mois, l'industrie informatique a été complètement transformée. La raison du changement est que les agents ont finalement été réalisés, et ont convergé avec les derniers modèles de pointe, permettant à l'IA de faire maintenant un travail vraiment utile.
Ce modèle de calcul se répétera encore et encore : un agent composé d'un modèle et d'un cadre, utilisant des outils avec des compétences, et s'exécutant sur un certain environnement d'exécution. L'environnement d'exécution dépend s'il est dans le cloud, en local dans l'entreprise, sur un PC, ou dans un robot. Mais le modèle de calcul est exactement le même.
Vous utiliserez différents cadres selon vos préférences, vous utiliserez également différents modèles selon vos préférences. Vous les améliorerez pour vos usages propriétaires. Vous créerez des super agents, les louerez à d'autres, aidant les autres à accomplir leur travail. Cette plateforme agentielle, ce modèle agentiel, c'est exactement ce que la boîte à outils IA d'entreprise NVIDIA vise à soutenir. Pour vous, c'est une excellente façon de participer à l'IA ; pour nous, c'est aussi une énorme opportunité de croissance.
Vera Rubin est en pleine production. Grace Blackwell a été créée pour traiter l'IA, en particulier l'inférence ; Vera Rubin a été créée pour exécuter des agents. Il est en pleine production. C'est bien plus qu'un GPU, c'est un système complet de traitement d'agents découplé et distribué.
NVIDIA est vraiment devenue une entreprise d'infrastructures. Pas seulement une entreprise de GPU, pas seulement une entreprise de systèmes, mais une entreprise d'infrastructures. Notre objectif est de vous aider à créer le maximum de revenus, le maximum de profits, et de le faire aussi rapidement que possible.
Dans le monde des agents, cette nouvelle façon de calculer signifie que le CPU doit aussi être construit pour les agents, et non pour les humains. Le CPU construit pour les agents a ses besoins particuliers. Notre NVIDIA Vera est une révolution. Je suis heureux de voir sa montée en puissance et ses commandes, ce sera le lancement de produit le plus rapide et le plus réussi de l'histoire de NVIDIA.
NVIDIA et Microsoft ont créé une toute nouvelle ligne de produits PC. C'est un nouveau départ. Bien sûr, ce même modèle de traitement agentiel, ce modèle de calcul agentiel que j'ai décrit, fonctionnera également sur divers appareils. J'ai mentionné le PC, mais à l'avenir, il apparaîtra dans les robots, les satellites, les stations de base, les usines, le cloud, les environnements locaux, les appareils périphériques. Ce système d'IA agentiel, ce modèle de calcul agentiel, sera reproduit dans toutes sortes d'ordinateurs. Notre compréhension de l'ordinateur personnel est susceptible de changer.








