Discours de Jensen Huang à la GTC Taipei 2026 : L'ère des agents IA est arrivée, le calcul est un revenu

marsbitXuất bản vào 2026-06-03Cập nhật gần nhất vào 2026-06-03

Tóm tắt

Dans son discours au GTC Taipei 2026, Jensen Huang, PDG de NVIDIA, annonce l'avènement de l'ère des agents IA. Ces agents, combinant modèles de langage et cadres d'orchestration, exécutent désormais des tâches utiles, générant revenus et PIB. Le jeton (Token) devient l'unité de valeur et de profit, faisant des usines IA des centres de production critiques. NVIDIA présente Vera Rubin, un système complet conçu pour exécuter ces agents, et le Vera CPU, premier processeur spécifiquement optimisé pour la faible latence exigée par les agents. La société évolue d'un fabricant de GPU vers un fournisseur d'infrastructure IA complète. Le nouveau mode de calcul (modèle, cadre, outils, runtime) se déploiera partout : dans le cloud, en entreprise, et sur le nouveau PC co-développé avec Microsoft. NVIDIA annonce également Cosmos 3 pour l'IA physique, Alpamayo 2 pour la conduite autonome et Isaac GR00T, une plateforme de référence pour robots humanoïdes. Pour Huang, chaque entreprise deviendra une entreprise d'agents, et l'écosystème taïwanais est un partenaire clé de cette transformation.

Organisation et compilation : Deep TechFlow

Invite: Jensen Huang, PDG de NVIDIA

Source du podcast: Bonnie Blockchain

Titre original: Les 7 points clés du discours de Jensen Huang à la GTC Taipei 2026, le guide rapide des derniers développements de NVIDIA! 【Bonnie Blockchain】

Date de diffusion: 2 juin 2026

Résumé des points clés

Lors de son discours à la GTC Taipei 2026, Jensen Huang a centré la stratégie de la prochaine phase de NVIDIA sur un constat central : l'IA est passée de la génération de contenu à l'ère des agents capables de travailler, le Token n'est plus seulement un indicateur technique, mais une unité de production de revenus, de profits et de PIB. Autour de ce changement, NVIDIA lance Vera Rubin, le CPU Vera, une boîte à outils d'agents de niveau entreprise, une nouvelle génération de PC en collaboration avec Microsoft, ainsi que Cosmos 3, Alpamayo 2 et Isaac GR00T pour l'IA physique. Jensen Huang a souligné que le modèle de calcul de la prochaine décennie sera constitué de modèles, de cadres d'agents, d'outils et de compétences, et d'environnements d'exécution, et qu'il se diffusera du cloud, des entreprises et des PC locaux aux robots, usines, satellites et appareils périphériques. Pour la chaîne d'approvisionnement taïwanaise, cela signifie que les usines d'IA, l'efficacité énergétique, la vitesse de livraison des infrastructures et la capacité de synergie en pile complète deviendront les clés de la prochaine vague de croissance industrielle.

Extraits des points de vue marquants

L'arrivée de l'ère des agents IA

"L'IA utile est arrivée, l'IA est maintenant un générateur de profits, et aussi un générateur de PIB. Derrière elle, il n'y a pas seulement un grand modèle de langage, mais un tout nouveau modèle de calcul : l'agent."
"Un agent est constitué d'un grand modèle de langage et d'un cadre d'agent, le cadre fonctionne comme un système d'exploitation qui connecte la mémoire, les outils, le raisonnement, la planification et l'action."
"La percée des systèmes d'agents provient du fait que les grands modèles de langage peuvent maintenant penser, raisonner, planifier et utiliser des outils, et aussi du fait que les cadres d'agents peuvent gérer la mémoire, coordonner les flux de travail et dispatcher les outils."
"Chaque entreprise deviendra une entreprise d'agents, chaque entreprise fera fonctionner des agents en interne, et chaque entreprise aura besoin de son propre système d'exploitation pour agents."

Tokens, usines d'IA et économie des infrastructures

"Le Token est maintenant une unité de revenus rentable. Les entreprises d'IA qui veulent produire plus de Tokens construiront plus d'usines d'IA, c'est précisément la raison de l'explosion de la demande de calcul à Taïwan."
"Le calcul, c'est des revenus, le calcul, c'est des profits. Sans revenus ni profits, c'est une perte."
"Si une usine d'IA ne dispose que de 1 gigawatt d'électricité, la limite de puissance est de 1 GW ; dans cette limite, le débit par watt est le revenu, car chaque Token a une valeur."
"Choisir une mauvaise architecture simplement parce que les puces sont moins chères ne se traduira pas en bénéfices réels, vous devez vous assurer du revenu par watt. Plus vous en achetez, plus vous gagnez."

Vera Rubin et la transformation des infrastructures de NVIDIA

"Vera Rubin n'est pas une puce, ni seulement un GPU, c'est un système complet construit de bout en bout."
"NVIDIA était une entreprise de GPU, puis elle est devenue une entreprise de systèmes, et maintenant elle évolue encore pour devenir une entreprise d'infrastructures, aidant les clients à construire des usines d'IA."
"Vera Rubin est le projet d'ingénierie le plus ambitieux de l'histoire de NVIDIA, tous les 40 000 ingénieurs de l'entreprise y ont participé, et la chaîne d'approvisionnement taïwanaise a également participé à la création de ce système."
"Grace Blackwell est conçue pour traiter l'IA, en particulier l'inférence ; Vera Rubin est conçue pour exécuter des agents."

Le CPU Vera et les besoins en calcul des agents

"Tous les CPU jusqu'à présent ont été conçus pour les humains, ce CPU est conçu pour les agents."
"Les agents n'ont pas de patience. Leur monde ne fonctionne pas en secondes, mais en nanosecondes. Lorsqu'un agent utilise un outil, il veut une réponse aussi rapide que possible ; lorsqu'il accède à une base de données, il veut le résultat immédiatement."
"Le CPU Vera est un CPU conçu pour les agents, il met l'accent sur les performances mono-thread, les instructions par cycle, la bande passante par cœur et la bande passante totale du système."
"Ce marché sera certainement plus grand que le précédent, car le nombre d'agents dépassera de loin celui des humains, et les agents sont très impatients. Voici le NVIDIA Vera CPU."

La prochaine génération d'ordinateurs personnels

"Le futur modèle de calcul des agents fonctionnera dans le cloud IA, au sein des entreprises, et aussi sur votre PC."
"Le nouveau système d'exploitation sera l'ancien système d'exploitation plus un grand modèle de langage ; à bien des égards, le grand modèle de langage est la version moderne de DirectX, une extension intelligente de l'ordinateur."
"Les applications seront remplacées par un environnement d'exécution d'agents, l'application moderne deviendra un agent."
"NVIDIA et Microsoft réinventent le PC et lancent une nouvelle génération de machines Windows couvrant les ordinateurs de bureau, les portables et les stations de travail."

IA physique, conduite autonome et robotique

"Les modèles de langage sont entraînés sur des données du point de vue humain, mais les robots doivent comprendre le monde depuis leur propre perspective. Le plus grand problème de l'IA physique, c'est les données."
"Cosmos 3 est le modèle de base de pointe pour l'IA physique, il peut comprendre, raisonner, générer, simuler en boucle fermée, et même devenir la stratégie elle-même."
"Avec l'IA, le calcul lui-même deviendra aussi des données ; on peut utiliser Cosmos 3 pour entraîner plus de modèles d'IA, et l'enrichir pour en faire son modèle propriétaire."
"Que ce soit un agent cloud, un agent PC, un système de conduite autonome ou un robot humanoïde, le modèle de calcul sous-jacent est le même : modèle, cadre, outils/compétences et environnement d'exécution."

Les collations taïwanaises citées par Jensen Huang deviennent la chaîne d'approvisionnement de l'IA

Jensen Huang:

L'écosystème de Taïwan a atteint une échelle vraiment incroyable aujourd'hui. La plupart des gens, lorsqu'ils parlent d'écosystème, pensent d'abord à notre pile logicielle, à l'écosystème de développeurs au-dessus des systèmes de calcul NVIDIA. Mais l'écosystème de NVIDIA ne s'arrête pas là, il s'étend vers le haut jusqu'à la chaîne d'approvisionnement taïwanaise, là où tout a commencé ; et il s'étend vers le bas jusqu'au centre de données, pour finalement atteindre l'utilisateur final.

Aujourd'hui, nous parlerons de presque tous les maillons de cet écosystème. Il y a tellement de personnes à remercier. J'adore cet écosystème ici, il y a beaucoup d'entreprises, et de nombreux partenaires que je préfère. Taïwan possède un écosystème extrêmement riche, c'est le meilleur écosystème de chaîne d'approvisionnement au monde.

L'ère des agents IA arrive

Jensen Huang:

Lorsque je suis venu ici il y a deux ans, j'ai commencé à parler de la façon dont l'IA passait de l'IA générative à la prochaine vague, la prochaine IA est l'IA agentielle. Aujourd'hui, nous pouvons dire que l'IA agentielle est arrivée, l'IA utile est arrivée.

D'un point de vue industriel, cela signifie que la demande de Tokens devient extrêmement forte. Parce que si l'IA peut vraiment faire des choses, les gens voudront produire plus de cette capacité. Le Token est maintenant une unité rentable, une unité capable de générer des revenus. Puisqu'il peut générer de l'argent, les entreprises d'IA voudront construire plus de Tokens, en générer plus, construire plus d'usines d'IA, c'est aussi la raison de l'explosion de la demande de calcul à Taïwan.

C'est précisément la raison pour laquelle vous êtes si occupés et que vos activités sont si bonnes. En fait, cela semble aussi se refléter dans le cours de bourse de certaines de vos entreprises. Le modèle de calcul a changé, tout a changé.

Premier point clé : l'IA utile est arrivée, l'IA est maintenant un générateur de profits, et aussi un générateur de PIB. Derrière elle, il y a un tout nouveau modèle de calcul. Ce n'est pas seulement un grand modèle de langage, c'est un agent. Aujourd'hui, presque tout ce que nous faisons sera basé sur ce fondement.

Laissez-moi prendre un moment pour expliquer ce dont je parle. À l'intérieur, il y a un agent, une application agentielle. Autrefois, ce serait une application, du code, un système d'exploitation, c'est-à-dire le code de l'application exécuté sur le système d'exploitation. Aujourd'hui, c'est un agent, composé d'un ou plusieurs grands modèles de langage, placé dans un cadre d'agent. Ce cadre l'aidera à coordonner son travail, lui permettant d'accomplir réellement des tâches productives.

Lorsqu'une entrée entre dans le système, l'agent doit comprendre, observer, raisonner, agir et utiliser des outils. Les outils peuvent être un tableur, un navigateur web, un moteur de traitement de données, ou un moteur de base de données. Chaque fois qu'une information circule, qu'il s'agisse de traiter le contexte, de comprendre ce qui se passe, de raisonner sur la prochaine action, ou de former un plan exécutable, cela doit être coordonné par un logiciel.

Ainsi, la nature d'un agent est un tel système. Il traite la mémoire à court terme, c'est-à-dire la mémoire de travail, et aussi la mémoire à long terme, comme les humains. Le système de gestion de la mémoire devient donc extrêmement important. L'ensemble du système s'appelle un agent. Le grand modèle de langage est responsable de la réflexion, le cadre d'agent connecte tous les éléments, comme un système d'exploitation.

C'est le nouveau modèle de calcul, et c'est pourquoi les agents peuvent accomplir des tâches étonnantes. C'est une percée majeure : les grands modèles de langage peuvent déjà bien penser, raisonner, planifier et utiliser des outils ; en même temps, nous avons également des cadres d'agents capables de gérer la mémoire, de coordonner les processus et d'appeler des outils. Par conséquent, nous pouvons maintenant faire beaucoup de choses qui étaient auparavant impossibles.

Qu'est-ce que le Token d'une usine d'IA ?

Jensen Huang:

Token, DSX, GPU, CPU, Vera... Nous avons créé le prochain système, Vera Rubin. Vera Rubin n'est pas une puce, ni seulement un GPU. Il commence par le GPU, mais va bien au-delà. C'est l'ensemble du système de bout en bout qui est Vera Rubin.

Il contient le GPU, le NVLink 72 Vera Rubin, coordonné par le CPU Vera que je présenterai plus tard. Il comprend également le système de stockage révolutionnaire Vera, le CX9, notre pile logicielle DOCA, et le processeur de sécurité intégré. Toutes les données dans le système, qu'elles soient stockées statiquement, en transit ou en cours d'utilisation, seront chiffrées. L'ensemble du système est sécurisé, car les modèles d'IA sont extrêmement précieux. C'est pourquoi tout le système suit le calcul confidentiel.

Chacun de ces systèmes, pris individuellement, pourrait constituer à lui seul une révolution complète. Vera Rubin est le projet d'ingénierie le plus ambitieux de l'histoire de NVIDIA. Les 40 000 ingénieurs de l'entreprise ont participé au travail sur Vera Rubin, sans parler de vous tous ici présents qui avez également participé à la création de l'ensemble du système. Vera Rubin est vraiment un miracle, ce n'est pas seulement une puce, mais un système composé de nombreux composants.

Et ce n'est même pas tout. Il y a longtemps, NVIDIA était une entreprise de GPU ; au fil des années, nous avons progressivement évolué pour devenir une entreprise de systèmes. Ce que vous voyez maintenant est le système le plus complexe que nous ayons conçu à partir de zéro. Mais en fin de compte, nos clients et partenaires ne veulent pas acheter un ordinateur, ils veulent construire des usines d'IA.

C'est pourquoi NVIDIA entame à nouveau une transformation. Vous pouvez voir que beaucoup de nos technologies se sont étendues à l'échelle complète des infrastructures. Nos partenaires opèrent également à l'échelle des infrastructures : les centrales électriques, les systèmes de refroidissement, les fournisseurs de réseaux électriques, ainsi que de nombreuses entreprises industrielles, font maintenant partie de notre écosystème. En fin de compte, nous devons construire une pile technologique complète, tout comme nous avons construit le GPU, Grace Blackwell, NVLink 72 ; maintenant, nous allons construire un système en pile complète permettant aux clients de créer des infrastructures d'IA exceptionnelles.

Bien faire cela, aider les clients à construire et déployer des usines d'IA, devient extrêmement important. La raison est simple : le calcul, c'est des revenus, le calcul, c'est des profits. Sans revenus ni profits, c'est une perte.

Il faut comprendre une chose : lorsqu'une infrastructure d'IA est mise en ligne, elle peut être mise en ligne rapidement, ou prendre beaucoup de temps ; son débit peut être élevé, ou faible ; sa flexibilité et sa fiabilité peuvent être bonnes, ou mauvaises ; sa durée de vie utile effective peut être longue, ou courte. Parce que cela représente un investissement de 50, 60, voire 100 milliards de dollars, cette courbe est extrêmement importante.

C'est pourquoi NVIDIA est un excellent partenaire. Nous avons une capacité d'intégration complète, nous n'avons pas seulement fait une présentation, mais avons réellement créé toute l'infrastructure, connecté tous les éléments, et l'avons construite à grande échelle nous-mêmes, assurant que le système fonctionne bien. Par conséquent, notre premier temps de Token, notre premier temps d'inférence, notre temps de démarrage de l'entraînement, sont tous plus rapides.

Deuxièmement, notre débit par watt, notre nombre de Tokens par watt, sont de classe mondiale. La raison en est que nous intégrons tout, concevons tout à partir de zéro, simulons l'ensemble du système et adoptons une co-conception extrême. Comme l'armoire Vera Rubin présentée tout à l'heure, tout est conçu pour atteindre un débit incroyable.

Si votre centre de données, votre usine, dispose de 1 gigawatt d'électricité, elle n'en aura pas plus, c'est toute la puissance de génération que vous pouvez obtenir. Avec 1 GW d'électricité, le débit par watt est votre revenu, car chaque Token peut générer un profit, chaque Token est un revenu.

C'est l'avenir. Le calcul, c'est des revenus, les performances par watt sont vos revenus. Choisir une mauvaise architecture simplement parce que les puces sont moins chères ne se traduira pas en bénéfices réels, vous devez vous assurer du revenu par watt. Plus vous en achetez, plus vous gagnez.

Je suis devant vous aujourd'hui, et je peux vous le dire : Vera Rubin est en pleine production. L'échelle de la chaîne d'approvisionnement que nous avons construite pour Vera Rubin est le double de celle de Grace Blackwell. L'assemblage d'une armoire Grace Blackwell prenait deux heures, maintenant cela prend cinq minutes. Donc non seulement la capacité de production est plus élevée, mais le débit de production est beaucoup plus rapide, et nous avons besoin de tout cela pour répondre à la demande.

Cet écosystème est extraordinaire. Pour soutenir Grace Blackwell et préparer la montée en puissance de Vera Rubin, des millions de pieds carrés de capacité de production ont déjà été mis en ligne. Je tiens à vous remercier. Vera Rubin est en pleine production. Merci à tous.

Présentation du système Vera Rubin

Jensen Huang:

Vera Rubin n'est pas construit seulement pour l'IA. Vera Rubin n'est pas construit seulement pour exécuter l'IA, il est construit pour exécuter des agents. C'est un système agentiel. Imaginez la complexité. Et c'est précisément pour cette raison que l'agent est la dernière percée en informatique. Il a fallu tant d'années pour qu'il réalise enfin son potentiel et devienne utile. L'ordinateur capable de l'exécuter devrait donc être le plus avancé au monde.

C'est Vera Rubin. Jetons un coup d'œil. Apportez Vera Rubin, s'il vous plaît.

Voici Vera Rubin, Vera Rubin NVLink 72. C'est une partie du système de prochaine génération, lors du prochain GTC, j'en parlerai davantage ; aujourd'hui, nous avons encore beaucoup de choses à dire. Voici l'armoire du CPU Vera, 256 CPU, tous refroidis par liquide. Je présenterai Vera plus tard. Voici le système de traitement et de stockage Vera BlueField, aussi le système de sécurité. Et bien sûr, notre réseau Mellanox, le premier CPO au monde. Voilà Vera Rubin, une combinaison étonnante de technologies.

Lorsque nous avons créé Hopper, c'était pour le pré-entraînement. Le pré-entraînement était l'application la plus importante à l'époque, et la charge de travail la plus importante que nous devions affronter. Ensuite, lors de la création de Grace Blackwell, les gens disaient : "Jensen, NVIDIA est très bon en pré-entraînement, l'inférence est simple." Vous vous souvenez ? Beaucoup de gens disaient : "L'inférence est simple, nous pouvons aussi le faire."

Mais vous savez, l'inférence, c'est de l'argent. Les modèles sont très complexes, il est très difficile d'exceller simultanément en vitesse de réponse élevée, en interaction rapide et en débit élevé. C'est pourquoi nous avons créé NVLink 72.

Aujourd'hui, le coût du Token de NVIDIA est le plus bas au monde. Ce n'est pas 10 % de moins, mais plusieurs fois moins, voire un ordre de grandeur d'écart. Tout cela parce que nous avons fait une co-conception extrême, parce que nous comprenons le modèle et le mode de calcul de l'inférence, et avons créé NVLink 72.

Avec Vera Rubin, cela va au-delà de l'inférence. Maintenant, c'est l'inférence dans un système agentiel. Voilà Vera Rubin. Pas de câbles, pas de tuyaux, pas de ventilateurs. La dernière fois que je vous l'ai montré, il y avait des câbles partout.

CPU VERA : Le CPU des agents IA

Jensen Huang:

Le CPU Vera est conçu pour l'ère de l'IA. Jusqu'à présent, tous les CPU ont été conçus pour les humains. Nous étions les utilisateurs, les locataires. La façon dont les humains utilisent le CPU est de vivre dans un monde mesuré en secondes. Nous louons des CPU dans le cloud, plus il y a de cœurs, plus il y a de ressources à louer. Le cas d'utilisation et l'économie de l'ancien CPU sont complètement différents de ceux des agents.

Les agents n'ont pas de patience. Leur monde ne fonctionne pas en secondes, mais en nanosecondes. Lorsqu'un agent utilise un outil, il veut une réponse aussi rapide que possible ; lorsqu'il accède à une base de données, il veut le résultat immédiatement. À chaque instant d'attente, l'agent est empêché de passer à l'étape suivante, et à la suivante, et à la suivante. Par conséquent, nous devons rendre le CPU à latence la plus faible possible, aussi interactif que possible.

C'est pourquoi nous avons créé le CPU Vera pour l'ère de l'IA. Dans notre système, il a trois usages. Le premier, bien sûr, est la réflexion dans Vera Rubin. Dans l'armoire Vera Rubin, il y a déjà deux CPU. Vous savez, nous fabriquons et vendons des millions de Vera Rubin, et nous avons déjà vendu des millions de Grace Blackwell. NVIDIA est déjà l'un des plus grands fabricants de CPU au monde.

Les deux CPU dans l'armoire Vera Rubin, l'un d'eux est utilisé pour coordonner et gérer les GPU, gérer le cache KV, et traiter les différents logiciels exécutés dans l'armoire. Nous avons également Grace BlueField, pour la sécurité et l'isolation. La partie calcul de Vera est utilisée pour le cadre d'agent, responsable de la coordination des modèles d'IA, de l'utilisation des outils et de l'accès aux bases de données.

Le serveur de données ici est Vera BlueField, c'est le serveur et le système de stockage les plus rapides au monde. Il est crucial parce que les agents accèdent à la mémoire à une vitesse extrêmement élevée. Le serveur de stockage et le CPU se trouvent maintenant sur le chemin critique de la partie la plus coûteuse du centre de données.

Il y a une bonne raison pour laquelle c'est la partie la plus coûteuse. Le cœur économique d'une usine d'IA est le Token, et le Token est créé ici. Donc, bien sûr, vous voulez fabriquer et générer autant de Tokens que possible. La valeur économique est concentrée ici, et le CPU et le système de stockage ne doivent pas être un goulot d'étranglement.

Par conséquent, le CPU Vera met beaucoup de pression sur l'architecture du CPU, c'est pourquoi nous avons créé une toute nouvelle architecture à partir de zéro. C'est un CPU que le monde n'a jamais vu, nous l'appelons Vera. C'est un CPU conçu pour les agents. Tous les CPU jusqu'à présent ont été conçus pour les humains, ce CPU est conçu pour les agents.

Premièrement, le nombre d'instructions par cycle de Vera doit être extrêmement fort, car nous devons réduire la latence, réduire le temps de traitement. Nous voulons des performances mono-thread, pas seulement du débit. Les performances mono-thread doivent être de classe mondiale, les meilleures. Ainsi, l'IPC de Vera est extrêmement élevé, au plus haut niveau mondial : il peut capturer, décoder et exécuter 10 instructions par cycle d'horloge.

Deuxièmement, la bande passante nécessaire pour que le CPU entre et sorte des données doit être de classe mondiale. Cela inclut à la fois la bande passante par cœur et la bande passante totale. Comme je l'ai dit précédemment, un système agentiel est par nature découplé et distribué. Lorsque le calcul est découplé et déployé de manière distribuée, le réseau devient un problème. Par conséquent, nous devons déplacer les données aussi rapidement que possible entre les cœurs du CPU, entre le CPU et le stockage, entre le CPU et le GPU.

La bande passante autour du système et à l'intérieur des cœurs du CPU doit être de classe mondiale, car les cœurs du CPU communiquent entre eux à une bande passante très élevée. Ils ne sont pas loués un par un, mais travaillent tous ensemble. La bande passante en coupe transversale de Vera est incroyable. C'est le premier système à prendre en charge PCI Express Gen 6, et il est également le premier à être équipé de LPDDR5, avec une bande passante de 1,2 à 2 To par seconde, soit 2 à 3 fois celle des CPU les plus performants.

C'est un CPU conçu pour les agents. Ce marché sera certainement plus grand que le précédent, car le nombre d'agents dépassera de loin celui des humains, et les agents sont très impatients. Voici le CPU NVIDIA Vera.

Le modèle de calcul le plus important de la prochaine décennie

Jensen Huang:

C'est vraiment la page la plus importante. La conclusion centrale ici est : c'est le modèle d'application de la prochaine décennie, et c'est aussi le modèle de calcul de la prochaine décennie. L'agent, le cadre d'agent et le grand modèle de langage coordonné par le cadre, chaque entreprise l'exécutera. Chaque entreprise deviendra une entreprise d'agents, chaque entreprise fera fonctionner des agents en interne, chaque entreprise découvrira que les agents ont besoin de leur propre système d'exploitation.

Chaque entreprise nous demande : comment exécuter des agents de manière sécurisée ? Comment construire des agents pour notre charge de travail ? Nous avons donc la boîte à outils d'agents IA d'entreprise NVIDIA. En réalité, vous m'avez vu la construire étape par étape en public.

Presque tout ce que fait NVIDIA, vous le savez, si vous regardez mes discours au GTC d'il y a 5 ou 10 ans, vous verrez que j'ai parlé de ces choses depuis des années, parce que nous nous préparons depuis longtemps pour ce moment.

Pour qu'une entreprise construise des agents en tant que service, ou des agents pour les opérations, il faut quatre choses. Premièrement, un modèle. Bien sûr, plus le grand modèle de langage est intelligent, moins cher et rapide, mieux c'est. Deuxièmement, un cadre pour coordonner l'ensemble du système. Troisièmement, ces modèles veulent utiliser des outils, et ces outils ont des compétences. Je viens de montrer les bibliothèques CUDA-X, elles deviendront des outils puissants pour les agents. Quatrièmement, un environnement d'exécution, c'est-à-dire un système d'exploitation qui connecte tout.

Voici la boîte à outils d'agents NVIDIA. Elle comprend des modèles modifiables, c'est-à-dire les modèles open source de classe mondiale de NVIDIA. J'aimerais en montrer plus. Vous pouvez exécuter des agents de n'importe où, vous pouvez exécuter des agents puissants comme Claude Code, ou comme Codex. Vous pouvez les placer dans un cadre appelé Open Shell, pour une exécution hautement sécurisée à l'intérieur de l'entreprise.

Ce Shell protège l'agent, le maintenant toujours soumis à des politiques de sécurité. La confidentialité est protégée, les permissions et privilèges sont explicitement attribués, l'identité est protégée. Par conséquent, Open Shell est adopté à l'échelle mondiale. NVIDIA Open Shell est open source, vous verrez beaucoup d'entreprises l'adopter, dont Red Hat, Canonical et Microsoft. Il sera adopté partout.

C'est un environnement d'exécution important, et cet environnement d'exécution est entièrement optimisé pour la plateforme IA NVIDIA omniprésente. Vous pouvez exécuter Open Shell sur n'importe quel cloud, en local, ou même sur l'appareil. Maintenant, vous avez des outils et des bibliothèques que les agents peuvent utiliser, des modèles que vous pouvez modifier ou utiliser directement, et des cadres d'agents. Ces cadres d'agents peuvent maintenant s'exécuter localement ou ailleurs.

L'un de mes cas d'utilisation préférés d'agent est celui du concepteur de puces. C'est l'un des travaux les plus importants de NVIDIA. Par conséquent, nous allons bien sûr collaborer avec Cadence pour construire un super agent de conception de puces. Il est coordonné par Codex ou Claude Code, prenant comme entrée du RTL, des schémas d'architecture, des schémas électriques ou des spécifications, vous aidant à corriger ce qui doit l'être. Nous avons créé ensemble quelques super agents, et avons optimisé Nemotron pour l'environnement d'exécution NVIDIA.

NVIDIA s'engage à construire des modèles ouverts pour le monde, pour que vous, nous tous, puissions créer nos propres agents. Aujourd'hui, nous annonçons Nemotron 3 Ultra, notre prochaine génération de modèle ouvert, et il est très intelligent. Les modèles Nemotron ne vous donnent pas seulement le modèle, ils vous donnent également toutes les données que nous avons utilisées pour entraîner le modèle.

Parce que nous avons une alliance de partenaires puissants, vous pouvez voir tous les partenaires listés ici. Nous collaborons, contribuons mutuellement aux données. Grâce à ces excellentes relations de partenariat, du modèle aux scripts d'entraînement, en passant par les données, tout sera entièrement ouvert pour vous. C'est la meilleure forme de politique de système de modèles ouverts, et la meilleure politique de système de modèles ouverts au monde. L'objectif est simple : vous pouvez tout prendre, continuer à l'améliorer, le rendre meilleur, et en faire votre propre modèle.

Nemotron 3 Ultra est 5 fois plus rapide, 30 % moins cher, et entièrement ouvert. Nous y sommes très attachés. Voici Nemotron 3, nous développons également Nemotron 4. C'est cet ensemble complet de modèle, cadre, outils/compétences et environnement d'exécution qui permet à chaque entreprise dans le monde de créer ses propres agents, comme Cadence avec son super agent.

La nouvelle génération d'ordinateurs personnels de NVIDIA

Jensen Huang:

Microsoft et NVIDIA vont réinventer le PC. Cela deviendra le nouveau PC. Demain soir, demain soir ici, je serai avec Satya pour parler davantage du travail que nous avons fait ensemble au cours des trois dernières années. Microsoft et NVIDIA ont passé tellement de temps à repenser complètement le fonctionnement du PC, précisément pour se préparer à ce moment.

Comme je l'ai mentionné plus tôt, ce modèle de calcul des agents fonctionnera dans le cloud IA, au sein des entreprises, et aussi sur votre PC. Que se passe-t-il lorsque le PC possède un agent autonome ? Il vous aide, vous comprend. Vous pouvez lui parler, il peut vous voir. Vous pouvez lui faire lire des documents, faire des recherches pour vous. Il peut faire encore plus, je le montrerai plus tard.

Le nouveau système d'exploitation sera bien sûr l'ancien système d'exploitation plus un grand modèle de langage. À bien des égards, le grand modèle de langage est la version moderne de DirectX. Il a des entrées et des sorties, comprend les invites, comprend la vision par ordinateur, peut générer des vidéos, peut générer des sons. C'est une extension intelligente moderne du PC, de l'ordinateur.

Au-dessus, comme je l'ai dit, les applications seront remplacées par un environnement d'exécution d'agents, et l'application moderne est un agent.

Mesdames et Messieurs, l'ordinateur portable NVIDIA RTX Spark. Merci. J'ai trop de choses dans mes poches. Bon, voici la puce la plus incroyable au monde. C'est le N1X que nous avons créé en collaboration avec MediaTek. Je pense avoir vu Rick tout à l'heure. Voici le N1X, une belle puce. Pour être honnête, c'est une puce qui a nécessité 33 ans de développement.

La raison est que 100 % de la pile logicielle de NVIDIA peut fonctionner ici. Vous voulez faire de la biologie numérique, pas de problème ; du traitement sismique, pas de problème ; de l'astrophysique, pas de problème. Tout ce qui est lié à CUDA, toute la physique, toute la biologie, toute la génomique, toute l'IA, pas de problème. Tous les graphismes informatiques, pas de problème.

Chaque application que NVIDIA a jamais créée, et chaque application que Windows a jamais exécutée, Microsoft et NVIDIA les ont soigneusement optimisées pour que cet ordinateur puisse vraiment exécuter tout ce que le monde a jamais créé. En plus de cela, il peut maintenant exécuter des agents. C'est un ordinateur incroyable, j'en suis très fier.

Cet ordinateur peut posséder localement le modèle Nemotron 3 Ultra, ou le super modèle Nemotron 3 ; il peut également se connecter à Claude Code, Codex, ou d'autres modèles dans le cloud ; il peut également se connecter à des modèles sur le réseau. Il fonctionnera et accomplira des choses étonnantes. RTX Spark est une réinvention de l'ordinateur portable, mais en réalité, Microsoft et NVIDIA réinventent l'ensemble du PC.

Aujourd'hui, nous annonçons une toute nouvelle ligne de produits : trois machines Windows révolutionnaires, couvrant les ordinateurs de bureau, les portables et les stations de travail. Elles sont 100 % compatibles Windows, 100 % compatibles CUDA, 100 % équipées de cœurs Tensor IA NVIDIA. Tout ce que vous pouvez voir fonctionner sur les diverses plates-formes NVIDIA dans le monde, peut fonctionner ici.

Nous avons une feuille de route pour cela. C'est une toute nouvelle famille de produits. Pour chaque génération d'architecture, nous aurons des ordinateurs de bureau, des portables, des stations de travail ; la prochaine génération aura encore des ordinateurs de bureau, des portables, des stations de travail. Je suis très heureux et très honoré que 100 % de l'industrie mondiale du PC se joigne à nous pour réinventer le PC ensemble. C'est une nouvelle ligne de produits, et aussi un nouveau départ.

Cosmos 3 : Le modèle de base de l'IA physique

Jensen Huang:

Dans le cas des modèles de langage, l'anglais et les diverses langues sur lesquelles nous nous sommes entraînés sur Internet sont du point de vue humain. Ils sont écrits par nous, lus par nous. Cependant, si nous voulons créer des données pour un robot IA, elles doivent provenir de la perception et de la perspective du robot. La grande majorité des données vidéo dans le monde sont à la troisième personne, et non à la première personne.

Par conséquent, pour les systèmes agentiels, les systèmes robotiques et l'IA physique, les données sont le problème le plus difficile. Vous avez vu que nous progressons le long de cette échelle. Nous avons commencé par la télé-opération, essentiellement des démonstrations humaines. Ce n'est pas différent de la percée du feedback humain dans l'apprentissage par renforcement. Ensuite, nous utilisons la simulation, c'est là qu'Omniverse joue son rôle. C'est similaire à la récompense vérifiable dans l'apprentissage par renforcement.

Nous utilisons ces systèmes pour amorcer les modèles d'IA, amorcer les modèles d'IA physique. Finalement, nous pouvons apprendre depuis une perspective à la troisième personne, et la reprojeter vers une perspective à la première personne. Grâce à ce processus d'amorçage, nous avons finalement un modèle de base du monde, capable de comprendre le monde physique depuis n'importe quelle perspective que vous souhaitez. Troisième personne, première personne, de l'extérieur vers l'intérieur, de l'intérieur vers l'extérieur, tout est possible. C'est vraiment une percée majeure.

Aujourd'hui, nous annonçons Cosmos 3. Cosmos 3 est à la pointe de l'IA physique. Nous sommes à la pointe sur les modèles de langage, beaucoup de gens travaillent sur les modèles de langage. Mais sur l'IA physique, nous sommes absolument les plus forts au monde. Je suis incroyablement fier que l'équipe ait pu réaliser cela.

C'est votre modèle de base pour tous vos travaux. Que vous vouliez créer un robot, un robot d'usine, ou un robot travaillant dans une usine, dès qu'il s'agit du monde physique, vous avez maintenant un partenaire : Cosmos 3. Il peut comprendre et raisonner, générer, simuler en boucle fermée, et même devenir la stratégie elle-même. Il est en position de leader dans divers classements mondiaux. Je suis très fier de Cosmos. Aujourd'hui, nous annonçons Cosmos 3.

Autrefois, c'était les données plus le calcul qui donnaient l'IA. Maintenant que nous avons l'IA, le calcul deviendra aussi des données. Ainsi, en utilisant Cosmos 3, entraînez une grande quantité de modèles d'IA. Cosmos est un système de modèles ouverts très performant, exactement comme Nemotron. Nous ouvrons le modèle, ouvrons les données, et même les méthodes d'entraînement, afin que vous puissiez l'améliorer pour vous-même et faire de Cosmos votre modèle propriétaire.

Alpamayo 2 : L'inférence pour la conduite autonome

Jensen Huang:

Aujourd'hui, nous annonçons Alpamayo 2, un modèle ouvert pour les véhicules autonomes. Nous collaborons avec des entreprises automobiles du monde entier. Si vous regardez ces marques qui ont rejoint NVIDIA Hyperion, qui construisent des voitures NVIDIA Hyperion, elles représentent environ 80 % des voitures dans le monde. C'est-à-dire que ces fabricants couvrent environ 80 % des voitures mondiales.

À l'avenir, il y aura un grand nombre de systèmes NVIDIA Hyperion, ils pourront exécuter Alpamayo, et également tout autre stack technologique de conduite autonome. Nous nous connectons également aux services de mobilité. Environ 97 % des services de mobilité dans le monde se connectent à nous. Par conséquent, lorsque nous déployons Alpamayo sur l'environnement d'exécution Hyperion et le système d'exploitation Halos, nous pouvons nous connecter à ces services mondiaux.

Isaac GR00T : Le robot humanoïde

Jensen Huang:

NVIDIA Isaac GR00T est notre stack technologique pour les robots humanoïdes, comprenant le modèle, la génération de données, la simulation, l'environnement d'exécution et le système d'exploitation. Il représente la plateforme GR00T, c'est-à-dire la plateforme Isaac GR00T.

Vous pouvez voir que chacun de nos systèmes suit exactement le même modèle : que ce soit un système agentiel cloud, un système agentiel sur PC, un système robotique pour voiture autonome, ou un système robotique pour robot humanoïde, c'est le même modèle.

Bien sûr, dans chaque cas, nous construisons tout complètement. Nous faisons de l'intégration verticale, une intégration totale, adoptons la co-conception et la co-conception extrême, puis l'ouvrons pour que chacun puisse utiliser n'importe quelle partie selon ses besoins. Nous vous aiderons même à modifier ce que vous voulez utiliser.

Mais il manque encore une chose : les systèmes robotiques ont besoin d'une plateforme de référence. Ces systèmes robotiques sont trop complexes, avec de nombreux moteurs et capteurs, et aussi très fragiles. Cependant, nous avons besoin d'un moyen de fournir ces plates-formes de référence. Tout comme nous l'avons fait pour les PC, DGX, le cloud et les voitures autonomes, maintenant nous le faisons aussi pour les robots.

Aujourd'hui, nous annonçons NVIDIA Isaac GR00T, une plateforme de référence pour robots humanoïdes entièrement intégrée. Il a 25 degrés de liberté par main, 31 degrés de liberté pour le corps du robot, mesure 6 pieds de haut, pèse 150 livres. Comme moi, sauf que le premier chiffre est plus petit que le mien, le deuxième plus grand, et le reste est à peu près pareil.

Cette plateforme exécute le nouveau Thor, ainsi que notre stack logiciel complet, le stack de génération de données, le stack de simulation de données et l'environnement d'exécution. Tout est intégré dans une plateforme robotique, pour que tout le monde l'utilise. Nous la construisons pour l'enseignement supérieur et les chercheurs universitaires, car il est trop difficile pour eux de construire une telle plateforme par eux-mêmes.

Résumé et récapitulation

Jensen Huang:

Ces six derniers mois, l'industrie informatique a été complètement transformée. La raison du changement est que les agents ont finalement été réalisés, et ont convergé avec les derniers modèles de pointe, permettant à l'IA de faire maintenant un travail vraiment utile.

Ce modèle de calcul se répétera encore et encore : un agent composé d'un modèle et d'un cadre, utilisant des outils avec des compétences, et s'exécutant sur un certain environnement d'exécution. L'environnement d'exécution dépend s'il est dans le cloud, en local dans l'entreprise, sur un PC, ou dans un robot. Mais le modèle de calcul est exactement le même.

Vous utiliserez différents cadres selon vos préférences, vous utiliserez également différents modèles selon vos préférences. Vous les améliorerez pour vos usages propriétaires. Vous créerez des super agents, les louerez à d'autres, aidant les autres à accomplir leur travail. Cette plateforme agentielle, ce modèle agentiel, c'est exactement ce que la boîte à outils IA d'entreprise NVIDIA vise à soutenir. Pour vous, c'est une excellente façon de participer à l'IA ; pour nous, c'est aussi une énorme opportunité de croissance.

Vera Rubin est en pleine production. Grace Blackwell a été créée pour traiter l'IA, en particulier l'inférence ; Vera Rubin a été créée pour exécuter des agents. Il est en pleine production. C'est bien plus qu'un GPU, c'est un système complet de traitement d'agents découplé et distribué.

NVIDIA est vraiment devenue une entreprise d'infrastructures. Pas seulement une entreprise de GPU, pas seulement une entreprise de systèmes, mais une entreprise d'infrastructures. Notre objectif est de vous aider à créer le maximum de revenus, le maximum de profits, et de le faire aussi rapidement que possible.

Dans le monde des agents, cette nouvelle façon de calculer signifie que le CPU doit aussi être construit pour les agents, et non pour les humains. Le CPU construit pour les agents a ses besoins particuliers. Notre NVIDIA Vera est une révolution. Je suis heureux de voir sa montée en puissance et ses commandes, ce sera le lancement de produit le plus rapide et le plus réussi de l'histoire de NVIDIA.

NVIDIA et Microsoft ont créé une toute nouvelle ligne de produits PC. C'est un nouveau départ. Bien sûr, ce même modèle de traitement agentiel, ce modèle de calcul agentiel que j'ai décrit, fonctionnera également sur divers appareils. J'ai mentionné le PC, mais à l'avenir, il apparaîtra dans les robots, les satellites, les stations de base, les usines, le cloud, les environnements locaux, les appareils périphériques. Ce système d'IA agentiel, ce modèle de calcul agentiel, sera reproduit dans toutes sortes d'ordinateurs. Notre compréhension de l'ordinateur personnel est susceptible de changer.

Câu hỏi Liên quan

QQuel est le message central de la présentation de Jensen Huang au GTC Taipei 2026 concernant l'évolution de l'IA ?

ALe message central est que l'IA évolue de la simple génération de contenu vers l'ère des « agents IA » capables d'exécuter des tâches utiles. Le calcul lui-même devient une source de revenus et de profit, chaque « Token » (unité de traitement) généré représentant une unité de revenu.

QQu'est-ce que le système Vera Rubin et en quoi diffère-t-il des générations précédentes comme Grace Blackwell ?

AVera Rubin n'est pas seulement une puce ou un GPU, mais un système complet conçu de bout en bout pour exécuter des agents IA. Contrairement à Grace Blackwell qui était optimisé pour l'inférence IA classique, Vera Rubin est spécifiquement architecturé pour les systèmes d'agents, qui sont plus complexes et distribués.

QPourquoi le CPU Vera a-t-il été développé et quelles sont ses caractéristiques principales ?

ALe CPU Vera a été développé spécifiquement pour les agents IA, car ceux-ci exigent une latence extrêmement faible. Contrairement aux CPU traditionnels conçus pour les humains (tolérants aux délais en secondes), les agents opèrent à l'échelle nanoseconde. Ses caractéristiques clés sont des performances monocœur exceptionnelles, un nombre d'instructions par cycle (IPC) très élevé, et une bande passante par cœur et système massive.

QComment NVIDIA et Microsoft réinventent-ils l'ordinateur personnel (PC) selon le discours ?

ANVIDIA et Microsoft réinventent le PC en l'intégrant profondément au paradigme de l'agent IA. Le nouveau système d'exploitation combine l'OS traditionnel avec un grand modèle de langage (comme une version moderne de DirectX). Les applications seront remplacées par des « runtimes » d'agents. Ils lancent une nouvelle gamme de machines Windows (bureau, portable, station de travail) entièrement compatibles CUDA et dotées de cœurs Tensor dédiés à l'IA.

QQuel est le défi fondamental pour le développement de l'IA physique (robots, véhicules autonomes) et comment NVIDIA y répond-il avec Cosmos 3 ?

ALe défi fondamental est le manque de données d'entraînement depuis une perspective à la première personne (celle du robot). Cosmos 3 est le modèle de base d'IA physique de NVIDIA. Il peut comprendre, raisonner, générer, simuler en boucle fermée et même servir de stratégie pour les robots. C'est un modèle ouvert qui permet aux entreprises de l'affiner pour créer leurs propres modèles propriétaires pour la robotique et l'automatisation.

Nội dung Liên quan

43 phút của Trump: Cốt truyện người mạnh mất kiểm soát, chiến tranh truyền thông leo thang

Trong bài diễn văn kéo dài 43 phút sau hơn một tuần vắng bóng công chúng, Tổng thống Mỹ Donald Trump đã cố gắng thể hiện hình ảnh một nhà lãnh đạo mạnh mẽ và kiểm soát. Tuy nhiên, phần lớn thời gian được dành cho các chủ đề phụ như hồ phản chiếu trên National Mall, so sánh quy mô đám đông với Martin Luther King Jr., cùng những lời công kích nhắm vào phóng viên, đảng Dân chủ và các thành phố lớn. Ông còn ký sắc lệnh hành pháp hủy bỏ các biện pháp bảo vệ việc làm cho hàng nghìn công chức cấp cao liên bang, một động thái có thể gia tăng sự phụ thuộc vào lòng trung thành cá nhân hơn là năng lực chuyên môn trong chính phủ. Bài viết nêu bật trạng thái cá nhân đầy lo lắng và phòng thủ của Trump, thể hiện qua việc ông đột ngột kết thúc sự kiện và nhân viên nhanh chóng dọn dẹp hiện trường. Tác giả cũng phân tích cuộc tấn công của Trump vào nữ phóng viên CNN, Kaitlan Collins, coi đó là một phần của nỗ lực làm mất uy tín giới truyền thông. Bài báo cảnh báo về áp lực ngày càng lớn từ quyền lực chính trị và lợi ích thương mại lên các cơ quan báo chí chính thống, dẫn đến cuộc khủng hoảng về tính độc lập biên tập, như trường hợp Scott Pelley của CBS. Thông điệp chính kêu gọi công chúng ủng hộ các nhà báo và phương tiện truyền thông độc lập, những người được coi là lực lượng quan trọng duy trì sự thật khi các thể chế khác bị xâm phạm. Bài viết kết thúc với viễn cảnh lạc quan khi đề cập đến việc Hạ viện, với sự ủng hộ của một số thành viên đảng Cộng hòa, đã thông qua nghị quyết yêu cầu chấm dứt hành động quân sự ở Iran, cho thấy sự bất đồng ngày càng tăng ngay trong nội bộ đảng của Trump.

marsbit30 phút trước

43 phút của Trump: Cốt truyện người mạnh mất kiểm soát, chiến tranh truyền thông leo thang

marsbit30 phút trước

Kalshi, MTS và tham vọng của a16z

Trí tuệ thị trường dự đoán và tham vọng "Truyền thông Mới" của a16z Bài viết phân tích sự trỗi dậy của thị trường dự đoán (prediction markets), đặc biệt là công ty Kalshi được định giá 220 tỷ USD, dưới góc nhìn chiến lược đầu tư và truyền thông của quỹ mạo hiểm a16z. Tác giả điểm lại lịch sử tư tưởng của thị trường dự đoán, từ học thuyết của Hayek về việc thị trường tổng hợp tri thức phân tán, đến cơ chế khuyến khích của Robin Hanson (LMSR) và ý tưởng chính phủ dựa trên dự đoán (Futarchy). Trọng tâm bài viết nằm ở việc a16z, sau khi đầu tư vào Kalshi, đã định vị lại giá trị cốt lõi của thị trường dự đoán không chỉ là sòng bạc hay sàn giao dịch, mà là một phương tiện truyền thông mới mang lại "cảm giác hiện diện" (presence). Trong một thế giới ngày càng bị che khuất và bất lực, việc dùng tiền thật để đặt cược vào các sự kiện toàn cầu giúp cá nhân tái khẳng định vai trò "người quan sát tối thượng", can thiệp và diễn giải thực tại. Kalshi, theo logic này, sẽ trở thành nơi định đoạt tính xác thực và tầm quan trọng của sự kiện. Bài viết liên kết điều này với tầm nhìn "Truyền thông Mới" của a16z – một hệ thống truyền thông toàn diện từ định hình luận điệu, tài trợ, phát hành sản phẩm đến thu hút khách hàng với tốc độ và cường độ chưa từng có, nhằm "tiếp quản dòng thời gian". Ví dụ điển hình là MTS (Monitoring The Situation), một hãng truyền thông chuyên phát sóng tin tức 24/7 trên Twitter. Kết luận cho rằng sức hút thực sự của Kalshi và lý do định giá khổng lồ của nó nằm ở "trường lực bẻ cong hiện thực" – khả năng tạo ra một thực tại thay thế có sức thuyết phục cao nhờ vào khối lượng giao dịch bằng tiền thật, từ đó trở thành một mảnh ghép quyền lực trong đế chế truyền thông mới của a16z.

marsbit2 giờ trước

marsbit2 giờ trước

Bất Ngờ: Cựu Nhân Sự Trụ Cột Trong Dự Án Chip Của OpenAI Gia Nhập Anthropic

Chuyên gia chip "nhân viên số 002" của OpenAI, Clive Chan, vừa thông báo rời OpenAI để gia nhập Anthropic. Anh là một trong những thành viên sớm nhất của đội ngũ phát triển chip tự thiết kế của OpenAI, tham gia từ giai đoạn hình thành đến nay. Dù đánh giá cao đội ngũ chip tại OpenAI, Clive Chan chia sẻ anh luôn có mong muốn "chinh phục một ngọn núi mới từ chân núi", đó là lý do anh chuyển sang Anthropic. Tại Anthropic, anh ấn tượng với năng lực, giá trị cốt lõi và tham vọng của đội ngũ, đồng thời trải nghiệm cường độ làm việc rất cao. Khi được hỏi về tiến độ dự án chip của OpenAI, Clive Chan đề cập đến thông tin hợp tác công khai giữa OpenAI và Broadcom, với kế hoạch triển khai bắt đầu từ nửa cuối năm 2026. Clive Chan có kinh nghiệm làm việc tại nhiều công ty công nghệ hàng đầu như Tesla, Google, SpaceX trước khi gia nhập OpenAI vào đầu năm 2024. Việc chuyển đổi của anh là một ví dụ nữa cho thấy dòng chảy nhân tài đáng chú ý giữa OpenAI và Anthropic, sau sự kiện nhà nghiên cứu nổi tiếng Andrej Karpathy chuyển sang Anthropic hồi tháng 5. Động thái này càng thu hút sự chú ý khi Anthropic vừa hoàn thành vòng gọi vốn với định giá gần 1.000 tỷ USD.

marsbit2 giờ trước

Bất Ngờ: Cựu Nhân Sự Trụ Cột Trong Dự Án Chip Của OpenAI Gia Nhập Anthropic

marsbit2 giờ trước

a16z chuyển hướng toàn cầu hóa: VC đang trở thành "động lực thúc đẩy" của liên minh công nghệ Mỹ

Biên tập: Thông báo của Ben Horowitz cho thấy một bước chuyển quan trọng trong chiến lược toàn cầu hóa của a16z: họ không chỉ tìm kiếm dự án ở nước ngoài hay mở rộng đầu tư quốc tế, mà còn đặt mình vào khuôn khổ cạnh tranh công nghệ và hợp tác đồng minh rộng lớn hơn. Trong bối cảnh AI, robot, công nghệ quốc phòng, an ninh mạng và tái cấu trúc chuỗi cung ứng trở thành trọng tâm cạnh tranh quốc gia, con đường quốc tế hóa của startup trở nên phức tạp hơn. A16z đang phản ứng với sự thay đổi này thông qua việc thành lập văn phòng Tokyo, bổ nhiệm Anne Neuberger phụ trách các vấn đề toàn cầu, và nâng cấp nhóm quan hệ nhà đầu tư thành nhóm đối tác toàn cầu. Tín hiệu quan trọng nhất là a16z gắn kết mạng lưới toàn cầu của mình với năng lực lãnh đạo công nghệ của "Mỹ và các đồng minh". Đối với a16z, mạng lưới đầu tư mạo hiểm trong tương lai không chỉ giúp nhà sáng lập gọi vốn, tuyển dụng, bán hàng mà còn hỗ trợ họ tiếp cận thị trường trọng điểm, kết nối với chính phủ và các tổ chức chiến lược, cũng như hiểu rõ môi trường chính sách và quy định của các quốc gia khác nhau. Điều này có nghĩa vai trò của các tổ chức đầu tư mạo hiểm hàng đầu đang được định nghĩa lại. Họ không còn chỉ là trung gian vốn, mà là người tổ chức kết nối công ty khởi nghiệp, năng lực quốc gia, nguồn lực ngành, hệ thống đồng minh và vốn toàn cầu. Chiến lược toàn cầu hóa lần này của a16z có thể được xem như một sự chủ động định vị của vốn Silicon Valley trong cuộc cạnh tranh công nghệ toàn cầu mới.

marsbit2 giờ trước

a16z chuyển hướng toàn cầu hóa: VC đang trở thành "động lực thúc đẩy" của liên minh công nghệ Mỹ

marsbit2 giờ trước

Kalshi, MTS và Tham vọng của a16z

Bài viết phân tích tầm quan trọng của thị trường dự đoán (prediction markets), tập trung vào Kalshi, và tầm nhìn của quỹ đầu tư mạo hiểm a16z trong việc xây dựng một đế chế truyền thông mới. Tác giả điểm qua lịch sử tư tưởng đằng sau thị trường dự đoán, từ lý thuyết của Hayek về việc thị trường tổng hợp tri thức phân tán, đến cơ chế khuyến khích của Robin Hanson (LMSR) và ý tưởng "Futarchy". Trọng tâm bài viết là việc a16z đầu tư mạnh vào Kalshi (định giá 220 tỷ USD) và cách họ diễn giải giá trị cốt lõi của nó: mang lại "cảm giác hiện diện" (presence). Trong một thế giới mà con người ngày càng thụ động và xa cách với thực tại, thị trường dự đoán cho phép họ tham gia tích cực bằng cách dùng tiền thật để đặt cược vào các sự kiện, từ đó cảm thấy mình là người quan sát và dự báo lịch sử. a16z coi đây là mảnh ghép quan trọng cho tham vọng "truyền thông mới" của họ - một hệ thống toàn diện từ định hình narrative, tài trợ sản phẩm, đến tiếp cận khách hàng với tốc độ cực cao, nhằm "tiếp quản dòng thời gian". Công ty truyền thông MTS (Monitoring The Situation) là một ví dụ điển hình cho triết lý này. Bài viết kết luận rằng sức mạnh thực sự của Kalshi và thị trường dự đoán nằm ở "trường lực bẻ cong hiện thực" - khả năng định nghĩa tính xác thực và tầm quan trọng của sự kiện thông qua khối lượng giao dịch bằng tiền thật, từ đó giành được quyền giải thích tối cao về tương lai, một thứ quyền lực hiếm khi nằm trong tay một công ty tư nhân.

链捕手2 giờ trước

Giao dịch

Giao ngay

Hợp đồng Tương lai

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

Để giúp bạn nắm bắt bản chất của Conflux, HTX Learn đã ra mắt chiến dịch Tìm hiểu & Kiếm tiền này.

Tổng lượt xem 882Xuất bản vào 2024.12.23Cập nhật vào 2024.12.23

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Agent S: Tương Lai của Tương Tác Tự Động trong Web3 Giới thiệu Trong bối cảnh không ngừng phát triển của Web3 và tiền điện tử, các đổi mới đang liên tục định nghĩa lại cách mà cá nhân tương tác với các nền tảng kỹ thuật số. Một dự án tiên phong như vậy, Agent S, hứa hẹn sẽ cách mạng hóa tương tác giữa con người và máy tính thông qua khung tác nhân mở của nó. Bằng cách mở đường cho các tương tác tự động, Agent S nhằm đơn giản hóa các nhiệm vụ phức tạp, cung cấp các ứng dụng chuyển đổi trong trí tuệ nhân tạo (AI). Cuộc khám phá chi tiết này sẽ đi sâu vào những phức tạp của dự án, các tính năng độc đáo của nó và những tác động đối với lĩnh vực tiền điện tử. Agent S là gì? Agent S đứng vững như một khung tác nhân mở đột phá, được thiết kế đặc biệt để giải quyết ba thách thức cơ bản trong việc tự động hóa các nhiệm vụ máy tính: Thu thập Kiến thức Cụ thể theo Miền: Khung này học một cách thông minh từ nhiều nguồn kiến thức bên ngoài và kinh nghiệm nội bộ. Cách tiếp cận kép này giúp nó xây dựng một kho lưu trữ phong phú về kiến thức cụ thể theo miền, nâng cao hiệu suất của nó trong việc thực hiện nhiệm vụ. Lập Kế Hoạch Qua Các Tầm Nhìn Nhiệm Vụ Dài Hạn: Agent S sử dụng lập kế hoạch phân cấp tăng cường kinh nghiệm, một cách tiếp cận chiến lược giúp phân chia và thực hiện các nhiệm vụ phức tạp một cách hiệu quả. Tính năng này nâng cao đáng kể khả năng quản lý nhiều nhiệm vụ con một cách hiệu quả và hiệu suất. Xử Lý Các Giao Diện Động, Không Đều: Dự án giới thiệu Giao Diện Tác Nhân-Máy Tính (ACI), một giải pháp đổi mới giúp nâng cao tương tác giữa các tác nhân và người dùng. Sử dụng các Mô Hình Ngôn Ngữ Lớn Đa Phương Thức (MLLMs), Agent S có thể điều hướng và thao tác các giao diện người dùng đồ họa đa dạng một cách liền mạch. Thông qua những tính năng tiên phong này, Agent S cung cấp một khung vững chắc giải quyết các phức tạp liên quan đến việc tự động hóa tương tác giữa con người với máy móc, mở ra nhiều ứng dụng trong AI và hơn thế nữa. Ai là Người Tạo ra Agent S? Mặc dù khái niệm về Agent S là hoàn toàn đổi mới, thông tin cụ thể về người sáng lập vẫn còn mơ hồ. Người sáng lập hiện vẫn chưa được biết đến, điều này làm nổi bật giai đoạn sơ khai của dự án hoặc sự lựa chọn chiến lược để giữ kín các thành viên sáng lập. Bất chấp sự ẩn danh, sự chú ý vẫn tập trung vào khả năng và tiềm năng của khung này. Ai là Các Nhà Đầu Tư của Agent S? Vì Agent S còn tương đối mới trong hệ sinh thái mã hóa, thông tin chi tiết về các nhà đầu tư và những người tài trợ tài chính của nó không được ghi chép rõ ràng. Sự thiếu vắng thông tin công khai về các nền tảng đầu tư hoặc tổ chức hỗ trợ dự án dấy lên câu hỏi về cấu trúc tài trợ và lộ trình phát triển của nó. Hiểu biết về sự hỗ trợ là rất quan trọng để đánh giá tính bền vững và tác động tiềm năng của dự án. Agent S Hoạt Động Như Thế Nào? Tại cốt lõi của Agent S là công nghệ tiên tiến cho phép nó hoạt động hiệu quả trong nhiều bối cảnh khác nhau. Mô hình hoạt động của nó được xây dựng xung quanh một số tính năng chính: Tương Tác Giống Như Con Người: Khung này cung cấp lập kế hoạch AI tiên tiến, cố gắng làm cho các tương tác với máy tính trở nên trực quan hơn. Bằng cách bắt chước hành vi của con người trong việc thực hiện nhiệm vụ, nó hứa hẹn nâng cao trải nghiệm người dùng. Ký Ức Tường Thuật: Được sử dụng để tận dụng các trải nghiệm cấp cao, Agent S sử dụng ký ức tường thuật để theo dõi lịch sử nhiệm vụ, từ đó nâng cao quy trình ra quyết định của nó. Ký Ức Tình Huống: Tính năng này cung cấp cho người dùng hướng dẫn từng bước, cho phép khung này cung cấp hỗ trợ theo ngữ cảnh khi các nhiệm vụ diễn ra. Hỗ Trợ OpenACI: Với khả năng chạy cục bộ, Agent S cho phép người dùng duy trì quyền kiểm soát đối với các tương tác và quy trình làm việc của họ, phù hợp với tinh thần phi tập trung của Web3. Tích Hợp Dễ Dàng với Các API Bên Ngoài: Tính linh hoạt và khả năng tương thích với nhiều nền tảng AI khác nhau đảm bảo rằng Agent S có thể hòa nhập liền mạch vào các hệ sinh thái công nghệ hiện có, làm cho nó trở thành lựa chọn hấp dẫn cho các nhà phát triển và tổ chức. Những chức năng này cùng nhau góp phần vào vị trí độc đáo của Agent S trong không gian tiền điện tử, khi nó tự động hóa các nhiệm vụ phức tạp, nhiều bước với sự can thiệp tối thiểu của con người. Khi dự án phát triển, các ứng dụng tiềm năng của nó trong Web3 có thể định nghĩa lại cách mà các tương tác kỹ thuật số diễn ra. Thời Gian Phát Triển của Agent S Sự phát triển và các cột mốc của Agent S có thể được tóm tắt trong một dòng thời gian nêu bật các sự kiện quan trọng của nó: 27 tháng 9, 2024: Khái niệm về Agent S được ra mắt trong một bài nghiên cứu toàn diện mang tên “Một Khung Tác Nhân Mở Sử Dụng Máy Tính Như Một Con Người,” trình bày nền tảng cho dự án. 10 tháng 10, 2024: Bài nghiên cứu được công bố công khai trên arXiv, cung cấp một cái nhìn sâu sắc về khung và đánh giá hiệu suất của nó dựa trên tiêu chuẩn OSWorld. 12 tháng 10, 2024: Một video trình bày được phát hành, cung cấp cái nhìn trực quan về khả năng và tính năng của Agent S, thu hút thêm sự quan tâm từ người dùng và nhà đầu tư tiềm năng. Những dấu mốc trong dòng thời gian không chỉ minh họa sự tiến bộ của Agent S mà còn chỉ ra cam kết của nó đối với sự minh bạch và sự tham gia của cộng đồng. Những Điểm Chính Về Agent S Khi khung Agent S tiếp tục phát triển, một số thuộc tính chính nổi bật, nhấn mạnh tính đổi mới và tiềm năng của nó: Khung Đổi Mới: Được thiết kế để cung cấp cách sử dụng máy tính trực quan giống như tương tác của con người, Agent S mang đến một cách tiếp cận mới cho việc tự động hóa nhiệm vụ. Tương Tác Tự Động: Khả năng tương tác tự động với máy tính thông qua GUI đánh dấu một bước tiến tới các giải pháp tính toán thông minh và hiệu quả hơn. Tự Động Hóa Nhiệm Vụ Phức Tạp: Với phương pháp mạnh mẽ của nó, nó có thể tự động hóa các nhiệm vụ phức tạp, nhiều bước, làm cho các quy trình nhanh hơn và ít sai sót hơn. Cải Tiến Liên Tục: Các cơ chế học tập cho phép Agent S cải thiện từ các trải nghiệm trước đó, liên tục nâng cao hiệu suất và hiệu quả của nó. Tính Linh Hoạt: Khả năng thích ứng của nó trên các môi trường hoạt động khác nhau như OSWorld và WindowsAgentArena đảm bảo rằng nó có thể phục vụ một loạt các ứng dụng rộng rãi. Khi Agent S định vị mình trong bối cảnh Web3 và tiền điện tử, tiềm năng của nó để nâng cao khả năng tương tác và tự động hóa quy trình đánh dấu một bước tiến quan trọng trong công nghệ AI. Thông qua khung đổi mới của mình, Agent S minh họa cho tương lai của các tương tác kỹ thuật số, hứa hẹn một trải nghiệm liền mạch và hiệu quả hơn cho người dùng trên nhiều ngành công nghiệp khác nhau. Kết luận Agent S đại diện cho một bước nhảy vọt táo bạo trong sự kết hợp giữa AI và Web3, với khả năng định nghĩa lại cách chúng ta tương tác với công nghệ. Mặc dù vẫn còn ở giai đoạn đầu, những khả năng cho ứng dụng của nó là rộng lớn và hấp dẫn. Thông qua khung toàn diện của mình giải quyết các thách thức quan trọng, Agent S nhằm đưa các tương tác tự động lên hàng đầu trong trải nghiệm kỹ thuật số. Khi chúng ta tiến sâu hơn vào các lĩnh vực tiền điện tử và phi tập trung, các dự án như Agent S chắc chắn sẽ đóng một vai trò quan trọng trong việc định hình tương lai của công nghệ và sự hợp tác giữa con người với máy tính.

Tổng lượt xem 851Xuất bản vào 2025.01.14Cập nhật vào 2025.01.14

Làm thế nào để Mua S

Chào mừng bạn đến với HTX.com! Chúng tôi đã làm cho mua Sonic (S) trở nên đơn giản và thuận tiện. Làm theo hướng dẫn từng bước của chúng tôi để bắt đầu hành trình tiền kỹ thuật số của bạn.Bước 1: Tạo Tài khoản HTX của BạnSử dụng email hoặc số điện thoại của bạn để đăng ký tài khoản miễn phí trên HTX. Trải nghiệm hành trình đăng ký không rắc rối và mở khóa tất cả tính năng. Nhận Tài khoản của tôiBước 2: Truy cập Mua Crypto và Chọn Phương thức Thanh toán của BạnThẻ Tín dụng/Ghi nợ: Sử dụng Visa hoặc Mastercard của bạn để mua Sonic (S) ngay lập tức.Số dư: Sử dụng tiền từ số dư tài khoản HTX của bạn để giao dịch liền mạch.Bên thứ ba: Chúng tôi đã thêm những phương thức thanh toán phổ biến như Google Pay và Apple Pay để nâng cao sự tiện lợi.P2P: Giao dịch trực tiếp với người dùng khác trên HTX.Thị trường mua bán phi tập trung (OTC): Chúng tôi cung cấp những dịch vụ được thiết kế riêng và tỷ giá hối đoái cạnh tranh cho nhà giao dịch.Bước 3: Lưu trữ Sonic (S) của BạnSau khi mua Sonic (S), lưu trữ trong tài khoản HTX của bạn. Ngoài ra, bạn có thể gửi đi nơi khác qua chuyển khoản blockchain hoặc sử dụng để giao dịch những tiền kỹ thuật số khác.Bước 4: Giao dịch Sonic (S)Giao dịch Sonic (S) dễ dàng trên thị trường giao ngay của HTX. Chỉ cần truy cập vào tài khoản của bạn, chọn cặp giao dịch, thực hiện giao dịch và theo dõi trong thời gian thực. Chúng tôi cung cấp trải nghiệm thân thiện với người dùng cho cả người mới bắt đầu và người giao dịch dày dạn kinh nghiệm.

Tổng lượt xem 1.5kXuất bản vào 2025.01.15Cập nhật vào 2026.06.02

Thảo luận

Chào mừng đến với Cộng đồng HTX. Tại đây, bạn có thể được thông báo về những phát triển nền tảng mới nhất và có quyền truy cập vào thông tin chuyên sâu về thị trường. Ý kiến của người dùng về giá của S (S) được trình bày dưới đây.

Discours de Jensen Huang à la GTC Taipei 2026 : L'ère des agents IA est arrivée, le calcul est un revenu

Tóm tắt

Résumé des points clés

Extraits des points de vue marquants

L'arrivée de l'ère des agents IA

Tokens, usines d'IA et économie des infrastructures

Vera Rubin et la transformation des infrastructures de NVIDIA

Le CPU Vera et les besoins en calcul des agents

La prochaine génération d'ordinateurs personnels

IA physique, conduite autonome et robotique

Les collations taïwanaises citées par Jensen Huang deviennent la chaîne d'approvisionnement de l'IA

L'ère des agents IA arrive

Qu'est-ce que le Token d'une usine d'IA ?

Présentation du système Vera Rubin

CPU VERA : Le CPU des agents IA

Le modèle de calcul le plus important de la prochaine décennie

La nouvelle génération d'ordinateurs personnels de NVIDIA

Cosmos 3 : Le modèle de base de l'IA physique

Alpamayo 2 : L'inférence pour la conduite autonome

Isaac GR00T : Le robot humanoïde

Résumé et récapitulation

Câu hỏi Liên quan

Nội dung Liên quan

43 phút của Trump: Cốt truyện người mạnh mất kiểm soát, chiến tranh truyền thông leo thang

Kalshi, MTS và tham vọng của a16z

Bất Ngờ: Cựu Nhân Sự Trụ Cột Trong Dự Án Chip Của OpenAI Gia Nhập Anthropic

a16z chuyển hướng toàn cầu hóa: VC đang trở thành "động lực thúc đẩy" của liên minh công nghệ Mỹ

Kalshi, MTS và Tham vọng của a16z

Giao dịch

Bài viết Nổi bật

HTX Learn: Tìm hiểu Về Conflux để Chia sẻ 8000 USDT

AGENT S là gì

Làm thế nào để Mua S

Thảo luận

Danh mục Phổ biến

Thẻ Nổi bật