Le dernier article de Jensen Huang de Nvidia : Le « cinq couches de gâteau » de l'IA

marsbitPublié le 2026-03-10Dernière mise à jour le 2026-03-10

Résumé

La vision de Jensen Huang, PDG de Nvidia, présente l'IA non pas comme un simple logiciel, mais comme une infrastructure fondamentale, comparable à l'électricité ou à Internet. Il décrit cette transformation à travers une structure en cinq couches : 1. **Énergie** : Base essentielle, car chaque opération d'IA consomme de l'électricité en temps réel. 2. **Puces** : Convertissent efficacement l'énergie en capacité de calcul, essentielle pour le traitement parallèle massif. 3. **Infrastructure** : Comprend les data centers, les systèmes de refroidissement et les réseaux, fonctionnant comme des "usines à intelligence". 4. **Modèles** : Capables de comprendre divers domaines (langage, biologie, physique, etc.) et de produire des résultats en temps réel. 5. **Applications** : Où la valeur économique se concrétise, comme dans la santé, la robotique ou la logistique. Huang souligne que cette construction en est à ses débuts, nécessitant des investissements massifs et une main-d'œuvre qualifiée. Les modèles open source accélèrent l'innovation, tandis que les gains de productivité libèrent les humains pour des tâches plus complexes. L'IA redéfinira l'énergie, le travail et la croissance économique, et chaque pays ou entreprise devra y participer. Nous ne sommes qu'au début de cette révolution infrastructurelle.

Note de la rédaction : L'intelligence artificielle évolue d'une technologie de pointe pour devenir progressivement une infrastructure soutenant l'économie moderne. Dans son premier long article publié sur son compte officiel, Nvidia tente de systématiser la structure industrielle de l'IA à partir des premiers principes : de l'énergie et des puces, aux infrastructures des centres de données, en passant par les modèles et les applications, formant ainsi une pile technologique complète de cinq couches.

L'article indique que l'IA n'est pas seulement une compétition de logiciels ou de modèles, mais une construction industrielle mondiale impliquant l'énergie, la puissance de calcul, la fabrication et les applications, dont l'ampleur pourrait devenir l'une des plus grandes expansions de l'histoire de l'humanité. À travers cette perspective du « cinq couches de gâteau », Nvidia tente d'expliquer : la véritable signification de l'IA n'est pas seulement des logiciels plus intelligents, mais une révolution infrastructurelle d'une ampleur comparable à l'électricité et à Internet.

Voici l'article original :

L'intelligence artificielle est l'une des forces les plus puissantes qui façonnent le monde aujourd'hui. Ce n'est pas une application intelligente, ni un modèle unique, mais une infrastructure, aussi importante que l'électricité et Internet.

L'IA fonctionne sur du matériel réel, de l'énergie réelle et un système économique réel. Elle transforme les matières premières en une « intelligence » produite à grande échelle. Chaque entreprise l'utilisera, chaque pays la construira.

Pour comprendre pourquoi l'IA se déploie de cette manière, il est utile de partir des premiers principes et d'examiner les changements fondamentaux qui se produisent dans le domaine du calcul.

Des « logiciels préfabriqués » à « l'intelligence générée en temps réel »

Pendant la grande majorité de l'histoire de l'informatique, les logiciels étaient « préfabriqués ». Les humains décrivaient d'abord un algorithme, puis l'ordinateur exécutait les instructions. Les données devaient être soigneusement structurées, stockées dans des tableaux et récupérées par des requêtes précises. SQL était indispensable parce qu'il permettait à tout ce système de fonctionner.

Et l'IA a brisé ce modèle.

Pour la première fois, nous disposons d'un ordinateur capable de comprendre des informations non structurées. Il peut voir des images, lire du texte, écouter des sons et en comprendre le sens ; il peut raisonner sur le contexte et l'intention. Plus important encore, il peut générer de l'intelligence en temps réel.

Chaque réponse est une nouvelle génération. Chaque réponse dépend du contexte que vous fournissez. Ce n'est plus un logiciel récupérant des instructions préexistantes dans une base de données, mais un logiciel qui raisonne en temps réel et génère de l'intelligence à la demande.

Parce que l'intelligence est générée en temps réel, toute la pile technologique de calcul qui la soutient doit être réinventée.

L'IA en tant qu'infrastructure

Si l'on regarde l'IA d'un point de vue industriel, elle peut en fait être décomposée en une structure à cinq couches.

Énergie (Energy)

La couche la plus basse est l'énergie.

L'intelligence générée en temps réel nécessite une électricité générée en temps réel. La production de chaque jeton (token) implique le mouvement d'électrons, la gestion de la chaleur, la conversion de l'énergie en capacité de calcul.

En dessous de cette couche, il n'y a aucune abstraction. L'énergie est le premier principe de l'infrastructure de l'IA, et la contrainte fondamentale qui détermine la quantité d'intelligence que le système peut produire.

Puces (Chips)

Au-dessus de l'énergie se trouvent les puces. Ces processeurs sont conçus pour convertir l'énergie en capacité de calcul avec une efficacité extrême et à grande échelle.

Les charges de travail de l'IA nécessitent une énorme capacité de calcul parallèle, une mémoire à haute bande passante et une interconnexion à haute vitesse. Les progrès de la couche des puces déterminent la vitesse à laquelle l'IA peut s'étendre et déterminent également à quel point « l'intelligence » deviendra finalement bon marché.

Infrastructure (Infrastructure)

Au-dessus des puces se trouve l'infrastructure. Cela comprend les terrains, la distribution d'électricité, les systèmes de refroidissement, l'ingénierie de construction, les systèmes réseau et les systèmes d'orchestration qui organisent des dizaines de milliers de processeurs en une seule machine.

Ces systèmes sont essentiellement des usines d'IA. Ils ne sont pas conçus pour stocker des informations, mais pour fabriquer de l'intelligence.

Modèles (Models)

Au-dessus de l'infrastructure se trouvent les modèles. Les modèles d'IA peuvent comprendre divers types d'informations : langage, biologie, chimie, physique, finance, médecine et le monde réel lui-même.

Les modèles de langage ne sont qu'une catégorie. L'un des travaux les plus transformateurs se produit dans les domaines suivants : IA des protéines, IA chimique, simulation physique, robotique, systèmes autonomes.

Applications (Applications)

La couche la plus haute est celle des applications, c'est là que la valeur économique réelle est générée. Par exemple, les plateformes de découverte de médicaments, les robots industriels, les assistants juridiques (Copilot), les voitures autonomes.

Une voiture autonome est essentiellement une « application d'IA portée par une machine » ; un robot humanoïde est une « application d'IA portée par un corps ». La pile technologique sous-jacente est la même, seule la forme finale de présentation diffère.

Ainsi, voici la structure en cinq couches de l'IA : Énergie → Puces → Infrastructure → Modèles → Applications. Chaque application réussie tire vers le bas toutes les couches, jusqu'à la centrale électrique qui l'alimente à la couche la plus basse.

Une construction d'infrastructure encore à ses débuts

Nous ne faisons que commencer cette construction. L'investissement actuel n'est que de quelques milliers de milliards de dollars, et il faudra encore construire une infrastructure de l'ordre de plusieurs milliers de milliards de dollars à l'avenir.

À l'échelle mondiale, nous assistons à la construction : d'usines de puces, d'usines d'assemblage d'ordinateurs, d'usines d'IA.

à une échelle sans précédent. Cela devient l'une des plus grandes constructions d'infrastructures de l'histoire de l'humanité.

Les besoins en main-d'œuvre à l'ère de l'IA

La main-d'œuvre nécessaire pour soutenir cette construction est très importante.

Les usines d'IA ont besoin de : électriciens, plombiers, installateurs de tuyauterie, ouvriers de la construction métallique, techniciens réseau, personnel d'installation d'équipements, personnel d'exploitation et de maintenance.

Ce sont des postes techniques, bien rémunérés, et actuellement en pénurie. Participer à cette transformation ne nécessite pas nécessairement un doctorat en informatique.

Dans le même temps, l'IA stimule la productivité de l'économie du savoir. Prenons l'exemple de la radiologie. L'IA commence déjà à aider à l'interprétation des images médicales, mais la demande de radiologues continue de croître.

Ce n'est pas contradictoire.

La véritable responsabilité du radiologue est de soigner les patients, et la lecture des images n'est qu'une partie du travail. Lorsque l'IA prend en charge de plus en plus de tâches répétitives, les médecins peuvent consacrer plus de temps au jugement, à la communication et au traitement.

L'efficacité de l'hôpital s'améliore, permettant de servir plus de patients, et nécessitant donc plus de personnel. La productivité crée des capacités, les capacités créent la croissance.

Qu'est-ce qui a changé au cours de la dernière année ?

Au cours de la dernière année, l'IA a franchi un seuil critique.

Les modèles sont suffisamment bons pour être vraiment utiles à grande échelle.

· Capacité de raisonnement significativement améliorée

· Hallucinations significativement réduites

· « Ancrage » (grounding) dans le monde réel considérablement renforcé

Pour la première fois, les applications basées sur l'IA commencent à créer une valeur économique réelle.

Une adéquation produit-marché évidente est déjà apparue dans les domaines suivants : découverte de médicaments, logistique, service client, développement logiciel, manufacturing.

Ces applications tirent fortement toute la pile technologique sous-jacente.

Le rôle des modèles open source

Les modèles open source jouent un rôle clé dans ce processus. La grande majorité des modèles d'IA dans le monde sont gratuits. Les chercheurs, les startups, les entreprises et même les nations entières dépendent des modèles open source pour participer à la concurrence de l'IA avancée.

Lorsque les modèles open source atteignent la frontière technologique, ils ne changent pas seulement les logiciels, mais activent également la demande pour toute la pile technologique.

DeepSeek‐R1 en est un exemple typique. En rendant un modèle de raisonnement puissant largement disponible, il a stimulé la croissance rapide de la couche applicative, tout en augmentant la demande en puissance de calcul pour l'entraînement, les infrastructures, les puces et l'énergie.

Qu'est-ce que cela signifie ?

Lorsque vous considérez l'IA comme une infrastructure, tout devient clair. L'IA a peut-être commencé avec les transformers et les grands modèles de langage, mais elle va bien au-delà.

C'est une transformation de niveau industriel qui remodelera :

· La façon dont l'énergie est produite et consommée

· La façon dont les usines sont construites

· La façon dont le travail est organisé

· Les modèles de croissance économique

Les usines d'IA sont construites parce que l'intelligence peut maintenant être générée en temps réel. Les puces sont repensées parce que l'efficacité détermine la vitesse d'expansion de l'intelligence. L'énergie devient centrale parce qu'elle détermine la quantité maximale d'intelligence que le système peut produire. Les applications explosent parce que les modèles ont finalement franchi le seuil de « l'utilisabilité à l'échelle ».

Chaque couche renforce les autres.

C'est pourquoi l'ampleur de cette construction est si vaste, pourquoi elle affecte simultanément tant d'industries, et pourquoi elle ne se limitera pas à un pays ou à un domaine particulier.

Chaque entreprise utilisera l'IA.

Chaque pays construira l'IA.

Nous en sommes encore aux premiers stades.

Une grande partie de l'infrastructure n'est pas encore construite, une grande partie de la main-d'œuvre n'est pas encore formée, une grande partie des opportunités ne sont pas encore réalisées.

Mais la direction est très claire.

L'intelligence artificielle devient l'infrastructure fondamentale du monde moderne.

Et les choix que nous faisons aujourd'hui, la vitesse de construction, l'étendue de la participation et le déploiement responsable, détermineront ce que cette époque deviendra finalement.

Questions liées

QQuels sont les cinq niveaux de la structure de l'IA selon l'article de Jensen Huang de NVIDIA ?

ALes cinq niveaux de la structure de l'IA sont : Énergie → Puces (Chips) → Infrastructure → Modèles → Applications.

QPourquoi l'énergie est-elle considérée comme le fondement de l'infrastructure de l'IA ?

AL'énergie est le fondement car chaque jeton (token) généré nécessite une consommation d'électricité en temps réel. C'est la contrainte fondamentale qui détermine la quantité d'intelligence que le système peut produire.

QComment l'article décrit-il le changement fondamental apporté par l'IA dans le domaine de l'informatique ?

AL'IA a brisé le modèle traditionnel de logiciels 'préfabriqués' qui suivaient des instructions fixes. Désormais, l'IA comprend les informations non structurées, raisonne en contexte et génère une intelligence en temps réel.

QQuel rôle les modèles open source jouent-ils dans le développement de l'IA selon l'article ?

ALes modèles open source, comme l'exemple de DeepSeek-R1 cité, jouent un rôle clé en rendant des modèles d'IA puissants largement disponibles. Cela stimule la croissance rapide de la couche application et augmente la demande pour toute la pile technologique sous-jacente.

QQuel impact l'IA a-t-elle sur la demande de main-d'œuvre, en particulier dans des domaines comme la radiologie ?

AL'IA augmente la productivité en automatisant les tâches répétitives (comme la lecture d'images radiologiques), ce qui permet aux professionnels (comme les radiologues) de se concentrer sur des activités à plus forte valeur ajoutée. Cela améliore l'efficacité globale, permet de servir plus de patients et peut finalement créer une demande pour plus de main-d'œuvre dans le secteur.

Lectures associées

Google et Amazon investissent simultanément dans un concurrent, la logique commerciale la plus absurde de l'ère IA devient réalité

En l'espace de 4 jours, Amazon a annoncé un investissement supplémentaire de 25 milliards de dollars et Google jusqu'à 40 milliards de dollars dans Anthropic, une startup d'IA. Ces deux concurrents directs ont ainsi engagé plus de 65 milliards de dollars dans la même entreprise. Cet investissement massif ne relève pas d'une logique capitalistique traditionnelle, mais marque le début d'un nouveau round dans la guerre du cloud. L'enjeu pour Google et Amazon n'est pas la simple possession d'une part d'Anthropic, mais la sécurisation de contrats de pré-achat de puissance de calcul (ou "pré-vente de calcul"). Les fonds investis sont conditionnés à ce qu'Anthropic les dépense en services cloud et puces des investisseurs. Amazon a obtenu un engagement de dépense de plus de 1000 milliards de dollars sur AWS sur dix ans, et Google fournira environ 5 gigawatts de puissance de calcul. La concurrence dans le cloud a changé : les entreprises ne choisissent plus un fournisseur pour son prix ou sa stabilité, mais pour savoir "quel modèle d'IA de pointe tourne sur son cloud". Le modèle détermine le choix de la puissance de calcul. OpenAI étant déjà étroitement lié à Microsoft, Anthropic et son modèle Claude sont devenus la seule cible stratégique disponible pour Google et Amazon pour ne pas perdre des clients entreprises. Anthropic, avec un revenu annuel récurrent (ARR) de 30 milliards de dollars, est devenu un acteur infrastructurel incontournable. Cependant, cette dépendance financière et technique envers deux géants concurrents pose des défis pour son indépendance future, sa narration autour de la sécurité et sa pression pour une introduction en bourse. La situation contraste avec celle de la Chine, où des investissements comme celui d'Alibaba et Tencent dans DeepSeek (modèle open-source) suivent une logique différente, moins centrée sur un verrouillage par la puissance de calcul et plus ouverte. Le paysage de l'IA évolue ainsi vers une structure à plusieurs pôles fermés (modèles privateurs liés à un cloud spécifique), tandis que les modèles open-source offrent une alternative cruciale pour l'écosystème.

marsbitIl y a 1 h

Google et Amazon investissent simultanément dans un concurrent, la logique commerciale la plus absurde de l'ère IA devient réalité

marsbitIl y a 1 h

Capacité de calcul limitée : pourquoi DeepSeek-V4 est-il open source ?

Face à des contraintes de calcul, DeepSeek a choisi de rendre son modèle DeepSeek-V4 open source, tout en proposant une version Pro aux capacités avancées mais limitée en débit en raison de ressources de calcul haute performance insuffisantes. Le modèle exploite une architecture MoE (Mixture of Experts) avec 1,6T de paramètres au total mais seulement 49B activés lors de l'inférence, permettant une gestion de contexte longue (1 million de tokens). Une version Flash, avec 284B de paramètres totaux et seulement 13B activés, est conçue pour une adoption massive sur du matériel moins performant, visant ainsi les PME et développeurs. Le modèle excelle dans des tâches exigeantes comme la génération de code et le raisonnement complexe, rivalisant avec des modèles fermés leaders. DeepSeek a également collaboré avec des fabricants de puces chinoises (Huawei, Cambricon, Hygon) pour optimiser l'exécution sur du matériel local, bien que des défis persistent en termes de performance pure et d’approvisionnement. Cette stratégie intervient dans un contexte de concurrence intense sur le marché chinois des modèles de langage et de départs clés dans l’équipe R&D. DeepSeek cherche également à lever des fonds à une valorisation élevée, et cette version open source constitue une démonstration de sa résilience technologique et de son orientation pragmatique vers une IA accessible malgré les limites actuelles du calcul.

marsbitIl y a 2 h

Capacité de calcul limitée : pourquoi DeepSeek-V4 est-il open source ?

marsbitIl y a 2 h

Trading

Spot
Futures

Articles tendance

Comment acheter LAYER

Bienvenue sur HTX.com ! Nous vous permettons d'acheter Solayer (LAYER) de manière simple et pratique. Suivez notre guide étape par étape pour commencer votre parcours crypto.Étape 1 : Création de votre compte HTXUtilisez votre adresse e-mail ou votre numéro de téléphone pour ouvrir un compte sur HTX gratuitement. L'inscription se fait en toute simplicité et débloque toutes les fonctionnalités.Créer mon compteÉtape 2 : Choix du mode de paiement (rubrique Acheter des cryptosCarte de crédit/débit : utilisez votre carte Visa ou Mastercard pour acheter instantanément Solayer (LAYER).Solde :utilisez les fonds du solde de votre compte HTX pour trader en toute simplicité.Prestataire tiers :pour accroître la commodité d'utilisation, nous avons ajouté des modes de paiement populaires tels que Google Pay et Apple Pay.P2P :tradez directement avec d'autres utilisateurs sur HTX.OTC (de gré à gré) : nous offrons des services personnalisés et des taux de change compétitifs aux traders.Étape 3 : stockage de vos Solayer (LAYER)Après avoir acheté vos Solayer (LAYER), stockez-les sur votre compte HTX. Vous pouvez également les envoyer ailleurs via un transfert sur la blockchain ou les utiliser pour trader d'autres cryptos.Étape 4 : tradez des Solayer (LAYER)Tradez facilement Solayer (LAYER) sur le marché Spot de HTX. Il vous suffit d'accéder à votre compte, de sélectionner la paire de trading, d'exécuter vos trades et de les suivre en temps réel. Nous offrons une expérience conviviale aux débutants comme aux traders chevronnés.

302 vues totalesPublié le 2025.02.11Mis à jour le 2025.03.21

Comment acheter LAYER

Discussions

Bienvenue dans la Communauté HTX. Ici, vous pouvez vous tenir informé(e) des derniers développements de la plateforme et accéder à des analyses de marché professionnelles. Les opinions des utilisateurs sur le prix de LAYER (LAYER) sont présentées ci-dessous.

活动图片