La philosophie d'investissement de Gavin Baker, investisseur précoce de Nvidia : Investir dans les goulots d'étranglement des infrastructures IA et se couvrir contre le risque du marché global

marsbitPublié le 2026-05-30Dernière mise à jour le 2026-05-30

Résumé

Le podcast explore la philosophie d'investissement de Gavin Baker, fondateur d'Atreides Management et investisseur de longue date dans Nvidia et Cerebras. Sa thèse centrale est que l'IA n'est pas une bulle, mais un super-cycle d'infrastructure piloté par des contraintes physiques : l'électricité, les plaquettes de silicium (wafers) et la puissance de calcul (token generation). Les opportunités de rendement excédentaire se situeraient non pas dans les modèles de langage grand public, mais dans les "vendeurs de pelles" (picks and shovels) : interconnexion des GPU, mémoire, puces d'inférence, procédés de fabrication avancés et alimentation électrique. Son portefeuille reflète cette vision : il investit de manière concentrée dans des actifs liés aux goulets d'étranglement physiques de l'IA (comme Astera Labs, Micron, Cerebras, Positron) tout en se couvrant contre un repli général du marché via des options de vente (puts) sur le QQQ. Il soutient que ce cycle diffère de la bulle internet des années 2000 car il est financé par les flux de trésorerie des grandes entreprises technologiques (Google, Amazon, Microsoft, Meta) et non par l'endettement. De plus, des contraintes d'offre strictes chez des acteurs comme TSMC, ASML ou dans le secteur de l'énergie empêchent une expansion excessive et rapide, limitant ainsi le risque de formation d'une bulle spéculative. Baker identifie quatre axes d'investissement principaux : les petits modèles de langage verticalisés, les infrastructures so...

Cet épisode de podcast aborde principalement la philosophie d'investissement de Gavin Baker, fondateur d'Atreides Management et investisseur de longue date dans Nvidia et Cerebras.

Son jugement central est que l'IA n'est pas une bulle, mais un super-cycle d'infrastructures entraîné conjointement par l'électricité, les wafers de silicium et la puissance de calcul ; les rendements excédentaires réels ne se trouvent pas dans les grands modèles ou les chatbots, mais dans les maillons des « vendeurs de pelles » que sont l'interconnexion des GPU, la mémoire, les puces d'inférence, les procédés de fabrication avancés et l'alimentation électrique.

Gavin Baker se couvre d'un côté contre un recul global du marché via des puts sur le QQQ, tout en concentrant ses paris sur des actifs constituant des goulots d'étranglement physiques de l'IA comme Astera Labs, Unity, Micron, Nvidia, Cerebras et Positron.

Il ramène le débat sur la « bulle IA » du niveau émotionnel à celui des contraintes d'offre et de demande, estimant que tant que TSMC, ASML, la mémoire haute bande passante et le réseau électrique ne pourront pas se développer en excès rapidement, les dépenses d'investissement en IA ne seront pas nécessairement une répétition de la bulle internet de l'an 2000.

Citations clés

Bulle IA ou super-cycle

· « L'IA n'est pas dans une bulle ; au contraire, elle est au beau milieu d'un super-cycle. »

· « Les plus gros retours ne sont pas dans le SaaS, ni dans les chatbots comme OpenAI ou Anthropic, mais dans l'électricité, la puissance de calcul et la fabrication de silicium. »

· « Ce n'est pas la bulle internet, car les acheteurs sont principalement les entreprises les plus intelligentes et disposant des meilleures cash-flows au monde, elles n'achètent pas de puissance de calcul avec de la dette. »

· « Si l'ensemble du marché ne peut pas être sur-approvisionné, il est difficile qu'il s'effondre soudainement comme une bulle traditionnelle. »

Les vrais goulots d'étranglement : Électricité, wafers, tokens

· « La théorie de Gavin est simple : regardez uniquement les goulots d'étranglement de la couche d'infrastructure IA. Celui qui peut maximiser les performances par watt et réduire le coût par token a de la valeur. »

· « Les laboratoires d'IA s'intéressent de plus en plus à une chose : combien de tokens peut-on générer par watt d'électricité. »

· « L'électricité et les wafers sont deux murs de briques, deux contraintes clés qui limitent une accélération trop rapide de l'IA. »

Du pré-entraînement à l'inférence et au post-entraînement

· « Après le pré-entraînement d'un modèle, cela ne signifie pas qu'il sera un génie toute sa vie ; il a encore besoin d'absorber de nouvelles informations lors de la phase de post-entraînement. »

· « L'inférence nécessite par essence beaucoup de calculs, c'est pourquoi les puces d'inférence et les infrastructures d'inférence deviendront la priorité de la prochaine phase. »

· « Le coût ou les opportunités de revenus liés à l'inférence seule pourraient être 5 à 10 fois supérieurs aux investissements en puissance de calcul pour le pré-entraînement. »

Petits modèles verticalisés, modèles embarqués et infrastructures souveraines

· « À l'avenir, vous n'interagirez pas forcément quotidiennement avec Claude ; ce dont vous aurez vraiment besoin, c'est probablement d'un agent IA personnalisé, entraîné sur vos propres données. »

· « La vitesse de déploiement de l'infrastructure est en soi un fossé concurrentiel. La vitesse d'itération dans le monde numérique est bien plus rapide que la vitesse de construction de l'infrastructure physique. »

« Celui qui peut compresser des déploiements physiques de plusieurs mois ou années en quelques semaines pourra vendre ses services très cher dans l'infrastructure IA. »

La méthode d'investissement de Gavin : Investir dans les goulots, se couvrir contre le risque du marché global

· « Il croit fermement qu'il y aura des gagnants en IA, mais cela ne signifie pas qu'il est optimiste sur l'ensemble du marché ; les puts sur QQQ sont sa couverture contre le risque baissier global. »

· « TSMC limite en fait la vitesse d'accélération de la bulle ; tant que la capacité de production de puces ne peut pas être augmentée instantanément, les dépenses d'investissement ne risquent pas de devenir incontrôlables. »

· « Gavin ressemble à un Leopold plus âgé, plus stable et avec un historique plus établi de traversée de cycles : le succès du premier se compte en décennies, celui du second davantage en trimestres pour l'instant. »

Actifs sur lesquels il vaut la peine de parier dans le super-cycle de l'IA

EJ : Gavin Baker est un investisseur IA extrêmement productif, mais quasi inconnu du grand public. Au cours des 20 dernières années, il a commencé à investir dans certaines entreprises d'IA bien avant qu'elles ne deviennent célèbres. Il a parié tôt sur Nvidia (fournisseur clé de GPU pour l'IA et du calcul accéléré), et sur Cerebras (entreprise de puces IA), et il a une vision très claire : l'IA n'est pas une bulle, au contraire, c'est un super-cycle.

Il pense qu'en observant les watts (électricité), les wafers et les tokens (unité de génération et de calcul des modèles), c'est-à-dire l'infrastructure sous-jacente de l'IA, on peut identifier les goulots d'étranglement et les contraintes clés. Sa conclusion est simple : les plus gros retours de l'IA proviennent de l'électricité, de l'énergie et de la fabrication de silicium, et ont peu à voir avec le SaaS ou les chatbots comme Anthropic et OpenAI.

Toute l'industrie finira par se répercuter en aval sur les semi-conducteurs, c'est-à-dire les actifs de type « vendeurs de pelles » qui soutiennent toute l'industrie de l'IA.

Alors que beaucoup disent que l'industrie de l'IA est déjà une bulle, il pense que c'est précisément une opportunité d'achat générationnelle, en particulier dans l'infrastructure IA. Il exprime ce jugement dans son fonds avec environ 4,1 milliards de dollars d'actifs sous gestion.

Si vous écoutez ses propos sur ces contraintes, notamment l'infrastructure IA, cette théorie vous semblera familière. Nous avons déjà parlé à plusieurs reprises dans le podcast de l'investisseur Leopold Aschenbrenner, qui a également beaucoup investi dans des directions similaires. La différence est que Leopold le fait depuis environ 3 ans, tandis que Gavin le fait depuis plus de 20 ans.

Les actifs sous gestion de Leopold sont environ trois fois plus importants que ceux de Gavin, mais le producteur du podcast, Luke, a fait une remarque pertinente : on peut peut-être battre Warren Buffett sur une année, mais peut-on le battre pendant des décennies consécutives ? L'historique de Gavin Baker suggère qu'il pourrait avoir une perspective différente sur cette théorie d'investissement.

Pour ceux qui ne connaissent pas Gavin Baker, sachez qu'il est le fondateur d'Atreides Management (fonds d'investissement) et qu'il investit dans Nvidia depuis 20 ans. Si vous détenez Nvidia depuis 20 ans et continuez à travailler, c'est déjà incroyable en soi, car cela devrait générer des rendements énormes.

Ses récents succès incluent Cerebras et Astera Labs (entreprise de puces de connectivité pour centres de données IA). Cerebras est une entreprise de puces IA ; le podcast mentionne que sa valorisation après l'IPO est incroyablement élevée. Il y a aussi d'autres entreprises dont vous n'avez peut-être pas entendu parler, et dans cet épisode, nous allons suivre son portefeuille et son jugement pour voir où se trouvent selon lui les opportunités d'investissement en IA.

La question devient donc : qu'a-t-il investi et pourquoi ? Si l'on regarde le dernier dépôt 13F d'Atreides Management, ce fonds a environ 4 milliards de dollars d'AUM. En décomposant ses plus grosses positions, on voit que ces entreprises pointent vers les goulots d'étranglement du développement de l'IA que Gavin a mentionnés à plusieurs reprises.

Il a de grosses positions dans des entreprises peu glamour, que beaucoup ne connaissent même pas. Par exemple, Astera Labs représente presque 9 à 10 % du fonds. Vous pouvez voir Astera Labs comme la couche de connectivité entre les GPU.

Si vous imaginez un centre de données comme un système, les GPU sont les moteurs, responsables du pré-entraînement, du post-entraînement et de l'inférence des modèles. Mais pour travailler, les GPU doivent transférer d'énormes quantités de données entre eux et accéder aux puces mémoire où les données sont stockées.

Pour cela, un « système de tuyauterie » est nécessaire. Je vulgarise, car je ne prétends pas comprendre tous les détails sous-jacents. C'est précisément ce problème qu'Astera Labs résout. Lorsque les clusters IA s'étendent à des centaines de milliers de puces, le goulot d'étranglement n'est plus seulement le GPU lui-même, mais la fenêtre de transfert de données : comment envoyer les bonnes données au bon moment et accéder aux bonnes données. Astera Labs construit un tel système de tuyauterie.

Je n'avais pas non plus entendu parler d'Astera Labs avant de faire des recherches pour cet épisode. Mais je me souviens que c'était le cas pour Cerebras également. Gavin parlait de Cerebras il y a environ six mois, ce qui est long à l'échelle de l'IA. Ensuite, elle est entrée en bourse, le podcast mentionne une valorisation d'environ 600 milliards de dollars, puis une hausse de 40 % après l'IPO. Cela suggère qu'Astera Labs pourrait être un nom important dans une tendance similaire.

Josh : Cerebras est un investissement très précoce pour lui. Il est entré dans Cerebras très tôt dans le cycle de vie de l'entreprise, ce qui signifie qu'il parie sur cette théorie depuis de nombreuses années. Il y a plusieurs autres entreprises sur lesquelles il a parié à long terme, la plus emblématique étant bien sûr Nvidia.

Être présent dans Nvidia depuis plus de 20 ans et maintenir sa conviction tout au long du chemin, c'est très impressionnant. J'ai récemment écouté deux podcasts avec Gavin ; quand il parle de sa position dans Nvidia, il exprime clairement sa conviction que Nvidia peut maintenir ses marges actuelles et sa demande. Cela signifie qu'il pense que Nvidia a une chance d'atteindre une valorisation proche de 10 000 milliards de dollars, alors qu'elle n'en est qu'à la moitié actuellement.

Un autre nom à mentionner est Micron. Nous avons parlé de la pile d'investissement IA et de la position de ces entreprises dans l'épisode précédent, je vous recommande de l'écouter. Micron est l'un des plus grands fabricants de mémoire.

Le podcast mentionne un chiffre frappant : il y a un an, sa capitalisation boursière était inférieure à 1000 milliards de dollars, et au moment de l'enregistrement, elle avait dépassé les 10 000 milliards, soit une multiplication par 10 en un an. Cela montre l'importance du problème de la mémoire.

Il y a aussi des entreprises moins visibles mais intéressantes. EJ, je veux particulièrement te mentionner une entreprise : Unity Software. Ceux qui connaissent le jeu vidéo connaissent Unity, un moteur de jeu utilisé pour créer de nombreux jeux populaires avec son logiciel de rendu 3D.

Alors pourquoi un investisseur IA investirait-il dans Unity, cette « chose qui fait des jeux vidéo » ? La réponse est le moteur de jeu 3D. Unity est un constructeur de modèles du monde, il a une compréhension profonde de la physique, du fonctionnement du monde, des matériaux et de l'éclairage.

Lorsque les entreprises d'IA veulent construire l'AGI et des robots humanoïdes, un élément clé est la simulation d'environnements virtuels et de jeux de données virtuels pour entraîner les robots. Unity est justement l'un des outils les plus puissants pour cela.

Ainsi, en tant que partisan des modèles du monde, cet exemple devrait vous plaire : une entreprise connue pour son moteur de jeu a une voie claire pour devenir un acteur important dans le monde de l'IA.

La théorie et la stratégie d'investissement de Gavin

EJ : La théorie des modèles du monde est simple : les modèles IA ou LLM actuels comprennent le monde principalement à travers le texte et les livres, comme un étudiant assis dans une bibliothèque, mais ils n'ont pas d'expérience du monde réel.

Ce que les modèles du monde permettent de débloquer, c'est cela : placer un personnage de jeu dans un environnement simulé pour qu'il comprenne comment fonctionne la réalité physique.

Par exemple, si je laisse tomber mon téléphone ou si je frappe un ballon, que se passe-t-il ? Quelles sont les étapes suivantes ? Que devez-vous faire ? C'est ce que résolvent les modèles du monde.

Actuellement, il n'y a pas beaucoup d'acteurs capables de le faire à grande échelle. Le leader actuel est peut-être Google, avec son projet Genie 3. Le podcast mentionne également que Google a récemment publié Gemini Omni, mais ce type de modèle n'a pas encore eu son véritable moment « ChatGPT ».

Ce que j'aime chez Gavin, c'est que son portefeuille ressemble à une stratégie barbell. D'un côté, c'est très traditionnel : les gens ont besoin de GPU, de mémoire, donc il investit dans les plus grands acteurs comme Micron et Nvidia. De l'autre côté, c'est très avant-gardiste : il pense que le palet va dans cette direction, donc il investit dans Cerebras car il pense que l'inférence sera très importante ; et dans Unity car il pense que les modèles du monde seront la façon d'entraîner les robots et la prochaine génération de LLM.

Son portefeuille contient aussi Positron, qui fabrique des puces d'inférence. Si cela ressemble à Cerebras, oui, elles tournent toutes deux autour de l'inférence. Gavin a beaucoup parlé récemment dans des interviews d'une tendance : la pile d'infrastructure des modèles IA, en particulier la pile d'entraînement, passe du pré-entraînement à une plus grande importance accordée au post-entraînement.

Si vous êtes dans le milieu de l'IA, vous savez que ce changement est déjà en cours. Gavin y est très attentif. Un modèle a encore besoin de comprendre de nouvelles informations, de nouvelles données, de se mettre à jour. Ce n'est pas parce qu'il a terminé son pré-entraînement sur un certain jeu de données qu'il sera un génie toute sa vie. Il doit encore apprendre de nouvelles informations, et cela se produit dans la couche de post-entraînement, ce qui nécessite beaucoup de calculs.

Deuxièmement, si vous avez besoin qu'un modèle IA réfléchisse vraiment à un problème, comme nous le faisons lorsque nous recevons de nouvelles informations (est-ce que cet angle tient ? Y a-t-il une autre théorie pour l'expliquer ?), c'est le raisonnement. Le raisonnement nécessite également beaucoup de calculs. Les estimations actuelles sont que le coût ou les opportunités de revenus liés à l'inférence seule pourraient être 5 à 10 fois supérieurs aux investissements en puissance de calcul pour le pré-entraînement.

C'est pourquoi un changement majeur est en cours dans les laboratoires d'IA et chez les fabricants de puces. Vous avez déjà vu Nvidia lancer de nombreux GPU orientés inférence pour supporter les applications agentiques. Gavin exprime également son pari sur l'inférence à travers une série d'investissements.

Un dernier point que je trouve très intéressant est que Gavin parle de la Chine. Dans la course à l'IA, le récit a toujours été Chine contre États-Unis. La Chine a une configuration unique, avec une énergie relativement abondante et une capacité à étendre la fabrication de puces. Les États-Unis ont actuellement plus de difficultés dans ce domaine, c'est pourquoi de nombreuses étapes sont externalisées vers TSMC à Taïwan.

Son explication est que la Chine a une opportunité unique de créer une infrastructure IA ou des puces très différentes de celles des États-Unis, car elles seront très axées sur l'inférence. On pourrait dire que Gavin, à travers ses investissements aux États-Unis, prend les devants en pariant sur la construction de l'infrastructure d'inférence américaine. Je pense que cela pourrait être une énorme opportunité à l'avenir.

Josh : Il est important de noter que ce pari n'a pas que du potentiel haussier. Il détient également une grosse position de puts sur le QQQ. Le QQQ est un ETF qui suit le Nasdaq 100, un panier d'actions, et c'est le deuxième ETF le plus échangé aux États-Unis. Sa performance est très forte : +55 % en 2023, +25 % en 2024, +20 % en 2025, et +17 % jusqu'à présent en 2026.

En d'autres termes, le QQQ, en tant que fonds indiciel, a très bien performé, il est facile à acheter, c'est un panier des 100 meilleures actions. Et Gavin fait un hedge inverse contre lui. Il ne dit pas que l'IA ne gagnera pas, mais il dit : je veux investir dans les fabricants clés qui résolvent les goulots d'étranglement, mais je ne suis pas très optimiste sur le sentiment du marché global.

Les puts sur QQQ sont une protection contre le risque baissier : si le marché global s'effondre d'une manière défavorable, même si l'IA gagne à long terme, il a cette couverture.

Quatre catégories d'orientations méritant d'être investies

Josh : Nous pouvons décomposer les goulots d'étranglement d'investissement qu'il considère les plus importants en plusieurs catégories. La première catégorie est celle des petits modèles de langage verticalisés.

Les LLM généraux, comme Claude et ChatGPT, sont des modèles généralistes ; ils ont une compréhension large du monde et peuvent répondre à des questions spécifiques. Mais entraîner un modèle sur un domaine vertical spécifique ou un problème particulier, c'est autre chose.

Ces problèmes spécifiques existent généralement dans les entreprises, en particulier celles qui se concentrent profondément sur un problème ou qui ont créé une niche dans un créneau spécifique. Les SLM verticalisés résolvent exactement ce problème : ce sont des modèles frontières, mais hautement optimisés, capables de fonctionner efficacement sur les données spécifiques d'une entreprise ou localement sur un appareil.

Nous avons déjà parlé des modèles embarqués ou exécutés localement. La raison est que votre téléphone ou autre appareil contient beaucoup de données très personnelles que vous ne voulez pas forcément partager, et les entreprises ne peuvent pas forcément y accéder. Par exemple, les dossiers médicaux, les détails financiers.

J'ai vu qu'OpenAI avait publié un agent IA financier pouvant accéder à votre compte bancaire, mais ne pouvant pas vraiment agir pour vous, car il contient beaucoup d'informations personnellement identifiables, comme le numéro de sécurité sociale, les détails bancaires, etc.

Les modèles locaux ou les SLM peuvent résoudre ce type de problème. Gavin parie beaucoup sur le fait qu'ils deviendront importants à l'avenir. Il y a une entreprise qu'il estime très prometteuse : Apple. Bien qu'il n'ait pas nécessairement exprimé un intérêt d'investissement explicite, il pense qu'Apple sera l'un des principaux fabricants d'appareils à faire fonctionner des modèles locaux sur les appareils.

Si l'avenir est ainsi, nous ne penserons peut-être plus que Claude doit être le modèle avec lequel vous interagissez quotidiennement. Vous aurez peut-être besoin d'un agent IA personnalisé, entraîné sur vos propres données, c'est ce que les SLM pourraient finalement devenir.

Une version générale pourra fonctionner sur votre téléphone, et de nombreuses entreprises exécuteront également des modèles hautement optimisés et spécialisés, entraînés sur leurs données propriétaires, pour mieux vendre ou commercialiser leurs produits.

EJ : Apple est très bien positionnée pour cela. J'attends avec impatience la WWDC, elle arrive bientôt.

Josh : Oui.

EJ : Il ne reste que quelques semaines avant la conférence des développeurs d'Apple, ils vont dévoiler de nouveaux logiciels IA et comment ils s'intègrent au matériel. Ce sera très important, nous en reparlerons, j'ai hâte d'en discuter.

Josh : Le deuxième pilier est l'infrastructure souveraine. Nous disons souvent que la vitesse des bits est bien plus rapide que celle des atomes. C'est très visible avec l'infrastructure IA : la qualité des modèles s'améliore presque de façon exponentielle, l'intelligence par watt, l'intelligence par token, ne font qu'augmenter.

Mais la vitesse de déploiement physique n'augmente pas à une vitesse similaire, et cela constitue en soi un fossé concurrentiel. Le matériel est extrêmement complexe, la précision des transistors approche l'échelle atomique ; le déploiement à grande échelle dans un monde où l'infrastructure existante est déjà sous pression n'est pas facile. Après l'accélération de l'adoption des véhicules électriques, le réseau électrique est déjà sous une plus grande pression, de nombreux endroits sont proches de la pleine capacité. Maintenant, l'IA apporte des problèmes d'énergie et de puces.

Gavin parie fermement sur le fait que l'infrastructure est difficile, que sa construction prend beaucoup de jours, de mois, voire d'années. Il parie sur ceux qui peuvent comprimer ce cycle en quelques semaines. Ainsi, la vitesse de déploiement physique est en elle-même un fossé concurrentiel. Il réduit son champ de recherche aux entreprises qui peuvent déployer rapidement.

Le premier exemple qui me vient à l'esprit est SpaceX, et la vitesse à laquelle ils construisent Colossus (le supercalculateur IA de xAI) et le louent à Anthropic, et potentiellement à d'autres entreprises à l'avenir. Ce pilier infrastructurel est l'une des clés sur lesquelles Gavin se concentre.

Si vous regardez le portefeuille de Leopold, c'est également une partie centrale. La réalité est : construire des choses est très difficile, et ceux qui peuvent les construire peuvent les vendre très cher. Le podcast mentionne que la plus grande source de revenus de SpaceX aujourd'hui est la location de centres de données, pas les fusées. Cela montre l'importance de ce pilier.

EJ : Il se soucie de la vitesse, mais aussi du coût. Il mentionne à plusieurs reprises une métrique : la performance par watt. Ce qu'il veut vraiment dire, c'est que les laboratoires d'IA se soucient de plus en plus du nombre de tokens générés par watt.

Si vous pensez au fait que cette année, seulement cinq entreprises environ dépensent des dizaines, voire des milliers de milliards de dollars en GPU, en puissance de calcul et en électricité pour les faire fonctionner, vous voulez absolument un bon rapport qualité-prix. Surtout lorsque les hyperscalers s'étendent à cette échelle, le coût est un problème central.

Un exemple hypothétique : si je pose une question à Claude et que la réponse coûte 2 cents ; si je pose une question à ChatGPT et que la réponse coûte 1 dollar. Même si Claude n'a que 95 % de l'intelligence de ChatGPT, je l'utiliserai probablement. Parce que je peux poser plus de questions et obtenir une réponse à un coût inférieur au final.

Donc, le coût d'accès à cette intelligence est très important. Cette semaine même, Microsoft et Uber ont annoncé qu'elles réduisaient en fait leur utilisation de Claude Code, car leur budget annuel a été épuisé en environ 4 mois.

Vous pouvez le voir dans le portefeuille de Gavin : Cerebras, Positron, Astera Labs. Il identifie des goulots d'étranglement d'infrastructure très spécifiques, puis fait un simple pari : si cette entreprise résout ce goulot d'étranglement, si la performance par watt atteint un certain niveau, si le coût par token baisse à un certain niveau, alors les laboratoires d'IA achèteront plus de GPU, plus de produits ou plus de ce genre de choses.

Donc sa théorie est en fait simple, même si la technologie spécifique est complexe : je regarde uniquement les goulots d'étranglement au niveau de l'infrastructure IA. Si je peux trouver une entreprise qui améliore les performances par watt et rend les tokens moins chers, je parie qu'elle vaudra beaucoup à l'avenir, soit par une IPO, soit par une acquisition à un prix élevé.

Josh : Dans cette partie, si quelqu'un veut répliquer les transactions de Gavin, il doit connaître quelques noms : Astera Labs, Cerebras, SiFive et Positron. Ces quatre entreprises sont clés dans ce segment.

La quatrième et dernière orientation est la combinaison de l'énergie et de l'espace. Comme nous l'avons dit plus tôt, le réseau électrique terrestre limite largement l'approvisionnement en énergie, et il est très difficile de construire de nouvelles sources d'énergie. Le podcast mentionne une statistique : environ 40 % des nouveaux centres de données font face à une forte opposition, les gens font du lobbying, protestent, ne veulent pas que ces centres de données soient construits.

Il existe deux types de solutions. La première est de créer de l'énergie « hors de la boîte », c'est-à-dire de l'énergie portable. Vous pouvez amener le centre de données et l'alimenter avec une petite unité d'énergie. Blue Marble, très appréciée par Leopold, en fait partie.

L'autre type est le calcul orbital, sur lequel Gavin se concentre beaucoup actuellement. La plus grande et la plus centrale entreprise dans ce domaine est bien sûr SpaceX. C'est la seule entreprise capable de devenir l'autoroute vers l'espace, de placer des charges utiles en orbite, des baies et des centres de données en orbite basse, et de générer suffisamment d'intelligence et d'électricité pour les renvoyer.

Je pense que SpaceX est plus important que SpaceX lui-même. Je suis un peu surpris que le portefeuille de Gavin ne contienne pas plus d'actions spatiales, étant donné qu'il pense que c'est une énorme industrie. Peut-être que la réalité est qu'il est encore trop tôt, et que SpaceX est le pivot qui déverrouille cette industrie.

À suivre de près : le lancement de Starship V3. Nous venons de voir un lancement de Starship la semaine dernière, qui s'est bien passé. Si Starship ne fonctionne pas vraiment, il n'y aura pas d'énergie spatiale, ni de baies en orbite. C'est une condition nécessaire, car les charges utiles à lancer sont énormes. Donc SpaceX est une entreprise à surveiller absolument, même si de nombreuses entreprises de second ordre seront affectées.

Pourquoi ce n'est pas une autre bulle internet ?

Josh : Ensuite, les gens demanderont sûrement : pourquoi ce n'est pas juste une autre bulle internet ? Gavin s'est vu poser cette question de nombreuses fois, et il a une réponse très forte, et je le crois en grande partie, son argumentation est convaincante.

Sa logique est à peu près la suivante : la bulle internet de 2000 était alimentée par la dette. Beaucoup de gens ont emprunté énormément d'argent pour investir dans des théories non éprouvées et des produits que personne n'utilisait ou n'aimait vraiment.

Si on compare avec le super-cycle de l'IA dont parle Gavin, rien que pour OpenAI et Anthropic, on estime qu'elles pourraient atteindre 200 milliards de dollars de chiffre d'affaires annuel cette année. Et ce n'est pas de l'argent inventé, c'est de l'argent déjà engagé par contrat, dont une grande partie, environ 40 à 60 % selon le podcast, a déjà été prépayée par des entreprises et des clients de détail.

En d'autres termes, de l'argent circule vraiment.

En ce qui concerne la puissance de calcul des GPU, sans regarder les laboratoires de modèles, regardez qui achète les produits de Nvidia. Google, Microsoft, Amazon et Meta paient avec leurs propres réserves de trésorerie, sans emprunter. Amazon vient d'atteindre la limite de son cash-flow libre, si elles commencent à emprunter, on pourra s'inquiéter. Mais pour l'instant, l'important est qu'elles ne s'endettent pas.

Et ce sont parmi les entreprises les plus performantes et, d'une certaine manière, les plus intelligentes au monde, étant donné leur valorisation, leur taille et leur position. En comparaison, lors de la bulle internet, il y avait une multitude d'entreprises inconnues qui ont levé beaucoup d'argent et l'ont brûlé de manière irrationnelle. Dans ce cycle, ce sont les entreprises les plus intelligentes au monde qui dépensent de l'argent sans effet de levier.

Les rapports trimestriels dont nous avons parlé récemment dans le podcast montrent également que les bénéfices s'optimisent autour de ces actions, que les modèles continuent de progresser, de devenir plus intelligents. Ainsi, l'argument central de Gavin est : ce n'est pas la bulle internet, car elle n'est pas alimentée par de l'argent emprunté ; et en même temps, les goulots d'étranglement dont nous parlons sont contraints par des atomes physiques.

Acheter un tas de puces mémoire et de GPU est une chose, mais Nvidia ne peut pas sur-vendre ses GPU, Micron ne peut pas sur-vendre ses puces mémoire pour l'IA, car ils n'ont pas suffisamment d'installations de production de puces. Donc son argument simple est : si vous ne pouvez pas sur-approvisionner l'ensemble du marché, alors ce n'est pas une bulle. Nous sommes limités par le manque de « vendeurs de pelles » pour accomplir cela, et il investit précisément dans ces choses-là.

Un autre bon point : Gavin pense que si TSMC pouvait fournir, Nvidia aurait pu vendre pour 2 à 3 billions de dollars de GPU cette année et l'année prochaine. En d'autres termes, TSMC est un maillon clé dans la frontière de la bulle.

La raison est que si TSMC pouvait satisfaire la demande de ces entreprises, leur fournir autant de puces, cela consommerait des sommes énormes. D'après les graphiques, il n'y a pas encore un grand découplage entre les dépenses d'investissement et le cash-flow opérationnel, les entreprises génèrent encore suffisamment de liquidités pour soutenir la construction.

Mais si TSMC disait demain à Nvidia : nous pouvons tripler notre capacité du jour au lendemain, Nvidia ne refuserait pas, elle commencerait à dépenser des sommes colossales pour acheter des puces. Les autres entreprises seraient également forcées d'emprunter pour acheter ces puces, et là, la bulle des dépenses d'investissement commencerait à grossir et à se découpler du cash-flow opérationnel des entreprises.

Mais parce qu'il y a des contraintes d'approvisionnement à chaque étape, des contraintes sur la mémoire, des contraintes sur la fabrication des puces, des contraintes sur l'énergie, et en particulier les contraintes de TSMC sur les puces avancées, nous n'avons en fait pas les moyens d'accélérer la construction aussi rapidement. Par conséquent, TSMC empêche l'accélération de la bulle.

Tant que la capacité de production de puces de TSMC reste limitée, tant que Samsung et les autres fabricants de puces ne dépassent pas leur part de marché, la croissance est relativement soutenable. Elle semble rapide, mais il y a encore une énorme demande non satisfaite, car nous ne construisons tout simplement pas assez vite. Tant que cette dynamique persiste, je pense que c'est temporairement acceptable.

EJ : Un autre point : vous ne pouvez pas supposer que la demande reste statique, car elle ne le sera pas. La demande liée à l'IA croît de façon exponentielle, et plus vite que la production de ces puces.

Les seules façons dont je peux imaginer que cette théorie soit infirmée sont deux. Premièrement, quelqu'un reproduit miraculeusement ASML, et soudain, il y a une foule de concurrents d'ASML. Pour ceux qui ne connaissent pas ASML : il fabrique des machines d'une valeur d'environ 400 millions de dollars dont TSMC et toutes les principales fonderies ont besoin.

Le podcast dit qu'ASML n'a qu'une équipe en Norvège qui fabrique ces choses, et le cycle est très long, le carnet de commandes est déjà plein pour environ 5 ans.

Deuxièmement, nous créons un type complètement différent de LLM, qui n'a pas besoin d'autant de GPU, ni d'autant de mémoire. Mais pour l'instant, nous ne voyons aucun signe de cela.

J'ai vu une nouvelle aujourd'hui sur SK Hynix. C'est le principal fabricant et fournisseur de mémoire pour les GPU de Nvidia, c'est presque le leader incontesté de la mémoire pour l'IA.

Il recevrait actuellement des offres d'environ 50 à 100 milliards de dollars de la part de Google et Microsoft, les deux entreprises voulant verrouiller à l'avance l'approvisionnement des trois prochaines années pour payer l'équipement nécessaire à l'expansion de sa production.

Cela montre à quel point ces grandes entreprises sont avides de mémoire, et ce n'est qu'un sous-segment des composants de l'IA. SK Hynix répondrait plutôt : je ne veux pas vous garantir l'approvisionnement, je vais simplement augmenter mes prix. Sa marge opérationnelle est d'environ 70 %, ce qui est presque inconcevable dans l'industrie des semi-conducteurs.

Il est donc logique que Gavin soit all-in. Cela ne ressemble pas à une bulle, même si le marché peut réagir ainsi à court terme. Avant d'enregistrer aujourd'hui, j'ai ouvert mon portefeuille d'actions, et presque tout était en baisse, mais c'était plus une réaction émotionnelle.

La cible directionnelle de cette histoire est : nous n'aurons besoin que de plus de GPU, de plus de puces semi-conductrices, et l'offre est insuffisante, les fabricants aussi.

Le portefeuille d'investissement de Gavin

Josh : La conclusion est : l'électricité et les wafers. Juste ces deux-là. Ce sont deux murs de briques, deux facteurs limitants qui nous empêchent d'accélérer trop vite. Tant que l'électricité et les wafers ont de la valeur, que la demande est forte et l'offre limitée, il y a encore de belles perspectives.

Si vous voulez un TL;DR du portefeuille de Gavin, je peux lire ses plus grosses positions. Encore une fois, ce n'est pas un conseil en investissement. C'est ce que Gavin détient, pas ce que nous détenons. Je ne sais pas si ces actions vont monter, baisser ou stagner.

Sa plus grosse position est contre-intuitive : une position de puts sur le QQQ. Dans l'ensemble, il est plutôt baissier sur le marché, ce qui est très notable. La deuxième est Astera Labs, environ 7,4 % du portefeuille, ticker ALAB. La troisième est Unity, l'entreprise de logiciels 3D.

Il y en a beaucoup d'autres : Ciena, Micron, Nvidia, Amazon, Lumentum, Alphabet, Coherent, Roblox, EchoStar, Twilio, Wayfair. Cette personne investit dans tout.

Si vous êtes intéressé, vous pouvez consulter son 13F. C'est la vision de Gavin : les goulots d'étranglement sont dans l'électricité et les wafers. Tant que ces contraintes persistent, c'est fondamentalement une tendance haussière. EJ, comment digères-tu ces informations ? Qu'en ferais-tu ?

EJ : Depuis la publication du 13F de Leopold, le marché est très agité. En enregistrant cet épisode, je me rends de plus en plus compte que Gavin est un peu comme un Leopold plus âgé et plus sage. Il est dans cette industrie depuis longtemps. Peut-être qu'il n'a pas 13 milliards de dollars d'AUM, mais j'ai l'impression qu'il sera encore là dans 10 ans.

Si vous écoutez ceci en pensant : je ne veux pas suivre chaque minute, chaque heure, chaque jour l'avancement de l'IA, je veux juste placer mon argent et voir comment il évolue dans les prochains mois ou années. Alors le portefeuille de Gavin pourrait être une bonne référence. Bien sûr, ce n'est pas un conseil en investissement.

Il adopte une approche plus prudente, à plus long terme et plus tournée vers l'avenir. Si ses tendances se concrétisent, comme pour ses premiers paris sur Nvidia et Cerebras, il pourrait y avoir des rendements exponentiels dans les prochaines années. Mais tout cela repose sur son point de vue central : nous ne sommes pas dans une bulle.

Je suis curieux de savoir si les auditeurs sont d'accord. Évidemment, la plupart des gens ne seront pas aussi techniques, aussi profonds que Gavin. Mais après avoir écouté cet épisode, pensez-vous que nous sommes dans une bulle ? Ou pas ? Quels sont les arguments pour et contre ? Y a-t-il quelque chose que nous avons manqué ? Josh, avant de terminer, penses-tu que nous sommes dans une bulle maintenant ?

Josh : Je pense que nous sommes certainement dans une bulle. La question est : à quel stade de la bulle sommes-nous, cela peut être discuté. Pour l'instant, cela ressemble plus à un stade précoce, donc espérons que cela continue. Selon Gavin, tant que TSMC continue de limiter la capacité de production de puces, nous allons bien.

Voilà la perspective globale. Nous avons déjà parlé de Leopold, dont le succès se mesure actuellement en trimestres ; maintenant nous parlons de Gavin, dont le succès se mesure en décennies. Beaucoup de gens trouveront peut-être leur propre réponse quelque part entre les deux.

Questions liées

QQuelle est la stratégie d'investissement de Gavin Baker concernant l'IA ?

ALa stratégie de Gavin Baker consiste à investir dans les "vendeurs de pelles" de l'infrastructure d'IA, c'est-à-dire les goulots d'étranglement physiques comme l'électricité, les semi-conducteurs (puces, wafer), la mémoire et la connectivité. Il adopte une approche en barbell : d'un côté, il investit massivement dans ces actifs de base (comme Nvidia, Micron, Astera Labs), et de l'autre, il se protège contre un risque baissier général du marché via des puts sur le QQQ. Il pense que le cycle de l'IA est un super-cycle et non une bulle, car la demande est soutenue par de grandes entreprises solvables et limitée par des contraintes physiques d'approvisionnement.

QSelon l'article, pourquoi l'IA n'est-elle pas considérée comme une bulle comparable à celle des dot-com ?

ASelon l'article et Gavin Baker, l'IA n'est pas une bulle comme celle des dot-com pour plusieurs raisons principales : 1) Les acheteurs principaux (Google, Microsoft, Amazon, Meta) utilisent leurs trésoreries, et non de la dette, pour financer leurs investissements. 2) Les revenus des entreprises d'IA (comme OpenAI et Anthropic) sont réels et substantiels, avec une grande partie prépayée par contrat. 3) L'offre est physiquement limitée par des goulets d'étranglement comme la capacité de production des puces (TSMC, ASML), l'approvisionnement en mémoire (HBM) et l'énergie. L'incapacité à surproduire rapidement ces composants empêche une expansion excessive et un éclatement soudain de type bulle.

QQuels sont les principaux goulots d'étranglement ("bottlenecks") dans l'infrastructure de l'IA identifiés par Gavin Baker ?

AGavin Baker identifie trois principaux goulots d'étranglement physiques pour l'infrastructure de l'IA : 1) L'ÉNERGIE (Watts) : l'approvisionnement en électricité pour alimenter les centres de données. 2) Les PUCES/SEMI-CONDUCTEURS (Wafers) : la capacité de fabrication des puces avancées, limitée par des acteurs comme TSMC et les machines d'ASML. 3) La BANDE PASSANTE MÉMOIRE et la CONNECTIVITÉ : nécessaires pour transférer des données entre les GPU et la mémoire (ex: HBM). Il met également en avant l'importance croissante du calcul pour l'inférence ("inference"), qui pourrait représenter 5 à 10 fois le coût de l'entraînement préalable des modèles.

QQuelles sont quelques-unes des sociétés spécifiques dans lesquelles Gavin Baker investit pour jouer sur ces goulots d'étranglement ?

APour jouer sur ces goulots d'étranglement, Gavin Baker investit dans des sociétés comme : Astera Labs (ALAB, connectivité entre GPU), Nvidia (puces GPU et calcul accéléré), Micron (mémoire), Cerebras et Positron (puces dédiées à l'inférence). Il investit également dans Unity Software, qu'il voit comme un outil clé pour construire des modèles du monde ("world models") pour l'entraînement des robots et des futurs LLMs. Son portefeuille montre aussi une conviction pour l'infrastructure souveraine et la vitesse de déploiement physique.

QQuelle est la position de couverture (hedge) de Gavin Baker contre le risque de marché général, et pourquoi l'utilise-t-il ?

AGavin Baker détient une position significative en puts (options de vente) sur le fonds QQQ, qui suit l'indice Nasdaq 100. Cette position est une couverture contre un éventuel repli général du marché. Il l'utilise car, bien qu'il soit très convaincu par la thèse du super-cycle de l'IA et par les performances de ses investissements ciblés dans les infrastructures, il reste prudent quant à la santé globale du marché boursier. Cette approche lui permet de se protéger si une correction boursière générale venait à affecter temporairement même les bons actifs.

Lectures associées

Apple réinvente la compression d'images avec l'IA : La même qualité pour des fichiers trois fois plus petits

La compression d’image entre dans une nouvelle ère avec l’arrivée de l’IA. En février 2025, le groupe JPEG a officiellement lancé JPEG AI, le premier standard international de codage d’images basé sur l’apprentissage automatique. Toutefois, même cette avancée reste éloignée de la « compression perceptuelle », qui optimise l’expérience visuelle humaine plutôt que des indicateurs mathématiques comme le PSNR. Apple répond à ce défi avec PICO (Perceptual Image Codec), un codec conçu pour plaire à l’œil humain. Il résout trois problèmes clés : 1. **Vitesse** : grâce à un modèle de contexte « one-shot », il évite la lenteur de l’encodage autorégressif classique. 2. **Hallucinations** : une fonction de perte dédiée (TextFidelityLoss) préserve la précision du texte, réduisant de moitié les erreurs dans ces zones. 3. **Artefacts** : une perte spécifique (TilingArtifactLoss) supprime les différences de couleur entre les blocs d’image. Lors d’un test subjectif à grande échelle, PICO a réduit la taille des fichiers de 30 à 43 % par rapport aux codecs comme AV1, VVC ou JPEG AI, à qualité visuelle équivalente. Sur un iPhone 17 Pro Max, il code une photo 12 MP en 230 ms et la décode en 150 ms. Bien que moins efficace sur les images synthétiques (dessins, schémas), PICO marque un tournant en priorisant systématiquement la perception humaine, ouvrant la voie à une compression plus intelligente et intégrée dans nos appareils.

marsbitIl y a 1 h

Apple réinvente la compression d'images avec l'IA : La même qualité pour des fichiers trois fois plus petits

marsbitIl y a 1 h

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

L'entreprise leader des grands modèles d'IA à Shanghai, MiniMax, a déposé le 29 mai un dossier de préparation à l'introduction en bourse auprès de la CSRC, visant une entrée sur le marché A, avec Citic Securities comme conseiller. Elle concourt ainsi avec Zhipu AI pour devenir la première entreprise de grands modèles cotée sur le marché A. MiniMax, fondée en janvier 2022 et déjà cotée à Hong Kong depuis janvier de cette année, a vu son cours s'envoler de 409,09% depuis son introduction, atteignant une capitalisation d'environ 227,5 milliards de yuans. Elle intégrera l'indice Hang Seng Tech à partir du 8 juin. Cette performance s'appuie sur des données financières solides. L'entreprise a annoncé un taux de croissance de son revenu annuel récurrent (ARR) supérieur à 100% sur les deux derniers mois. Son ARR dépasse désormais 300 millions de dollars. Pour l'exercice 2025, son chiffre d'affaires s'est élevé à environ 535 millions de yuans, avec une marge brute améliorée à 25,4%, bien qu'elle ait enregistré une perte nette ajustée d'environ 1,69 milliard de yuans. Sur le plan des produits, MiniMax a lancé plusieurs versions de son modèle phare (M2.5, M2.6, M2.7) et a annoncé la prochaine sortie de MiniMax-M3. Cette nouvelle version utilise un mécanisme d'attention éparse propriétaire (MiniMax Sparse Attention) permettant des gains significatifs de vitesse de traitement. L'entreprise propose également Mavis, un produit Agent amélioré. Dans un contexte de concurrence intense et d'investissements élevés en puissance de calcul, les principaux acteurs chinois des grands modèles, tels que MiniMax, Zhipu AI, Moonshot AI et Stepfun, accélèrent leurs démarches d'introduction en bourse pour diversifier leurs sources de financement.

marsbitIl y a 1 h

Le leader des grands modèles de Shanghai lance son introduction en bourse sur le marché A

marsbitIl y a 1 h

Le PDG de Bit Digital : Pourquoi je continue d'augmenter mes positions en ETH

Le PDG de Bit Digital, Sam Tabar, explique pourquoi il continue d'accumuler de l'ETH. Il base sa décision sur l'analyse des données et non sur les cycles ou les récits du marché, estimant que l'actif est sous-évalué. Il rejette l'idée de considérer l'ETH comme une simple monnaie, un cadre plus adapté au Bitcoin. L'Ethereum, selon lui, a choisi l'utilité en créant une couche de règlement programmable sur laquelle le monde construit activement. Sa valeur réside dans cette utilité institutionnelle concrète : émission de stablecoins, tokenisation de bons du Trésor américain et règlement de transactions d'agents IA. Tabar répond aux critiques sur la fragmentation de l'écosystème en soulignant que le capital institutionnel n'a pas besoin qu'Ethereum gagne une guerre de narration. Il a besoin d'une infrastructure fiable et éprouvée, ce qu'Ethereum fournit déjà à grande échelle, combinant calcul (via des partenariats comme WhiteFiber) et règlement. Il conteste l'idée que le potentiel de l'ETH soit épuisé, arguant que le vrai catalyseur de la revalorisation sera la demande institutionnelle, qui suivra la mise en place des cadres réglementaires et de garde adaptés. Enfin, il justifie son achat par un devoir fiduciaire : l'ETH est un actif générateur de revenus (avec une marge brute de 94,7% pour le staking au premier trimestre) qui sécurise la principale plateforme de contrats intelligents, traitant des milliers de milliards de dollars de transactions. Il n'a pas besoin qu'il devienne une monnaie de réserve mondiale, seulement qu'il continue son travail actuel à un prix qu'il juge attractif.

marsbitIl y a 3 h

Le PDG de Bit Digital : Pourquoi je continue d'augmenter mes positions en ETH

marsbitIl y a 3 h

Trading

Spot
Futures
活动图片