Huang Renxun défie publiquement Google et Amazon : l'activité des puces dépend-elle entièrement d'Anthropic ?

marsbitPublié le 2026-04-21Dernière mise à jour le 2026-04-21

Résumé

Jensen Huang, PDG de Nvidia, s’est livré à une discussion franche lors d’un podcast, défendant la position dominante de son entreprise dans l’écosystème mondial de l’IA. Il présente Nvidia comme transformant simplement « des électrons en tokens », soulignant la complexité derrière la génération de valeur via l’IA. Il critique vivement les puces personnalisées de Google (TPU) et d’Amazon (Trainium), affirmant que leur croissance serait nulle sans le soutien d’Anthropic. Huang admet également avoir sous-estimé les besoins en calcul des startups d’IA comme OpenAI, une erreur qu’il ne répétera pas. Sur les restrictions à l’exportation vers la Chine, il les juge irréalistes et contre-productives, avertissant qu’elles pourraient favoriser l’autonomie chinoise et faire perdre aux États-Unis leur leadership technologique. Enfin, il explique l’acquisition de Groq par la différenciation des tokens selon la vitesse de réponse, visant un marché premium. Sa stratégie : contrôler chaque étape critique de la chaîne de valeur de l’IA.

Par | CLS de Chanlian She

En avril 2026, Huang Renxun, PDG de Nvidia, est apparu fréquemment dans les principaux centres de pouvoir.

Du Forum de Davos à la conférence GTC, il a répété au monde un message central : l'IA n'est pas seulement une révolution technologique, mais aussi le plus grand projet d'infrastructure de l'histoire de l'humanité.

Cependant, une longue conversation le 15 avril avec Dwarkesh Patel, animateur d'un podcast de la Silicon Valley, a déchiré la façade du contrôle rythmique de Huang Renxun.

Au cours de près de deux heures d'échanges, Huang Renxun a non seulement publiquement défié le TPU de Google, admis avoir commis une grave erreur stratégique, mais a également avancé l'idée de tokens à différents niveaux et a émis une réfutation sans précédent des contrôles à l'exportation.

Dans cette conversation sans script, Huang Renxun ne défendait pas seulement la valorisation de Nvidia, mais luttait farouchement pour préserver la position dominante de l'entreprise en tant que passage obligé de la puissance de calcul mondiale.

Redéfinir Nvidia : des électrons entrent, des tokens sortent

Beaucoup s'inquiètent que si les logiciels d'IA deviennent aussi ordinaires et bon marché que l'eau et l'électricité, les puces de Nvidia pourraient aussi perdre de leur importance. Huang Renxun a répondu à cette inquiétude avec un modèle ultra-simple : le travail de Nvidia est "d'entrer des électrons, de sortir des tokens".

Ici, les "électrons" font référence à l'énergie électrique la plus brute, l'énergie de base qui alimente le fonctionnement des ordinateurs. Les tokens peuvent être compris comme des fragments de langage ou des unités logiques générés par l'IA.

Il estime que rendre chaque mot, chaque logique généré par l'IA plus précieux est un processus extrêmement complexe, difficile à remplacer facilement.

Pour consolider cette position, la stratégie de Nvidia est de "faire le plus de choses nécessaires, tout en en faisant le moins possible". Tout ce qui n'a pas besoin d'être fait en interne est confié à des partenaires de l'écosystème, tandis que Nvidia s'attaque au noyau technologique le plus difficile.

Cette stratégie a donné à Nvidia un pouvoir absolu dans la chaîne d'approvisionnement. Les engagements d'achat de Nvidia approchent actuellement 100 milliards de dollars et pourraient même dépasser mille milliards à l'avenir.

Huang Renxun a déclaré sans ambages que les partenaires sont prêts à investir dans la construction d'usines pour lui parce que Nvidia a la capacité absolue de transformer cette capacité de production en demande mondiale.

Fait intéressant, Huang Renxun a souligné que le véritable goulot d'étranglement de l'expansion de la puissance de calcul n'est pas la fabrication des puces. Il estime que les problèmes technologiques des semi-conducteurs peuvent tous être résolus en deux ou trois ans, mais que le goulot d'étranglement le plus difficile est en réalité les "plombiers et électriciens" dans les infrastructures de base. Il a même proposé d'inviter des plombiers à la prochaine conférence GTC de Nvidia l'année prochaine.

De plus, plus que le matériel, il s'inquiète de la politique énergétique, car sans électricité suffisante, même les usines de calcul les plus avancées ne peuvent pas fonctionner.

Critique des puces sur mesure : Sans Anthropic, la croissance du TPU serait de 0

En parlant des puces sur mesure (ASIC) des concurrents, Huang Renxun s'est montré très agressif. Il a directement nommé le TPU de Google et le Trainium d'Amazon, et a publiquement défié ces derniers de faire des tests de performance. Il a raillé que les avantages de coût de 40% annoncés par les concurrents ne tiennent pas debout.

Il a ensuite révélé les difficultés commerciales des concurrents. Huang Renxun pense que ces puces spécialisées, bien que rapides pour certains calculs fixes, manquent de flexibilité et ne peuvent pas suivre l'évolution des algorithmes d'IA, qui changent de dizaines de fois par an. Plus crucial encore, il estime qu'il n'existe tout simplement pas un marché massif pour les puces sur mesure. Il a déclaré sans détour que sans le soutien du gros client Anthropic, la croissance du TPU et du Trainium est en réalité nulle.

Cependant, Huang Renxun a aussi rarement fait son autocritique. Il a admis avoir manqué la meilleure fenêtre d'investissement pour OpenAI et Anthropic. La raison était qu'à l'époque, il avait sous-estimé l'appétit féroce de ces laboratoires de modèles pour d'énormes investissements en puissance de calcul.

Il a déclaré que c'était son erreur de jugement, pensant à l'époque que ces laboratoires pourraient survivre avec du capital-risque, mais en réalité, ils devaient chercher un soutien massif de type grand groupe. Il a souligné qu'il ne referait plus la même erreur.

Reconnaissance du marché chinois : Réfutation des contrôles à l'exportation

Sur la question des contrôles à l'exportation vers la Chine, l'émotion de Huang Renxun était la plus vive.

Il a plusieurs fois interrompu l'animateur, qualifiant de "fou" de comparer l'IA aux armes nucléaires. Il estime que la Chine possède plus de 60% de la capacité mondiale de fabrication de puces et un vaste réservoir de talents en recherche en IA, et que tenter de limiter l'accès de la Chine aux puces est totalement irréaliste.

Il a lancé un avertissement sévère aux décideurs politiques. Huang Renxun a souligné que les politiques restrictives obligent au contraire la Chine à accélérer le développement de son industrie de puces locales, poussant tout l'écosystème de l'IA vers des architectures internes.

Son cauchemar est que si à l'avenir, tous les modèles d'IA mondiaux sont optimisés pour du matériel non américain, les États-Unis perdront complètement leur leadership technologique.

Huang Renxun est convaincu que la concurrence est la garantie de la leadership. La Chine est actuellement l'un des plus grands contributeurs mondiaux aux modèles open source, et ces成果 fonctionnent majoritairement sur l'architecture technologique de Nvidia. Abandonner par peur cet énorme marché nuirait non seulement aux profits des entreprises américaines, mais ferait perdre aux États-Unis l'opportunité de définir les standards technologiques mondiaux.

La logique sous-jacente de l'acquisition de Groq : Les tokens doivent être classés par niveau

À la fin de l'entretien, Huang Renxun a expliqué les considérations commerciales profondes de l'acquisition de Groq par Nvidia.

Auparavant, Nvidia avait testé dans des simulateurs diverses architectures de puces exotiques, constatant qu'aucune n'était aussi performante que l'architecture existante. Mais l'acquisition de Groq était due à un changement de la demande du marché : les tokens ont commencé à être classés par niveau.

Par "classés par niveau", il signifie que différents clients ont des besoins différents en termes de vitesse de réponse de l'IA. Huang Renxun a donné l'exemple des ingénieurs logiciel ayant besoin d'une efficacité extrême : si la réponse générée par l'IA peut être plus rapide d'une seconde, ils sont prêts à payer un prix plus élevé.

La technologie de Groq, bien que son débit total ne soit pas élevé, l'emporte par sa vitesse de réponse extrêmement rapide. Nvidia entre ainsi sur le marché des "tokens haut de gamme", permettant une stratification des prix des services en fonction de la vitesse de réponse.

L'ensemble de la longue conversation révèle un fait : la collaboration de Huang Renxun avec TSMC depuis 30 ans sans même besoin de contrat juridique, cet écosystème basé sur la confiance est son atout. Chaque décision qu'il prend, qu'il s'agisse de défier publiquement ses concurrents ou de plaider avec force dans la tourmente des restrictions, n'a qu'un seul objectif :

S'assurer que chaque chemin dans le monde qui transforme les électrons en tokens intelligents passe par Nvidia.

Source de l'article :Jensen Huang – Will Nvidia’s moat persist?Dwarkesh Patel, YouTube

Questions liées

QQuel est le point de vue de Jensen Huang sur la position de Nvidia dans l'industrie de l'IA ?

AJensen Huang considère que Nvidia est essentielle dans la transformation de l'énergie électronique en tokens d'IA, un processus complexe difficile à remplacer. Il souligne que Nvidia se concentre sur les technologies de base difficiles et collabore avec des partenaires pour d'autres aspects, consolidant ainsi sa position dominante dans la chaîne d'approvisionnement mondiale.

QPourquoi Jensen Huang critique-t-il les puces personnalisées comme le TPU de Google et le Trainium d'Amazon ?

AHuang affirme que ces puces personnalisées manquent de flexibilité face à l'évolution rapide des algorithmes d'IA et que leur croissance dépend fortement de clients comme Anthropic. Il remet en question leurs prétendus avantages en matière de coûts et les défie de réaliser des tests de performances.

QQuelle est la position de Jensen Huang concernant les restrictions à l'exportation de puces vers la Chine ?

AHuang s'oppose vivement aux restrictions, les qualifiant d'irréalistes et contre-productives. Il avertit que cela pourrait accélérer le développement de l'industrie des puces en Chine et mener à une perte de leadership technologique pour les États-Unis, tout en privant les entreprises américaines d'un marché crucial.

QQuelle erreur stratégique Jensen Huang admet-il avoir commise ?

AHuang reconnaît avoir sous-estimé l'appétit des laboratoires de modèles d'IA, comme OpenAI et Anthropic, pour d'importants investissements en calcul. Il pensait qu'ils pourraient survivre avec du capital-risque, mais il admet que c'était une erreur de jugement et qu'il ne la répétera pas.

QQuelle est la logique derrière l'acquisition de Groq par Nvidia selon Jensen Huang ?

AL'acquisition de Groq est motivée par la différenciation des tokens en fonction de la vitesse de réponse. Groq excelle dans la génération rapide de tokens, permettant à Nvidia de cibler un marché haut de gamme où les clients sont prêts à payer plus pour une réponse plus rapide de l'IA.

Lectures associées

Comment bien mener une recherche : cultiver les compétences qui peuvent être réellement « pratiquées délibérément »

Personne ne vous a jamais vraiment appris à faire de la recherche. On vous donne un bureau, un problème choisi par d'autres, et des instructions vagues pour "produire quelque chose de nouveau". Ainsi, la plupart des gens rétroconçoient le métier à partir de ce qu'ils voient (articles, posts), apprenant à *sembler* chercheurs plutôt qu'à en *devenir*. Les véritables compétences en recherche sont un empilement de micro-compétences, presque toutes cultivables par la pratique délibérée. **Choisir ses propres problèmes.** Nous absorbons souvent des problèmes (du superviseur, des tendances) sans en comprendre le raisonnement sous-jacent, nous plaçant en retard face à des concurrents nombreux. John Schulman recommande de choisir un résultat que l'on souhaite réellement atteindre et de raisonner à rebours pour concevoir les expériences. Cette approche mène à l'originalité. Le "bon goût" est un muscle : prédire les résultats d'expériences, deviner les conclusions d'articles à partir des méthodes, noter quelles avancées resteront pertinentes, puis vérifier. **Améliorer ses sources.** S'alimenter aux mêmes sources (arXiv, discussions) génère les mêmes idées que tout le monde. Les archives anciennes sont sous-estimées : les idées clés (MoE, LSTM) sont souvent des réinventions. Lire des textes fondateurs comme "The Bitter Lesson" de Sutton ou le discours de Shannon sur la pensée créative est crucial. La **largeur** (neurosciences, conception de mécanismes, statistiques, architecture matérielle) est aussi importante que la profondeur. Lisez les **articles eux-mêmes**, surtout les annexes et les sections sur les limites. **Tout noter.** L'écriture révèle les failles des idées qui semblaient matures. C'est le mécanisme de défense le moins cher contre l'auto-tromperie, un point souligné par Feynman. Darwin notait systématiquement les faits contredisant sa théorie, craignant que sa mémoire ne les efface. Tenez un journal : hypothèses, paramètres, attentes, résultats, connaissances révisées. Relire ses notes d'il y a un mois est une leçon d'humilité sans égale.

marsbitIl y a 44 mins

Comment bien mener une recherche : cultiver les compétences qui peuvent être réellement « pratiquées délibérément »

marsbitIl y a 44 mins

Le prix de Backpack bondit de plus de 150 % en deux semaines

L'article traite de la forte hausse du jeton BP de l'échange Backpack, dont le prix a été multiplié par plus de 2,5 depuis début juin pour atteindre environ 0,475 USD. Cette performance est principalement attribuée au lancement de Backpack Securities, une plateforme de courtage en actions américaines régulée qui permet également la tokenisation d'actifs traditionnels comme les actions. L'introduction du produit tokenisé SPCX, adossé à des actions SpaceX, a généré un volume de transactions important et illustre la stratégie de Backpack : créer un pont entre les marchés traditionnels et la finance décentralisée (DeFi) sur Solana. Le modèle économique du jeton BP, avec une émission totale de 10 milliards d'unités, est également mis en avant. Il se distingue par une distribution initiale entièrement réservée à la communauté via des airdrops, et par un mécanisme de "conversion en actions" : les utilisateurs qui stakent leurs BP pendant au moins un an obtiennent le droit de les convertir en actions de la société lors d'une future introduction en bourse (IPO). Actuellement, environ 66% des jetons en circulation sont stakés. En résumé, la récente valorisation de BP semble davantage portée par l'expansion concrète de ses services (courtage et tokenisation d'actifs réels) et par les utilités à long terme de son jeton, que par une simple spéculation à court terme.

marsbitIl y a 59 mins

Le prix de Backpack bondit de plus de 150 % en deux semaines

marsbitIl y a 59 mins

Entrée totale dans l'ère de l'IA : Alipay mise sur la conversation, WeChat maintient le social

En mai 2026, Alipay annonce avoir traité plus de 300 millions de paiements via IA. Peu après, WeChat ouvre l'accès à l'IA pour ses mini-programmes, suscitant des débats sur la confidentialité du code source. Ces annonces marquent deux visions divergentes de l'intégration de l'IA. Alipay teste "Project Treasure", une version redéfinie centrée sur l'interface conversationnelle. L'utilisateur formule une demande complexe (ex: commander un taxi et un café) en une phrase, et l'IA exécute toutes les étapes en arrière-plan. Après un échec avec une application autonome, Alipay a opté pour une transition en douceur au sein de son application existante, visant à "changer l'oiseau sans vider la cage". Pour les services non adaptés, l'IA utilise une technique de "lecture d'écran" pour simuler les actions utilisateur. WeChat adopte une approche plus prudente et intégrée. Son agent IA sera étroitement lié aux fonctionnalités sociales (chats, comptes officiels, Chaînes) plutôt que d'avoir une interface dédiée. L'IA agit comme un assistant contextuel au sein des conversations de groupe, préservant l'expérience sociale centrale. Pour comprendre les mini-programmes, WeChat propose deux modes aux développeurs : l'analyse du code source ("Mode automatique") ou la création d'interfaces standardisées ("Mode développement"), deux options exigeantes. La divergence est cruciale pour l'écosystème des mini-programmes. La solution "lecture d'écran" d'Alipay intègre passivement tous les services, poussant peut-être les commerçants à s'adapter. L'exigence d'accès au code source par WeChat pourrait défavoriser les petits développeurs, risquant de centraliser l'écosystème. Alipay a également lancé "Token Pay" et "AI Wallet" pour les micro-paiements automatisés, validant une boucle économique fermée pour les agents IA. En définitive, Alipay repense l'entrée vers les services par la conversation, tandis que WeChat cherche à rendre l'IA invisible au sein des interactions sociales. Leur compétition ne porte plus sur les portefeuilles, mais sur qui deviendra l'assistant privilégié auquel l'utilisateur confiera la phrase "Aide-moi".

marsbitIl y a 1 h

Entrée totale dans l'ère de l'IA : Alipay mise sur la conversation, WeChat maintient le social

marsbitIl y a 1 h

Après l'interdiction de Fable 5 par les États-Unis, la valeur de Zhipu AI a bondi de 47 %

Le 15 juin, l'action de Zhipu AI a connu une hausse spectaculaire de 47,6% à Hong Kong, pour finalement clôturer avec une progression de 32,82%. Cette envolée fait suite à deux annonces majeures dans le secteur de l'IA. Le 12 juin, Anthropic a suspendu l'accès mondial à ses modèles phares Claude Fable 5 et Claude Mythos 5, suite à une directive de contrôle des exportations du gouvernement américain. Cet arrêt soudain a perturbé les flux de travail de nombreux développeurs et entreprises dépendant de ces modèles. Le lendemain, le 13 juin, Zhipu AI a annoncé l'ouverture de son dernier modèle open-source, GLM-5.2, à tous les utilisateurs de son « Coding Plan », avec une publication sous licence MIT prévue la semaine suivante. Ce modèle met l'accent sur les « tâches de long horizon », avec une fenêtre de contexte d'1 million de tokens pour maintenir la cohérence dans les projets complexes et longs. L'événement a mis en lumière un changement dans les priorités de l'industrie : au-delà des performances pures, la stabilité, la disponibilité continue et le contrôle des modèles d'IA deviennent des critères essentiels, surtout lorsqu'ils sont intégrés comme infrastructure critique. L'annonce de Zhipu, promouvant une « intelligence de pointe accessible et non révocable », résonne avec cette nouvelle réalité. Les analystes estiment que cet incident pourrait accélérer l'adoption de modèles locaux et open-source par les entreprises, pour plus de résilience. Le marché réévalue ainsi les acteurs de l'IA, en intégrant désormais dans leur valorisation leur capacité à fournir un accès stable et durable à la technologie.

marsbitIl y a 1 h

Après l'interdiction de Fable 5 par les États-Unis, la valeur de Zhipu AI a bondi de 47 %

marsbitIl y a 1 h

Trading

Spot
Futures
活动图片