Lorsque l'inférence devient une ressource rare, qui en capture la valeur ?

链捕手Publié le 2026-06-08Dernière mise à jour le 2026-06-08

Résumé

L'article souligne le basculement de l'économie de l'IA, où la ressource critique n'est plus l'entraînement des modèles mais l'inférence (exécution). Cette dernière, consommatrice de calcul de façon récurrente et croissante avec l'essor des agents IA, devient le principal goulot d'étranglement et le moteur de valeur. Plusieurs signaux forts l'attestent : la réorganisation des résultats financiers de Nvidia autour des « tokens de service », l'introduction en bourse très attendue de Cerebras (spécialisé dans les puces d'inférence rapide), et les difficultés de capacité rencontrées par Anthropic pour son modèle Claude. Face à cette rareté, la question centrale est de savoir qui capturera la valeur dans la pile technologique. L'article analyse deux approches : Venice, une application qui vend de l'inférence avec une garantie de confidentialité mais reste dépendante du coût de la puissance de calcul sous-jacente ; et surtout Hyperbolic. Cette entreprise adopte une stratégie différente : sans posséder de GPU, elle agit comme une couche d'agrégation et de routage intelligent, connectant les offres fragmentées de nombreux fournisseurs de cloud pour offrir aux développeurs la puissance disponible au meilleur prix. En situation de surcapacité potentielle des GPU, ce modèle « sans actifs » qui optimise l'allocation de la ressource rare (l'inférence) pourrait s'avérer plus résilient et profitable que celui des simples détenteurs de matériel. L'enjeu n'est plus de posséder le plus de s...

Auteur : Frank Fu, IOSG

Le trou identifié par David Cahn en 2023 n'a jamais été comblé du côté de l'entraînement. Il l'a été du côté de l'inférence, et le marché ne commence à l'intégrer dans sa valorisation que depuis quelques semaines. Lorsque Nvidia réorganise ses rapports financiers autour des « jetons de service », que l'introduction en bourse de Cerebras affiche 20 fois plus de demandes que d'offres, le débat sur le goulot d'étranglement est clos. La vraie question devient : lorsque l'inférence devient une ressource rare, dans quelle couche de la pile de calcul la valeur va-t-elle se déposer.

I. Suivre le GPU : du problème à 2000 milliards de dollars au problème à 6000 milliards de dollars

En 2023, David Cahn de Sequoia a soulevé la question qui plane sur toute la construction de l'IA : le « problème des 2000 milliards de dollars ». Pour chaque dollar dépensé en GPU, il faut environ un autre dollar pour l'alimenter dans un centre de données. Ainsi, chaque année d'investissement en capital (CapEx) pour les GPU signifie que ces puces devront finalement générer environ 2000 milliards de dollars de revenus pour être amorties. Même avec des hypothèses très généreuses sur les revenus de l'IA, il a constaté un écart de plus de 1250 milliards de dollars entre les « investissements » et « ce que les clients finaux paient réellement ». L'inquiétude était claire : les GPU sont surconstruits, devançant la demande réelle.

Un an plus tard, l'écart ne s'est pas résorbé ; il s'est agrandi. Dans sa suite en 2024, Cahn, avec l'explosion du CapEx des hyperscalers, l'a redéfini comme le « problème des 6000 milliards de dollars ». La logique baissière converge vers une forme familière : la surconstruction conduit à un surplus d'offre, et ce surplus brûlera du capital.

Les deux articles posent la même question : qui va combler ce trou ? La réponse n'est jamais apparue dans les comptes du côté « entraînement ». Elle apparaît du côté de l'inférence (inference), et le marché ne commence à l'intégrer dans sa valorisation que depuis ces dernières semaines.

II. L'IPO de Cerebras et la pression sur l'inférence

Cerebras est entré en bourse jeudi. Cette IPO a été sursouscrite 20 fois, avec un prix fixé près du double de la dernière augmentation de mercredi. La demande ne vient pas d'un pari sur le « prochain tueur de Nvidia », mais de quelque chose de plus simple : le marché commence à réaliser que le vrai goulot d'étranglement dans l'IA est l'inférence, pas l'entraînement.

Le point fort de Cerebras est une architecture de puce qui rend l'inférence extrêmement rapide. Pas l'entraînement, l'inférence. C'est ce qui excite Wall Street. Le marché de l'inférence est récurrent, il se développe avec l'utilisation. Chaque fois que Claude répond à une question, chaque fois qu'un agent exécute une tâche, cela consomme de la puissance de calcul. L'entraînement n'a lieu qu'une fois, l'inférence ne s'arrête jamais.

J.P. Morgan estime la taille du marché de l'inférence à 10 ou 50 fois celle de l'entraînement. Lorsque les machines commencent à exécuter des tâches assignées par d'autres machines, c'est-à-dire une expansion de type agentic (agence), la demande d'inférence ne croît plus avec le nombre d'utilisateurs, mais avec la puissance de calcul elle-même.

III. Nvidia redessine la carte : l'inférence passe en première ligne

Si Cerebras est la prise de conscience du marché, le dernier rapport financier de Nvidia en est la confirmation venue du sommet de la chaîne. Lors de la dernière conférence téléphonique sur les résultats, Jensen Huang a exprimé clairement ce qui était sous-entendu : la demande d'IA croît de manière parabolique. La raison est simple : l'IA agentic est là. L'IA grand public est passée de l'inférence unique, au raisonnement logique, puis à la phase d'agents qui appellent eux-mêmes des outils et orchestrent des tâches. Huang dit : « Les tokens sont maintenant rentables. » À l'ère de l'IA, la puissance de calcul est un revenu et un profit.

Cela redéfinit toute l'industrie. L'entraînement est un coût ponctuel pour construire un modèle, l'inférence est un coût récurrent pour l'exécuter, et aujourd'hui le goulot d'étranglement est dans l'inférence, pas dans l'entraînement.

Nvidia a intégré ce jugement dans sa présentation financière. Elle publie désormais deux plateformes, et non une : Data Center (centre de données) et Edge Computing (informatique de périphérie). Le Data Center (environ 75 milliards de dollars ce trimestre, +92 % en glissement annuel) se décompose en Hyperscale (environ 38 milliards de dollars, +12 % en glissement trimestriel) et ACIE, c'est-à-dire AI Cloud, Industrie et Entreprise (environ 37 milliards de dollars, +31 % en glissement trimestriel). Une toute nouvelle ligne est Edge Computing : 6,4 milliards de dollars, +29 % en glissement annuel, couvrant les terminaux où l'IA agentic et l'IA physique fonctionnent réellement, comme les PC, les postes de travail, les stations de base AI-RAN, les robots et les voitures.

La périphérie représente encore moins de 8 % du chiffre d'affaires total, mais Nvidia l'a élevée au rang de « deuxième plateforme » aux côtés du Data Center. Le signal est clair : l'inférence se scinde en deux fronts, le cloud inference (inférence cloud) dans les centres de données, et l'endpoint inference (inférence en périphérie) sur le terrain, où l'IA doit voir, se déplacer et agir dans le monde physique. La feuille de route suit la même logique : la Vera Rubin, dont les expéditions commencent au troisième trimestre, peut offrir un débit d'inférence jusqu'à 35 fois supérieur à celui de Blackwell ; Huang a également donné un tout nouveau TAM de 2000 milliards de dollars pour le Vera CPU conçu pour les charges agentic. Toutes les entreprises de modèles de pointe devraient basculer intégralement dessus dès le premier jour.

Lorsque l'entreprise la plus valorisée au monde réorganise ses informations financières autour des « jetons de service », le débat sur le goulot d'étranglement est clos. Le reste de cet article discute de qui capte la valeur lorsque l'inférence (et non l'entraînement) devient une ressource rare.

Commençons par une clarification de portée. Sur ces deux fronts, cet article discute du cloud inference, c'est-à-dire des GPU de centres de données loués, fournissant des services d'API de tokens. L'endpoint inference s'exécute sur les puces locales au sein des appareils eux-mêmes (Jetson, RTX, Drive, AI-RAN de Nvidia), sans passer du tout par la pile de location et d'agrégation de GPU sous-jacente. Considérez cela comme un vent favorable qui amplifie toute l'économie de l'inférence et valide l'argument du goulot d'étranglement, et non comme le marché où se situent Hyperbolic et Venice, ces deux-là étant entièrement sur la ligne du cloud.

IV. La compression est déjà là

Anthropic est le canari dans la mine de charbon. L'utilisation dépasse de loin la capacité configurée à l'avance, les plaintes concernant Claude « lobotomisé » inondent le web, avec des réponses limitées, une inférence ralentie, des fenêtres de contexte compressées. La solution est purement une question de puissance de calcul : en mai 2026, Anthropic a repris à SpaceX l'intégralité du centre de données Colossus 1, avec plus de 220 000 GPU Nvidia, plus de 300 mégawatts, et l'a dédié à l'inférence, et non à l'entraînement.

Cette capacité a débloqué une série de modifications des limites, chacune étant un signal. Le 6 mai, Anthropic a doublé la limite de cinq heures de Claude Code, supprimé la limitation de débit aux heures de pointe et augmenté considérablement les limites de taux d'API d'Opus. Le 13 mai, il a encore augmenté la limite hebdomadaire de Claude Code de 50 % (jusqu'au 13 juillet). Puis, à partir du 15 juin, il a fait le contraire de la « générosité » : il a sorti l'utilisation agentic et programmatique (Agent SDK, mode sans tête claude -p, pipelines CI) de l'abonnement forfaitaire pour les placer dans un pool de crédits indépendant et mesuré (20 à 200 dollars par mois, facturés au prix de l'API). Cette dernière étape résume tout l'argument en un seul geste : les agents consomment de l'inférence à une vitesse que l'abonnement forfaitaire n'a pas été conçu pour supporter, donc ils doivent être tarifés selon leur véritable « coût récurrent ».

L'entraînement est une dépense en capital ponctuelle. L'inférence est un coût opérationnel récurrent, qui s'accumule avec intérêts composés à chaque nouvel utilisateur, à chaque nouvel agent.

V. Cette pile : six couches, un goulot d'étranglement

Chaque application d'IA repose sur une chaîne d'approvisionnement qui commence à la fonderie TSMC et se termine au point de terminaison de l'API :

La plupart des entreprises n'en possèdent qu'une seule couche. Nvidia possède le silicium, CoreWeave possède le bare metal, Together AI possède l'optimisation d'inférence, OpenRouter possède le routage d'API de modèle.

Toutes sauf une.

VI. Hyperbolic : la seule entreprise qui s'étend sur trois couches

Hyperbolic a lancé son marché de GPU à la demande en juin 2025. En quelques mois, son nombre de développeurs a dépassé les 200 000+, et ses utilisateurs couvrent des laboratoires d'IA de pointe, la recherche et de grandes plateformes grand public.

Ce qui est intéressant, c'est son architecture.

Hyperbolic ne possède elle-même aucun GPU. Chaque carte provient de neoclouds et de centres de données, notamment CoreWeave, Lambda Labs, Nebius, et des petits opérateurs avec de la capacité inutilisée. Cela semble être une faiblesse, mais c'est en fait un fossé défensif.

En se plaçant entre l'offre et la demande de GPU, Hyperbolic voit des données en temps réel que les autres ne voient pas. Elle sait qui achète quel GPU, à quel prix, et à quel moment. Elle voit la surproduction avant qu'elle ne soit publique, et elle voit la demande s'envoler avant qu'elle n'impacte le marché.

Aujourd'hui, le fossé défensif est précisément cette agrégation multi-cloud. Hyperbolic coud la capacité fragmentée provenant de dizaines de clouds et de centres de données indépendants en un pool unifié et standardisé, permettant aux développeurs de louer le GPU disponible le moins cher, n'importe où, sans avoir à négocier avec chaque opérateur ni à gérer un tas de comptes. Plus elle intègre de clouds, plus la liquidité est profonde, plus les données de prix sont riches. Plus loin, l'équipe explore comment utiliser ces données pour modéliser les courbes de prix des GPU, et finalement engager son propre capital pour lisser l'offre et la demande, jouant le rôle de teneur de marché pour la puissance de calcul physique ; mais cet objectif en est encore à ses débuts, ce qui bénéficie réellement d'effets de réseau aujourd'hui, c'est la couche d'agrégation.

Voici la boucle de rétroaction positive :

Intégrer plus de clouds → Plus d'offre agrégée
Plus d'offre → Un marché plus profond et des données de prix en temps réel
De meilleures données → Un routage plus intelligent à court terme, des modèles de tarification à long terme
Une meilleure liquidité et des prix → Plus de développeurs → Plus de clouds veulent s'intégrer

Aucune autre entreprise ne tente cela. Hyperbolic est la seule entreprise qui s'étend simultanément sur la couche de location de GPU, la couche de déploiement et la couche d'API de modèle.

VII. Le miroir de Venice

Venice est la manifestation la plus claire de l'économie de l'inférence au niveau applicatif, et un utile contraste avec la position d'Hyperbolic. C'est une application d'inférence axée sur la confidentialité : une API compatible OpenAI, plus des abonnements grand public (Free / Pro / Pro+ / Max), qui achemine les requêtes vers environ 75 modèles, dont environ les deux tiers sont open source ou auto-hébergés (Llama, Mistral, Qwen, DeepSeek), le reste étant une transmission anonyme vers des modèles de pointe propriétaires. Le point clé est que Venice elle-même ne possède pas de capacité de calcul significative. Elle loue à des partenaires GPU non divulgués et à des fournisseurs de calcul confidentiel (NEAR AI Cloud, Phala), et paie les laboratoires de pointe pour la transmission, donc son véritable coût des revenus est la puissance d'inférence, et non l'hébergement SaaS.

Ce que Venice vend vraiment, c'est la confidentialité. Ici, « confidentialisation » ne signifie pas transformer la puissance de calcul publique en propriété privée, mais envelopper une inférence marchandisée dans une garantie : aucune conservation des données, pas d'utilisation pour l'entraînement, anonymisation des requêtes, certaines charges s'exécutant même dans des TEE, de sorte que l'opérateur lui-même ne peut pas voir le texte en clair. La puissance de calcul sous-jacente est une commodité, la marge supplémentaire vient de cet emballage de confidentialité. Et cette garantie est stratifiée, pas uniforme : pour les modèles open source fonctionnant sur des GPU sous son contrôle ou dans des TEE, on peut atteindre un calcul confidentiel quasi bout en bout ; mais pour la transmission anonyme vers des modèles propriétaires comme Claude ou GPT, la confidentialité se limite à la suppression de l'identité, le laboratoire de pointe traite toujours votre prompt original. La confidentialité la plus forte ne couvre donc que la partie open source, la partie des modèles de pointe est « anonyme » et non « vraiment confidentielle ». La marge brute de Venice = Prix de l'abonnement − Coût de l'inférence payé en aval, et la partie qu'elle peut facturer en plus par rapport au prix nu de l'API repose presque entièrement sur cette prime de confidentialité, ce qui explique également sa faible marge et sa dépendance aux tarifs de transmission des laboratoires de pointe.

Le design du token conditionne cette demande d'inférence. Venice fonctionne sur deux jetons : VVV (staking et accès à la plateforme) et DIEM, ce dernier étant un crédit d'inférence, chaque DIEM valant environ 1 dollar de puissance de calcul par jour. Les abonnements payants déclenchent un rachat et une destruction programmés de VVV (Pro / Pro+ / Max environ 2 / 5 / 10 dollars respectivement), tandis que l'émission suit un calendrier fixe décroissant : 6M → 5M → 4M VVV par mois, passant à 3M le 1er juillet. Les rachats sont réels, mais discrétionnaires et encore modestes : environ 103 000 dollars détruits en avril et mai chacun, juin atteignant lentement environ 110 000 dollars, bien en deçà de la barre des 200 000 dollars par mois.

Les fondamentaux sont plus sains que les gros titres. Le chiffre largement répandu de « 70 millions de dollars de chiffre d'affaires récurrent annualisé (ARR) » est presque certainement le résultat d'une confusion entre renouvellements d'abonnement et acquisitions nettes de nouveaux clients ; un intervalle défendable et observable se rapproche davantage de 6 à 15 millions de dollars d'ARR. En dessous, la traction est réelle : environ 136 000 adresses détentrices de jetons, environ 9,9 millions de visites mensuelles sur le site web (environ 330 000 par jour), les nouveaux abonnements Pro tournant autour de 1400 par jour. C'est une vraie entreprise, mais une entreprise à faible marge, dont l'économie est contrainte par la puissance de calcul qu'elle achète.

C'est précisément pourquoi Hyperbolic se situe au-dessus. Si Venice est la station-service, Hyperbolic est la raffinerie. Venice achète de la puissance de calcul dans la même offre limitée dont tout le monde dépend ; Hyperbolic agrège et normalise cette offre fragmentée, puis la vend à Venice et à tous les acteurs similaires. À mesure que la demande d'inférence croît, la valeur s'accumule non seulement vers les applications qui consomment la puissance de calcul, mais encore plus vers la couche qui agrège et achemine cette puissance de calcul, et capture le coût des revenus que ces applications paient.

VIII. Pourquoi c'est important maintenant

Nvidia a réorganisé ses finances autour des « jetons de service ». L'IPO de Cerebras prouve que le marché a compris que l'inférence est le goulot d'étranglement. Anthropic court après la capacité, prouvant que c'est un vrai problème. L'IA agentic et l'IA physique vont amplifier la demande de plusieurs ordres de grandeur, sur les deux fronts du cloud et de la périphérie.

Et cela referme aussi la boucle du « problème des 6000 milliards de dollars » de l'autre côté. La logique baissière de Cahn, à savoir la surconstruction, puis la surproduction, sera finalement probablement validée. Mais la surproduction est précisément le scénario optimal pour l'agrégateur sans actifs : lorsque les prix des GPU baissent, que l'offre fragmentée se disperse sur des dizaines de clouds, le joueur qui ne possède aucun matériel et achemine chaque charge de travail vers la carte disponible la moins chère gagne l'écart de prix, tandis que les opérateurs qui détiennent des GPU en perpétuelle dépréciation subissent les pertes. Hyperbolic parie sur la surproduction, pas contre elle.

L'entreprise qui finira par l'emporter ne sera pas celle qui possède le plus de GPU, mais celle qui peut vous dire quels GPU sont disponibles où et à quel prix, et acheminer chaque charge de travail là où elle peut fonctionner au plus bas coût.

Hyperbolic est en train de construire une telle entreprise. Ne possédant pas de GPU elle-même, purement logicielle, s'étendant sur trois couches, mais construisant la couche d'agrégation ultime de la puissance de calcul d'inférence.

Questions liées

QSelon l'article, pourquoi l'inférence est-elle devenue la ressource rare dans l'écosystème de l'IA, plutôt que l'entraînement ?

AL'article explique que l'inférence est devenue la ressource rare car c'est un coût récurrent et opérationnel qui se produit à chaque fois qu'un modèle est utilisé, contrairement à l'entraînement qui est un coût d'investissement ponctuel. L'arrivée des agents IA (AI agentic) et de l'IA physique amplifie considérablement la demande en inférence, car les systèmes exécutent des tâches en boucle, ce qui en fait le véritable goulet d'étranglement.

QComment l'IPO de Cerebras et la nouvelle structure financière de Nvidia illustrent-elles le changement de priorité vers l'inférence ?

AL'IPO de Cerebras a été sursouscrite car son architecture est optimisée pour l'inférence, ce qui a capté l'attention du marché sur ce segment. Nvidia a restructuré sa communication financière autour de deux plateformes (Centre de données et Informatique en périphérie), mettant en avant le segment 'Edge Computing' pour l'inférence des agents et de l'IA physique. Cela confirme que l'inférence, en tant que source de revenus récurrents via les 'tokens de service', est désormais une priorité stratégique.

QQuel est le rôle et l'avantage stratégique de Hyperbolic dans la pile technologique de l'inférence ?

AHyperbolic agit comme un agrégateur et un marché multi-cloud pour les GPU. Son avantage stratégique est de ne posséder aucun GPU, mais d'agréger et de standardiser l'offre fragmentée de dizaines de fournisseurs de cloud. Cette position lui permet d'avoir une vue en temps réel sur les prix et la disponibilité, d'offrir aux développeurs la meilleure route vers le GPU le moins cher, et de potentiellement capturer de la valeur en devenant le principal marché de l'inférence, surtout en période de surplus d'offre.

QEn quoi le cas d'Anthropic et de Claude illustre-t-il la 'pression' sur l'inférence ?

AAnthropic a connu une demande d'utilisation tellement forte pour Claude qu'elle a dépassé ses capacités pré-configurées, entraînant des plaintes d'utilisateurs sur des réponses limitées ou ralenties. La solution a été d'acquérir un énorme centre de données (Colossus 1) dédié spécifiquement à l'inférence. Ils ont également dû modifier leur modèle tarifaire, en créant un pool de crédits séparé pour l'utilisation agentique, reconnaissant ainsi que cette consommation récurrente d'inférence nécessite une facturation adaptée à son coût opérationnel.

QComment Venice et Hyperbolic se comparent-ils dans la chaîne de valeur de l'inférence, selon l'article ?

AVenice est une application en aval qui achète de la puissance d'inférence pour proposer un service API privé aux consommateurs. Sa valeur ajoutée réside dans le packaging de la confidentialité. Hyperbolic est en amont : c'est un agrégateur de l'offre de calcul brute que des entreprises comme Venice doivent acheter. L'article utilise la métaphore suivante : si Venice est une station-service qui vend de l'essence (l'inférence avec confidentialité), Hyperbolic est la raffinerie qui agrège et standardise l'offre de pétrole brut (les GPU) pour l'ensemble du marché.

Lectures associées

Le Bitcoin Saigne, Et Voici Ce Qui Pousse À L'effondrement Du Prix Du BTC

Le prix du Bitcoin subit une baisse continue, tombant sous les 60 000 $ pour la première fois depuis octobre 2024, alors que le marché baissier s'intensifie. Plusieurs facteurs clés alimentent ce déclin. Les FNB spot Bitcoin connaissent des sorties de fonds massives et prolongées, avec 13 jours consécutifs de retraits pour un total de plus de 4,37 milliards de dollars entre mi-mai et début juin 2026. Le FNB IBIT de BlackRock est le principal contributeur, représentant environ 75% de ces sorties. Cette prudence extrême des investisseurs, couplée à des tensions géopolitiques persistantes, crée une forte incertitude sur la direction future du BTC. Bien qu'un léger rebond au-dessus de 62 000 $ ait été observé, les conditions restent baissières et des analystes alertent sur un risque de chute vers les 50 000 $ si la pression ne s'atténue pas.

bitcoinistIl y a 2 h

Le Bitcoin Saigne, Et Voici Ce Qui Pousse À L'effondrement Du Prix Du BTC

bitcoinistIl y a 2 h

Dogecoin approche-t-il d'un plancher ? Cette métrique clé apporte de nouveaux indices

La pression baissière intense continue d'affecter le prix du Dogecoin (DOGE), suscitant des interrogations sur un éventuel plancher. Un signal clé émerge de l'indicateur on-chain Cumulative Value Days Destroyed (CVDD), qui suggère que DOGE est en phase de formation d'un creux de prix. L'expert Joao Wedson souligne que lorsque la métrique approche ou passe sous la valeur 1, cela a historiquement précédé des creux majeurs. Le signal de bottoming serait déclenché si DOGE tombait sous le niveau des 0,08 $, ce qui constituerait un point d'entrée idéal pour une accumulation à long terme. L'analyse des tendances passées indique que Dogecoin pourrait connaître une volatilité en juin, similaire à son comportement en 2020, où il avait testé plusieurs fois un support macro à long terme avant de rebondir. Actuellement, le prix teste la limite inférieure d'un canal parallèle autour de 0,0883 $. Tant que ce support tient, une reprise vers 0,1019 $ et 0,1156 $ est envisageable. Une rupture pourrait en revanche entraîner une chute vers la zone de demande majeure suivante, près de 0,067 $.

bitcoinistIl y a 2 h

Dogecoin approche-t-il d'un plancher ? Cette métrique clé apporte de nouveaux indices

bitcoinistIl y a 2 h

Jensen Huang "sauve" de manière spectaculaire la bourse sud-coréenne

Le PDG de Nvidia, Jensen Huang, a joué un rôle inattendu en « sauvant » le marché boursier sud-coréen après une chute brutale du KOSPI. Lors d'une visite à Séoul début juin, sa rencontre avec les dirigeants de SK Group, notamment SK Hynix, a abouti à l'annonce d'un partenariat technologique pluriannuel. Un point clé est la confirmation que le nouveau CPU Vera de Nvidia utilisera la mémoire DRAM de SK Hynix. Le partenariat vise à co-développer la mémoire de nouvelle génération pour l'infrastructure IA de Nvidia, couvrant ses supercalculateurs, CPU, et plateformes robotiques. Inversement, SK Hynix intégrera les technologies IA de Nvidia, comme CUDA-X et Omniverse, dans sa propre conception et fabrication de puces, notamment pour créer des jumeaux numériques d'usines. Cette collaboration s'appuie sur un projet d'« usine d'IA » lancé fin 2025 par SK Group, utilisant plus de 50 000 GPU Nvidia. Cependant, Nvidia diversifie ses sources pour la mémoire HBM4 critique, en qualifiant aussi Samsung et Micron comme fournisseurs pour son système Vera Rubin. Huang a averti que la pénurie de puces mémoire, due à une demande explosive pour construire des « usines d'IA » mondiales, persisterait pendant plusieurs années. Son voyage en Corée du Sud, incluant aussi des réunions avec Hyundai, LG et Samsung, signale un renforcement stratégique des liens de Nvidia avec l'écosystème technologique coréen.

链捕手Il y a 3 h

Jensen Huang "sauve" de manière spectaculaire la bourse sud-coréenne

链捕手Il y a 3 h

La Chine a interdit le Bitcoin — puis l'une de ses plus hautes cours vient de statuer qu'il s'agit d'un bien protégé

Le parquet suprême chinois a publié un arrêt modèle le 7 juin dans lequel des procureurs de Qingdao ont obtenu la condamnation à près de 11 ans de prison d'un voleur pour le vol de 107 Bitcoin. L'argumentation juridique retenue qualifie le Bitcoin de propriété légalement protégée par le droit pénal chinois, car il possède une valeur économique démontrable et peut être contrôlé exclusivement par son propriétaire. Cette décision crée une contradiction frappante avec l'interdiction générale des cryptomonnaies en vigueur depuis 2021 en Chine, qui prohibe toutes les transactions. Pourtant, les tribunaux chinois, dont désormais la plus haute autorité de poursuites, affirment de façon constante le statut de propriété protégée du Bitcoin dans les affaires pénales. En publiant cette affaire, le parquet suprême donne une directive nationale : le vol de Bitcoin doit être poursuivi comme un vol de propriété, valorisé au prix du marché, et ce malgré l'interdiction officielle de le détenir ou de le transférer. Ce développement place le système juridique chinois dans une position inédite, interdisant l'usage d'un actif tout en protégeant sa propriété au plus haut niveau pénal.

bitcoinistIl y a 3 h

La Chine a interdit le Bitcoin — puis l'une de ses plus hautes cours vient de statuer qu'il s'agit d'un bien protégé

bitcoinistIl y a 3 h

Le Krach du Bitcoin Signale une Liquidité qui S'Assèche Alors que le Rapport sur l'Emploi de Mai Revient avec des Chiffres Stupéfiants

Le crash du Bitcoin sous les 60 000 dollars ce week-end est lié à la publication du rapport sur l'emploi de mai 2026 aux États-Unis, bien plus robuste que prévu. Avec 172 000 emplois créés et un taux de chômage stable à 4,3%, le marché du travail résilient complique les anticipations de baisse des taux d'intérêt. Les marchés révisent désormais à la hausse la probabilité d'un resserrement monétaire de la Fed d'ici la fin de l'année. Cette dynamique assèche la liquidité dont bénéficiaient les actifs risqués comme le Bitcoin. L'indice S&P 500 a perdu près de 2 000 milliards de dollars de capitalisation après le rapport, tandis que le Bitcoin a chuté de plus de 50% par rapport à son sommet de 2025. Les ETF spot Bitcoin subissent d'importants retraits, réduisant une source clé de demande. Malgré cela, un espoir demeure pour les haussiers : le Bitcoin a traversé sa moyenne mobile sur 200 semaines (environ 61 000 $), un niveau qui a historiquement marqué les creux des marchés baissiers lors des cycles précédents. Certains analystes estiment que ce test technique pourrait signaler les phases finales du ralentissement et une opportunité d'achat.

bitcoinistIl y a 3 h

Le Krach du Bitcoin Signale une Liquidité qui S'Assèche Alors que le Rapport sur l'Emploi de Mai Revient avec des Chiffres Stupéfiants

bitcoinistIl y a 3 h

Trading

Spot

Futures

Lorsque l'inférence devient une ressource rare, qui en capture la valeur ?

Résumé

I. Suivre le GPU : du problème à 2000 milliards de dollars au problème à 6000 milliards de dollars

II. L'IPO de Cerebras et la pression sur l'inférence

III. Nvidia redessine la carte : l'inférence passe en première ligne

IV. La compression est déjà là

V. Cette pile : six couches, un goulot d'étranglement

VI. Hyperbolic : la seule entreprise qui s'étend sur trois couches

VII. Le miroir de Venice

VIII. Pourquoi c'est important maintenant

Questions liées

Lectures associées

Le Bitcoin Saigne, Et Voici Ce Qui Pousse À L'effondrement Du Prix Du BTC

Dogecoin approche-t-il d'un plancher ? Cette métrique clé apporte de nouveaux indices

Jensen Huang "sauve" de manière spectaculaire la bourse sud-coréenne

La Chine a interdit le Bitcoin — puis l'une de ses plus hautes cours vient de statuer qu'il s'agit d'un bien protégé

Le Krach du Bitcoin Signale une Liquidité qui S'Assèche Alors que le Rapport sur l'Emploi de Mai Revient avec des Chiffres Stupéfiants

Trading

Catégories populaires

Tags tendances