Pénurie de puissance de calcul : Google impose discrètement une limite d'utilisation de Gemini à Meta

marsbitPublié le 2026-06-29Dernière mise à jour le 2026-06-29

Résumé

Une tension sur les capacités de calcul entre Google et Meta met en lumière la pression croissante sur les infrastructures d'IA. D'après des sources informées, Google a informé Meta en mars qu'il ne pourrait pas satisfaire toute sa demande de puissance de calcul pour utiliser le modèle Gemini, imposant des limites d'utilisation qui perturbent et retardent plusieurs projets internes de Meta. Cette situation contraint Meta à optimiser son utilisation des ressources et à accélérer le virage vers ses propres modèles, comme Muse Spark, pour réduire sa dépendance. D'autres clients de Google seraient également affectés à divers degrés, Meta étant l'un des plus touchés en raison de l'ampleur de ses besoins. Pour répondre à cette demande explosive, notamment pour les tâches d'inférence (exécution des modèles), Google accélère son expansion. La firme a signé un accord de location de capacité de calcul de 920 millions de dollars par mois avec SpaceX. Le PDG de Google, Sundar Pichai, a reconnu que les contraintes actuelles limitent la croissance de son activité cloud. Cet épisode illustre un défi majeur pour l'ensemble du secteur : malgré des investissements massifs, l'offre de puissance de calcul peine à suivre la demande, un goulot d'étranglement qui devrait persister à court terme.

Rédaction : Xu Chao

La contradiction entre l'offre et la demande d'infrastructure d'intelligence artificielle s'intensifie entre les plus grandes entreprises technologiques mondiales. Selon des sources bien informées, Google a informé Meta vers mars dernier qu'il ne pouvait pas satisfaire la totalité de ses besoins en puissance de calcul pour Gemini et a imposé une limite d'utilisation à ce géant des médias sociaux — même le plus grand fournisseur mondial de services d'IA a du mal à faire face à la demande croissante de puissance de calcul.

Selon le Financial Times, ces restrictions n'ont toujours pas été levées et ont perturbé et retardé plusieurs projets internes d'IA de Meta. Sous cette pression, Meta a demandé à ses employés d'améliorer l'efficacité d'utilisation de la puissance de calcul de l'IA, en mettant en œuvre une comptabilité stricte des tokens d'IA en interne. Google et Meta ont tous deux refusé de commenter.

Cette situation oblige Google à accélérer son expansion. Plus tôt ce mois-ci, Google a signé un contrat de location de puissance de calcul d'une valeur de 920 millions de dollars par mois avec SpaceX, la société d'Elon Musk. Sundar Pichai, PDG de Google, a admis lors de la conférence sur les résultats du premier trimestre : "Nous avons récemment rencontré des contraintes en matière de puissance de calcul, et les revenus du cloud auraient été plus élevés si nous avions pu répondre à la demande."

Meta n'est pas un cas isolé. Plusieurs sources indiquent que d'autres clients entreprise de Google subissent également des restrictions à des degrés divers, mais Meta est le plus touché en raison de l'ampleur exceptionnelle de ses besoins. Cet incident reflète l'explosion de la charge de travail d'inférence de l'IA, devenue l'un des plus grands défis pour l'ensemble du secteur.

La pression sur le goulot d'étranglement de la puissance de calcul persiste, les gros clients en première ligne

Malgré les centaines de milliards de dollars investis par les grandes entreprises technologiques dans les puces, les centres de données et l'approvisionnement en électricité, l'offre de puissance de calcul pour l'IA peine à suivre le rythme de la demande.

Les revenus du cloud de Google ont dépassé pour la première fois les 20 milliards de dollars au premier trimestre, tandis que le carnet de commandes du cloud signées mais non encore exécutées a presque doublé par rapport au trimestre précédent, dépassant les 460 milliards de dollars. Pichai a clairement indiqué que les contraintes de puissance de calcul persisteraient à court terme.

Dans ce contexte, l'impact sur Meta est particulièrement marqué. Selon des sources, ce sont précisément les demandes intenses de clients entreprise comme Meta qui ont directement poussé Google à accélérer sa recherche de sources de puissance de calcul externes. Alors que les entreprises déploient massivement des chatbots, des assistants de programmation et des agents d'IA, la charge de travail d'inférence — c'est-à-dire la puissance de calcul consommée par l'exécution des tâches en situation réelle après l'entraînement du modèle — devient le principal goulot d'étranglement du secteur.

Les projets internes de Meta entravés, accélération vers les modèles maison

Meta utilise largement Gemini en interne, couvrant la modération de la sécurité des plateformes (y compris l'identification de contenu frauduleux, la suppression d'informations nuisibles), les chatbots d'assistance aux clients et à la publicité, ainsi qu'une partie des flux de travail internes et du développement de code, tout en utilisant également d'autres modèles comme Claude d'Anthropic.

Selon des sources, Meta avait initialement choisi Gemini car ses performances surpassaient celles de son propre modèle open-source Llama. Cependant, face au resserrement des restrictions de puissance de calcul, Meta accélère sa migration vers ses modèles maison. Plusieurs sources indiquent que Meta a récemment commencé à prioriser la promotion de son nouveau modèle Muse Spark, dont les performances seraient désormais comparables à celles de Gemini, ce qui permettrait de réduire la dépendance aux modèles externes.

Le PDG de Meta, Mark Zuckerberg, continue d'augmenter ses investissements dans les talents et l'infrastructure d'IA, s'efforçant de construire ce qu'il appelle une "superintelligence personnelle". Contrairement à Google, Meta n'a pas d'activité cloud et accélère la construction de son propre système de centres de données, s'engageant à investir cumulativement 600 milliards de dollars aux États-Unis d'ici 2028.

Google s'étend via SpaceX, le secteur cherche des solutions

Face à la pression sur la puissance de calcul, Google a signé ce mois-ci un contrat de location de puissance de calcul de 920 millions de dollars par mois avec SpaceX pour combler le déficit d'infrastructure. Le laboratoire d'IA Anthropic a conclu un accord similaire avec SpaceX le mois dernier.

La décision de Google de limiter Meta offre une fenêtre rare sur les pressions réelles auxquelles sont confrontés les principaux fournisseurs mondiaux de services d'IA dans l'allocation des ressources de calcul. Actuellement, le goulot d'étranglement infrastructurel de l'industrie de l'IA s'étend du côté de l'entraînement à celui de l'inférence, et la résolution de la contradiction entre l'offre et la demande dépend encore de la concrétisation d'un nouveau cycle d'investissements massifs.

Questions liées

QPourquoi Google a-t-il imposé une limite d'utilisation de Gemini à Meta ?

AGoogle a imposé une limite d'utilisation de son modèle d'IA Gemini à Meta parce qu'il est confronté à une pénurie de capacité de calcul (puissance informatique) face à la demande explosive, et n'a pas pu satisfaire l'ensemble des besoins de Meta.

QQuelles ont été les conséquences de cette limitation pour Meta ?

ALa limitation imposée par Google a entraîné des perturbations et des retards dans plusieurs projets internes d'IA de Meta. La société a dû demander à ses employés d'améliorer l'efficacité de l'utilisation de la puissance de calcul et de compter méticuleusement les 'tokens' d'IA.

QComment Google cherche-t-il à résoudre ses problèmes de capacité de calcul ?

APour remédier à son manque de capacité de calcul, Google a accéléré son expansion et a notamment signé un contrat de location de puissance de calcul de 920 millions de dollars par mois avec SpaceX, la société d'Elon Musk.

QComment Meta réagit-il à cette dépendance envers Google pour l'IA ?

AFace à cette dépendance et aux limitations, Meta accélère la migration vers ses propres modèles d'IA, comme le modèle Muse Spark récemment lancé, afin de réduire sa dépendance envers des modèles externes comme Gemini.

QQuel est le principal défi de l'industrie de l'IA mis en lumière par cet incident ?

ACet incident révèle que la charge de travail d'inférence d'IA (l'exécution des modèles après leur entraînement) connaît une croissance explosive et est devenue l'un des plus grands goulots d'étranglement pour l'ensemble du secteur, la demande en capacité de calcul dépassant l'offre malgré des investissements massifs.

Lectures associées

IBIT a connu une sortie de 1,3 milliard de dollars en une semaine, le plus grand ETF sur Bitcoin devient un mur de vente que les haussiers doivent franchir

L'ETF bitcoin de BlackRock, iShares Bitcoin Trust (IBIT), a enregistré des sorties nettes de 1,3 milliard de dollars sur la semaine du 22 au 26 juin, représentant environ 73% des sorties totales des ETF spot américains sur Bitcoin. Cette concentration des rachats sur le plus grand ETF du marché transforme ce qui était un canal majeur d'entrée de capitaux institutionnels en une source potentielle de pression vendeuse structurelle. Alors que le Bitcoin lutte pour maintenir le seuil des 60 000 dollars, ces flux inversés soumettent le marché à un test critique. La narration initiale d'une "demande institutionnelle" via les ETF se retourne : le même véhicule qui facilitait l'accès peut désormais faciliter la sortie des investisseurs sensibles au prix. La taille de l'IBIT rend ses mouvements de trésorerie marginaux particulièrement significatifs pour la structure du marché. L'interprétation de cette pression dépendra des prochaines sessions. Si les sorties de l'IBIT ralentissent et que le Bitcoin se stabilise au-dessus de 59 000 dollars, cette semaine pourra être vue comme un épisode d'assainissement. En revanche, si les rachats importants se poursuivent et empêchent une reprise ferme, la thèse du "mur de vente" lié aux ETF gagnera en crédibilité, obligeant les acheteurs hors ETF à supporter seuls le poids des sorties. Les prochains jours seront déterminants pour savoir si cette pression est passagère ou le début d'une tendance plus durable.

marsbitIl y a 3 mins

IBIT a connu une sortie de 1,3 milliard de dollars en une semaine, le plus grand ETF sur Bitcoin devient un mur de vente que les haussiers doivent franchir

marsbitIl y a 3 mins

Le « roi de l'appel d'offres » Hayes frappe à nouveau, cette fois-ci il a Deribit dans le viseur

BitMEX cofondateur Arthur Hayes a acheté environ 6,16 millions de jetons SYN, d'une valeur de 2,2 millions de dollars, via une plateforme OTC. Il a ensuite déclaré sur X que SYN représentait l'une des opportunités d'investissement les plus asymétriques qu'il ait vues depuis HYPE, et a annoncé que le DEX d'options Hypercall était désormais prêt à défier la plateforme dominante Deribit. Le prix de SYN a augmenté de plus de 40% en 24 heures, poursuivant une hausse explosive débutée en juin 2026. Synapse Protocol, initialement un réseau de messagerie inter-chaînes et de liquidités lancé en 2021, a développé Hypercall, un protocole de négociation d'options on-chain. Déployé sur HyperEVM de Hyperliquid, Hypercall vise à être une bourse d'options pour tout type d'actif, mettant en avant l'absence de liquidation, un risque limité à la prime et des transactions 24h/24. Deribit, fondé en 2016, domine le marché des options crypto avec environ 85% de part de marché. Ses forces résident dans sa liquidité profonde et ses outils professionnels, mais il présente les limites inhérentes au modèle centralisé : risques de custode, KYC et complexité pour les petits utilisateurs. Hayes mise sur le potentiel de décentralisation et de transparence d'Hypercall pour concurrencer Deribit, notamment sur les actifs émergents. Cependant, Deribit bénéficie d'un effet de réseau solide, et Hypercall, encore en phase Alpha, devra développer sa liquidité. Les antécédents récents de Hayes en matière de recommandations (comme avec HYPE et CARDS) ont été mitigés, suscitant des critiques sur l'impact de ses prises de position publiques sur le marché.

Foresight NewsIl y a 15 mins

Le « roi de l'appel d'offres » Hayes frappe à nouveau, cette fois-ci il a Deribit dans le viseur

Foresight NewsIl y a 15 mins

Un an après l'effondrement des sociétés de trésorerie cryptographiques, les imitateurs reviennent en force

Il y a un an, la bulle des sociétés de trésorerie d’actifs numériques (DAT) a éclaté, entraînant des pertes allant jusqu’à 99 % pour les premiers investisseurs. Aujourd’hui, le même schéma réapparaît sous une nouvelle forme : Triller Group annonce devenir la première « société de trésorerie » détenant des actions SpaceX, faisant grimper sa valorisation de 15 à 63 millions de dollars. Une autre entreprise, LGHL, rebaptise sa marque pour acheter désormais le token HYPE. Ce phénomène rappelle la vague initiale menée par MicroStrategy (MSTR), qui avait créé le concept de « rendement bitcoin » et dont les actions se négociaient à 200 % de la valeur de ses bitcoins. De nombreuses sociétés ont suivi, comme TwentyOne, Metaplanet ou Nakamoto, mais leurs cours se sont effondrés – jusqu’à -95 % dans certains cas, réduisant un investissement de 100 000 $ à seulement 650 $. La raison de cet échec est simple : il n’existe aucune justification structurelle à acheter ces titres avec une prime alors que des ETF bitcoin à faible coût (0,09 %) ou la détention directe sont possibles. La bulle a été alimentée par le FOMO, la mentalité de jeu et le sentiment que les marchés traditionnels sont truqués, poussant certains à spéculer de manière agressive. Les initiés, quant à eux, continuent de profiter de cette dynamique en alimentant l’offre. Comme le montrait déjà la tulipomanie au 17e siècle, les cycles de cupidité et de peur se répètent. Malgré le krach récent, la tentation de « pump and dump » reste forte, et les petits investisseurs en paient le prix. L’histoire se répète, car pour certains, la manipulation n’est pas un bug du système : c’est le produit lui-même.

marsbitIl y a 25 mins

Un an après l'effondrement des sociétés de trésorerie cryptographiques, les imitateurs reviennent en force

marsbitIl y a 25 mins

Cet après-midi, la Corée du Sud va miser l'avenir de sa nation pour la prochaine décennie

Le bureau du président sud-coréen a annoncé que Samsung et SK Group révéleront lundi des plans d'investissement majeurs, présidés par le président Lee Jae-myung. Selon les médias, un plan d'investissement total d'environ 1,3 trillion de dollars (2000 billions de wons) sur dix ans sera dévoilé. L'objectif est de renforcer massivement l'industrie nationale des semi-conducteurs, avec la construction de plusieurs usines de fabrication et d'emballage de puces par Samsung et SK Hynix. Cette initiative, pilotée par le gouvernement, représente un pari stratégique sur l'ère de l'IA. La Corée du Sud, puissance centrale dans la mémoire de stockage, mise sur la demande durable en mémoire haute performance (comme le HBM) générée par l'expansion de l'intelligence artificielle. Le pays considère que cette demande n'est pas un cycle passager mais une vague industrielle de longue durée. L'ampleur de l'investissement, proche de 70% du PIB annuel du pays, souligne l'engagement. Cependant, cela soulève la question de la cyclicité historique du secteur des semi-conducteurs. L'IA pourrait prolonger le cycle ou en créer un "super cycle", mais sa capacité à éliminer complètement la cyclicité reste incertaine. La réponse sud-coréenne est d'engager ses géants industriels sur une décennie pour tenter de sécuriser une position dominante dans les infrastructures critiques de l'IA.

Odaily星球日报Il y a 49 mins

Cet après-midi, la Corée du Sud va miser l'avenir de sa nation pour la prochaine décennie

Odaily星球日报Il y a 49 mins

Trading

Spot
活动图片