Rédaction : Xu Chao
La contradiction entre l'offre et la demande d'infrastructure d'intelligence artificielle s'intensifie entre les plus grandes entreprises technologiques mondiales. Selon des sources bien informées, Google a informé Meta vers mars dernier qu'il ne pouvait pas satisfaire la totalité de ses besoins en puissance de calcul pour Gemini et a imposé une limite d'utilisation à ce géant des médias sociaux — même le plus grand fournisseur mondial de services d'IA a du mal à faire face à la demande croissante de puissance de calcul.
Selon le Financial Times, ces restrictions n'ont toujours pas été levées et ont perturbé et retardé plusieurs projets internes d'IA de Meta. Sous cette pression, Meta a demandé à ses employés d'améliorer l'efficacité d'utilisation de la puissance de calcul de l'IA, en mettant en œuvre une comptabilité stricte des tokens d'IA en interne. Google et Meta ont tous deux refusé de commenter.
Cette situation oblige Google à accélérer son expansion. Plus tôt ce mois-ci, Google a signé un contrat de location de puissance de calcul d'une valeur de 920 millions de dollars par mois avec SpaceX, la société d'Elon Musk. Sundar Pichai, PDG de Google, a admis lors de la conférence sur les résultats du premier trimestre : "Nous avons récemment rencontré des contraintes en matière de puissance de calcul, et les revenus du cloud auraient été plus élevés si nous avions pu répondre à la demande."
Meta n'est pas un cas isolé. Plusieurs sources indiquent que d'autres clients entreprise de Google subissent également des restrictions à des degrés divers, mais Meta est le plus touché en raison de l'ampleur exceptionnelle de ses besoins. Cet incident reflète l'explosion de la charge de travail d'inférence de l'IA, devenue l'un des plus grands défis pour l'ensemble du secteur.
La pression sur le goulot d'étranglement de la puissance de calcul persiste, les gros clients en première ligne
Malgré les centaines de milliards de dollars investis par les grandes entreprises technologiques dans les puces, les centres de données et l'approvisionnement en électricité, l'offre de puissance de calcul pour l'IA peine à suivre le rythme de la demande.
Les revenus du cloud de Google ont dépassé pour la première fois les 20 milliards de dollars au premier trimestre, tandis que le carnet de commandes du cloud signées mais non encore exécutées a presque doublé par rapport au trimestre précédent, dépassant les 460 milliards de dollars. Pichai a clairement indiqué que les contraintes de puissance de calcul persisteraient à court terme.
Dans ce contexte, l'impact sur Meta est particulièrement marqué. Selon des sources, ce sont précisément les demandes intenses de clients entreprise comme Meta qui ont directement poussé Google à accélérer sa recherche de sources de puissance de calcul externes. Alors que les entreprises déploient massivement des chatbots, des assistants de programmation et des agents d'IA, la charge de travail d'inférence — c'est-à-dire la puissance de calcul consommée par l'exécution des tâches en situation réelle après l'entraînement du modèle — devient le principal goulot d'étranglement du secteur.
Les projets internes de Meta entravés, accélération vers les modèles maison
Meta utilise largement Gemini en interne, couvrant la modération de la sécurité des plateformes (y compris l'identification de contenu frauduleux, la suppression d'informations nuisibles), les chatbots d'assistance aux clients et à la publicité, ainsi qu'une partie des flux de travail internes et du développement de code, tout en utilisant également d'autres modèles comme Claude d'Anthropic.
Selon des sources, Meta avait initialement choisi Gemini car ses performances surpassaient celles de son propre modèle open-source Llama. Cependant, face au resserrement des restrictions de puissance de calcul, Meta accélère sa migration vers ses modèles maison. Plusieurs sources indiquent que Meta a récemment commencé à prioriser la promotion de son nouveau modèle Muse Spark, dont les performances seraient désormais comparables à celles de Gemini, ce qui permettrait de réduire la dépendance aux modèles externes.
Le PDG de Meta, Mark Zuckerberg, continue d'augmenter ses investissements dans les talents et l'infrastructure d'IA, s'efforçant de construire ce qu'il appelle une "superintelligence personnelle". Contrairement à Google, Meta n'a pas d'activité cloud et accélère la construction de son propre système de centres de données, s'engageant à investir cumulativement 600 milliards de dollars aux États-Unis d'ici 2028.
Google s'étend via SpaceX, le secteur cherche des solutions
Face à la pression sur la puissance de calcul, Google a signé ce mois-ci un contrat de location de puissance de calcul de 920 millions de dollars par mois avec SpaceX pour combler le déficit d'infrastructure. Le laboratoire d'IA Anthropic a conclu un accord similaire avec SpaceX le mois dernier.
La décision de Google de limiter Meta offre une fenêtre rare sur les pressions réelles auxquelles sont confrontés les principaux fournisseurs mondiaux de services d'IA dans l'allocation des ressources de calcul. Actuellement, le goulot d'étranglement infrastructurel de l'industrie de l'IA s'étend du côté de l'entraînement à celui de l'inférence, et la résolution de la contradiction entre l'offre et la demande dépend encore de la concrétisation d'un nouveau cycle d'investissements massifs.





